日期:2014-05-17  浏览次数:20893 次

定制Apache的防盗链模块 Mod_perl<0> Mod_perl多进程预创建目标
前言:某些目标初始化开销较大,例如从磁盘读取一个大文件,并关联到目标,可能耗时较久.在CGI环境下,每个请求都要new()一次目标,就会性能低下.而mod_perl的多进程预创建目标模式,可以很好的解决这个问题.

(一)安装mod_perl
这里使用主流的apache2.0和modperl2版本.

默认安装的Apache2都支持DSO方式加载第三方模块,在编译modperl2时只须指定对应的apxs即可.

另外Perl对线程的支持一直有问题,因此Apache2在编译时最好指定以prefork方式运行(--with-mpm=prefork).

从http://perl.apache.org/download/下载modperl,解开后进入其目录,如下安装:

perl Makefile.PL MP_APXS=/path/apache2/bin/apxs
make
make test
make install

这里假设apache2.0已安装在/path/apache2下.检查/path/apache2/conf/httpd.conf,确认modperl安装后添加了该行:

LoadModule perl_module modules/mod_perl.so

表示Apache启动时加载mod_perl模块.

(二)安装Apache2::Request
Apache2::Request是包含modperl2下的请求处理方式的类库.它的作用类似于CGI.pm,但用C语言写成,比CGI.pm快很多.

以root用户运行CPAN shell: perl -MCPAN -e shell

然后在CPAN shell里输入: install Apache2::Request 进行安装.安装过程中一般会有提示,须手工指定apache2的apxs文件的路径.如果在make test时不成功,那么force install即可:

cpan>look Apache2::Request
# install Apache2::Request

安装完后修改apache2的httpd.conf,增加一行如下:

LoadModule apreq_module    modules/mod_apreq2.so

表示Apache启动时加载mod_apreq2模块.

另外,设置LD_LIBRARY_PATH环境变量,对Linux系统,最简单的做法是在/etc/ld.so.conf里加进:

/usr/local/lib  #默认make install的libapreq2安装在/usr/local下
/path/apache2/lib  #apache2安装目录

然后执行ldconfig使其生效.

最后restart apache,查看error_log,若有如下提示:

Apache/2.0.59 (Unix) mod_apreq2-20051231/2.6.0 mod_perl/2.0.3 Perl/v5.8.5 configured

则表示modperl2和Apache2::Request已安装成功(当然httpd.conf里的ServerTokens须设置为Full).

(三)开始编程之前
在开始modperl编码之前,需要做一些基本的配置工作.

首先在/path/apache2下创建一个子目录,该目录用于存放自己编写的modperl库文件,并且将该目录添加进modperl运行环境的@INC变量.这个变量包含了modperl需要引用的库路径.

mkdir /path/apache2/run

这里假设创建的子目录名为run.将run添加进modperl的@INC有好几种方法,一般的做法是写进modperl的启动配置文件(通常名为startup.pl).startup.pl还会预加载一些modperl常用类库,这些类库会被多个Apache子进程共享,避免启动后的重复加载.

在run子目录下,创建startup.pl,内容如下:

use strict;

use lib qw(/path/apache2/run);
use Apache2::RequestRec ();
use Apache2::RequestIO ();
use Apache2::Request ();

1;

use lib这一行即将run子目录添加进modperl运行环境的@INC中.
其他三个Apache2::*库是modperl2常用的几个类库.Apache2::*名字空间下有很多类库,除上述外,还有:

Apache2::Connection ();
Apache2::RequestUtil ();
Apache2::ServerUtil ();
Apache2::ServerRec ();
Apache2:og ();

之类...详情可参考它们在cpan上的文档.

不要忘记最后的那个1,它表示返回一个真值给调用者.

修改httpd.conf,增加一行:

PerlPostConfigRequire /path/apache2/run/startup.pl

表示在Apache启动过程中,(尽可能晚的)执行上述modperl配置脚本.

补充一点,在手工运行modperl脚本时,由于@INC不包含这个目录,就会造成问题.可以在运行脚本前,

export PERL5LIB=/path/apache2/run

来解决问题.但每次都敲这个命令也很烦,因此直接将这句写进/etc/profile,就一劳永逸了.

(四)创建一个目标
从CPAN下载安装本人所写的IP::ChinaISP模块,该模块的作用是对指定的中国IP,返回对应的ISP.因为在中国,不同ISP之间的互联互通非常慢,所以利用该模块,可实现一些基于用户访问IP的CDN系统.

模块使用方法很简单:

use IP::ChinaISP;
my $cnisp = IP::ChinaISP->new;
my $isp = $cnisp->ip_isp('12.34.56.78');

$isp变量即存储了12.34.56.78这个IP对应的ISP(如果有的话).

IP::ChinaISP->new表示创建一个对象,这个过程中,会解析IP-ISP的数据文件,并将数据绑定到对象,因此耗时较久.测试了1000次new()过程,平均每次创建对象耗时16.103毫秒.若用该模块提供CGI web服务,则每个用户请求都会创建一个对象,效率无疑低下.

下面描述如何利用modperl来提高效率.

(五)mod_perl的多进程预创建目标
在mod_perl环境下,Apache启动时可以预创建目标,并且该目标在Apache fork子进程时,被所有子进程复制一份.这样在每个子进程里,直接使用已创建好的目标,不用重复创建.

前面已经描述,可以在startup.pl里预加载类库,同样也可以在这个文件里预创建目标.但是,简单在startup.pl里写:

use IP::ChinaISP;
our $cnisp = IP::ChinaISP->new;

不行.由于没有独立的包空间,从外部无法访问这个对象.

因此,有必要把创建目标的陈述放在独立的package里.前面已经定义好/path/apache2/run为modperl运行的库目录,在该目录下创建package即可.如下执行:

cd /p