日期:2014-05-17  浏览次数:20841 次

在Windows环境下安装和配置Nutch 0.9

一、运行环境:

1.?????? 操作系统:Windows XP

2.?????? Java 1.6 ,设置JAVA_HOME 等环境变量

鼠标右键单击我的电脑→属性→高级→环境变量,如下图示:

1)?????? 单击系统变量列表框下面的新建按钮,新建java_home 环境变量。

2)?????? 单击系统变量列表框下面的新建按钮,新建classpath 环境变量。

3)?????? 在系统变量中找到path 变量,并在原有path 值的基础上添加环境变量。

例如:

1)?????? java_home=E:\Java\Jdk

2)?????? classpath=.\;E:\Java\JDK\lib\dt.jar;E:\Java\JDK\lib\tools.jar;E:\Java\JDK\jre\lib (注意:“.\; ”不能少)

3)?????? path= ……;E:\Java\Jdk\bin (注意:是添加,不是更改)

3.?????? Cygwin ,由于Nutch 提供的脚本只能在Linux 环境下使用,所以使用Cygwin 来虚拟Linux 命令。 下载地址:http://www.cygwin.cn/

4.?????? Nutch 0.9

5.?????? Tomcat 6.0

?

?

二、Nutch 的安装和配置:

1.?????? 安装Cygwin (我这里装到E:\Cygwin )。

2.?????? Nutch 解压缩后放置到Cygwin 的根目录(或者:\home\ 用户名\ )的目录下。

解压的方法是:

1)?????? 为了便于操作,建议将Nutch 0.9 的安装包拷贝到Cygwin\home\ 用户名\ 目录下,这是由于使用Cygwin 进入操作界面是的默认目录是:\home\ 用户名。我们可以使用pwd 命令来查看当前的目录。当然也可以拷贝到Cygwin 的根目录下,这样就需要我们使用cd 命令来退到Cygwin 的根目录。启动Cygwin ,我们就可以看到以下界面,具体操作如下:

2)?????? 使用dir 命令可以查看当前目录下含有的文件,我们就可以看到Nutch 0.9 的安装包,这时我们就可以将Nutch 0.9