日期:2014-05-17 浏览次数:21166 次
Cygwin 的安装过程,请参看官方的帮助文档[url]http://cygwin.com/cygwin-ug-net/setup-net.html[/url]。 jdk的安装。不再详述。 nutch的下载。请到官方网站:[url]http://nutch.apache.org/[/url] nutch下载成功到解压的自己的合适目录下。
<property>
<name>http.agent.name</name>
<value>HD nutch agent</value>
</property>
<property>
<name>http.agent.version</name>
<value>1.0</value>
</property>
# accept hosts in MY.DOMAIN.NAME +^http://([a-z0-9]*\.)*MY.DOMAIN.NAME/ 修改为 # accept hosts in MY.DOMAIN.NAME # +^http://([a-z0-9]*\.)*MY.DOMAIN.NAME/ +^http://www.iteye.com
<property> <name>searcher.dir</name> <value>D:\testcrawl</value> </property>