日期:2014-05-17  浏览次数:20638 次

使用HTMLPARSER和HTTPCLIENT制作网络爬虫,附赠相关技术文档。
  利用HTMLPARSER和HTTPCLIENT制作的网络爬虫,还不是很完善,过程是先输入网站及关键词,从google取得每页结果的内容,然后分析每个结果中的链接的网站的内容,取得其中的标题及head中的内容显示,以后可以增加智能分析的模块,软件使用java开发,需要安装java虚拟机,图形界面反应有点缓慢,请耐心等待。
1 楼 tywo45 2011-02-08  
相当慢,可以用多线程解决界面无响应的问题