日期:2014-05-20  浏览次数:20757 次

有关网页信息抽取
我现在有一个想法,就是通过java中的某一类传出一个搜索关键词,然后通过后台访问的形式(或者不应该这么描述,就是不跳转到浏览器去搜索)在某一个特定的网站或者随意的一个网站搜索,然后再抓取我搜索到的网页信息,这个功能可以实现么?还有就是怎么实现?给出确实可行的思路或者java源码都行

------解决方案--------------------
这不就是搜索引擎吗。写一个爬虫程序不停爬取网站信息,建立信息库,查询的时候直接在信息库里查询。
但是搜索引擎的具体技术那还是相当的复杂的,你可以看看lucene。