日期:2014-05-18  浏览次数:20581 次

使用nutch抓取别人网站主要实现什么需求
已会简单的抓取别人网站文章的标题和内容然后存到数据库中,不过还不是很清楚这样做为了实现什么需求,什么样的项目需要用到这样的功能?

------解决方案--------------------
“接口”的一种,不需要第三方支持的内容同步方式

可以使用在很多场合,例如:转载的新闻信息等。
------解决方案--------------------
这个,貌似有人抓取连接进行下载资源,例如图片。视频等等
------解决方案--------------------
可以是搜索站内信息这种功能