日期:2014-05-20  浏览次数:20774 次

广域网爬虫
问各位大侠:给你一亿个网站URL,我要收集到所有网站关于公司信息的属性(联系人、电话等等)?
望各位给出设计思路或是代码
------解决方案--------------------
这个也忒猛了
这个怎么抓?
一亿个网站没有共同点,获取页面信息搜索“联系我们” or “联系电话”????

不懂,帮顶吧
------解决方案--------------------
引用:
这个也忒猛了
这个怎么抓?
一亿个网站没有共同点,获取页面信息搜索“联系我们” or “联系电话”????

不懂,帮顶吧
如果是外文网站就是"Contact Us Tel"了吧