爱易网
IT新闻
IT新闻
爱易资讯
网站搭建
云虚拟主机教程
云服务器教程
Apache教程
IIS教程
Nginx教程
网站策划
站长文章
推广教程
淘宝客教程
网页设计
HTML教程
XHTML教程
CSS教程
HTML5教程
CSS3教程
JavaSript基础
JQuery教程
Node.js教程
前端技术
Ajax教程
Js特效
Xml教程
平面设计
页面UI设计
photoshop教程
程序开发
AI人工智能
Asp教程
Php教程
Asp.Net教程
Net Core教程
C#教程
Java教程
Jsp教程
开发技术
微信小程序教程
Uniapp开发教程
微信公众号开发
Andriod教程
IOS教程
DOS教程
Python教程
Docker教程
Windows Container教程
数据库
MSSQL教程
MySQL教程
Redis教程
Access教程
Oracle教程
数据库教程
操作系统
Linux教程
Windows教程
MAC教程
Cisco教程
交换机教程
防火墙教程
搜索
爱易网页
HTML教程
施用HTMLPARSER和HTTPCLIENT制作网络爬虫,附赠相关技术文档
施用HTMLPARSER和HTTPCLIENT制作网络爬虫,附赠相关技术文档
日期:2014-05-17 浏览次数:20656 次
使用HTMLPARSER和HTTPCLIENT制作网络爬虫,附赠相关技术文档。
利用HTMLPARSER和HTTPCLIENT制作的网络爬虫,还不是很完善,过程是先输入网站及关键词,从google取得每页结果的内容,然后分析每个结果中的链接的网站的内容,取得其中的标题及head中的内容显示,以后可以增加智能分析的模块,软件使用java开发,需要安装java虚拟机,图形界面反应有点缓慢,请耐心等待。
1 楼 tywo45 2011-02-08
相当慢,可以用多线程解决界面无响应的问题
上一篇: 说说标准系列目录
下一篇: htmlparser 除了html标签体(获取body,title纯文本)
免责声明:
本文仅代表作者个人观点,与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
相关资料
更多>
struts2 ognl 正则往html标签字符串截取
针对浏览器隐藏CSS之九大技巧
关于div填充整个浏览器的有关问题
JSF XHTML中的诠释代码,为何仍会被Facelets视图引擎解析
table td title属性,该如何处理
包含的页面不显示中文,该如何处理
在网页中完成文件链接调用
HTML彻底剖析(2)标志一览
用好表单的按钮(二)
推荐阅读
更多>
用AJAX回到HTML片段中的JavaScript脚本
为啥淘宝装修的时候,用background调背景图出不来,而直接插入图片就能出来
CSS学习(1)
css布局解决办法
强大css3制造新浪LOGO 胜过PS
HTML加载顺序札记
HTML5保险攻防详析之完结篇:HTML5对安全的改进
HTML标签小结
IE6下如何实现height:100%;width:100%;四周空10px,父div的clientheight不变,
div里好几张图片,如何只显示一张图片,多谢
css 掩藏超过宽度的文字
怎么用js给html表单设置style
高品质的网页设计: 范例与技巧之七(做别人没做过的事 )
网页文件如何包含一个页头html文件啊
W3C发布最新的HTML5规范草案
HTML 中字符中横旗杆样式
这一行代码怎么转为支持firefox浏览器的
鼠标滚动事件分析解决方案
刚学html编程遇到个有关问题
小短片:什么是 HTML5