爱易网
IT新闻
IT新闻
爱易资讯
网站搭建
云虚拟主机教程
云服务器教程
Apache教程
IIS教程
Nginx教程
网站策划
站长文章
推广教程
淘宝客教程
网页设计
HTML教程
XHTML教程
CSS教程
HTML5教程
CSS3教程
JavaSript基础
JQuery教程
Node.js教程
前端技术
Ajax教程
Js特效
Xml教程
平面设计
页面UI设计
photoshop教程
程序开发
AI人工智能
Asp教程
Php教程
Asp.Net教程
Net Core教程
C#教程
Java教程
Jsp教程
开发技术
微信小程序教程
Uniapp开发教程
微信公众号开发
Andriod教程
IOS教程
DOS教程
Python教程
Docker教程
Windows Container教程
数据库
MSSQL教程
MySQL教程
Redis教程
Access教程
Oracle教程
数据库教程
操作系统
Linux教程
Windows教程
MAC教程
Cisco教程
交换机教程
防火墙教程
搜索
爱易网页
Java教程
有个有关问题关于java的主题爬虫
有个有关问题关于java的主题爬虫
日期:2014-05-20 浏览次数:20917 次
有个问题关于java的主题爬虫
老师要求我们写一个java的主题爬虫,大致作用是爬一些服务外包网站上的项目信息,比如项目名称,要求,联系方式等。我现在能做到的只是将整个网站的正文内容分文件下载下来。该如何像老师要求的那样只下载想要的文本内容,而直接忽略其他的文本内容呢?是根据html的标签来做?
------解决方案--------------------
下下来过滤被,写个正则把标签去掉,url存队列,需要的内容再一匹配,直接存数据库了
上一篇:idea怎么取消commit
下一篇: 小女子请大家指点一二,该如何解决
免责声明:
本文仅代表作者个人观点,与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
相关资料
更多>
jsp书籍,该如何处理
客户管理系统的完美
xml 命名空间的有关问题,
Socket传输的有关问题 多谢!
怎么取web根目录的绝对地址
swing 中参数传递有关问题
新人求职——————求指点!该怎么处理
郁闷的面试啊哥哥姐姐安慰下小弟吧。(散分)解决办法
为了帮助J2SE学习过程中的理解,小弟我想找些稍微涉及底层的阅读材料,还望前辈们推荐
推荐阅读
更多>
CommonUpload上传文件为什么总是在根目录,该如何处理
为何关不掉窗口呢
String s = new String("abc")和Integer i = new Integer(123)区别,该怎么解决
帮小弟我分析一下这个正则表达式
如何得到以删除的class文件
mysql jdbc的配置解决方案
初学java,float类型有关问题
跪求大神共享一下子java工程师的求职简历
还是那个JAVA有关问题
关于 request.getParameter的有关问题
sturts2利用action传值为什么得不到值呢?帮小弟我看看哪出错了,多谢
BufferedReader读取文本 首行多一个‘?’解决方案
手机端怎么采用http,请求ftp服务端的文件
怎么给一个SWT的table设计条件格式?
轮换自定义变量内容的方法-求高手
分页跳转的解决方案
php做的网站页面是.php,asp.net做的网页文件是.aspx,asp做的是.asp,可是用java做的网站页面文件是什么格式呀?解决办法
关于jsp修改Oracle数据库中记录的有关问题
简单的很的小弟我在这里来问java运算符有关问题
关于ExtJs中Combobox获取当前值的有关问题