日期:2014-05-18  浏览次数:20731 次

java怎么抓取网站上的数据(比如新闻的标题和内容)还要保存到数据库中,请大神指教,最好有个小demo

java怎么抓取网站上的数据(比如新闻的标题和内容),还要保存到数据库中(mysql),请大神指教,最好有个小demo

------解决方案--------------------
jsoup
------解决方案--------------------
网络爬虫吗 百度下 没做过
------解决方案--------------------
根据网页的节点来获取信息可以吧
------解决方案--------------------
http://blog.csdn.net/column/details/jsoup.html
------解决方案--------------------
就是用httpclient 之后抓取页面内容,之后根据需要进行处理即可…………
------解决方案--------------------
一个比较全面的例子 跟你想要的基本符合
http://blog.sina.com.cn/s/blog_70caca4d01018ept.html
------解决方案--------------------
引用:
就是用httpclient 之后抓取页面内容,之后根据需要进行处理即可…………


正解httpclient 读取正面页面就是一大串的字符,然后用神马xxx之类的方法分离出来,大概就是这样的思路