日期:2014-05-20  浏览次数:20775 次

求个Java采集类
就是 给出一个网址 能分析出html
然后给出前后字符串 能够截取html内容的(其实就是正则的实现)


以前有个.net版本的。。。。但是找不到了。。。要不就仿写一个了

采集用的

------解决方案--------------------
用 new URL("网址").openConnection() 然后就可以得到连接来读取HTML了。

至于过滤,其实用 indexOf() 来做也可以,大部分情况下速度比正则快