日期:2014-05-20  浏览次数:20659 次

关于HtmlParser解析本地Html文件的问题!
数据库记录文件远程URL及本地保存路径。
我想通过HtmlParser打开本地文件!
取出连接形式为相对地址(URI),然后用setUrl设置Url!
我的本意是给HtmlParser指定一个BaseUrl,
结果发现,setUrl把文件从远程重新下载了一次!
而不是我要的方式。我比较喜欢用httpclient下载文件!因为可能抓取和分析是异步发生的。

我的问题是   这个问题用htmlParser本身是不是可以解决?

------解决方案--------------------
可以。我以前做过。
htmlparser可以打开本地文件,你把uri写成本地绝对路径试试呢?

------解决方案--------------------
HTTPParser 解析HTML中的Table的行列 手工设定需要解析的table
http://blog.csdn.net/eqxu/archive/2007/06/06/1640699.aspx
用html parser 来获取HTML网页中Form的各个属性名 值组
http://blog.csdn.net/eqxu/archive/2007/05/29/1629820.aspx