日期:2014-05-18  浏览次数:20597 次

java读取HTML中的信息
现在我想用JAVA来读取HTML代码中的信息,包括里面图片、表格的位置、大小等,读取出来后存入一个地方。有哪位大侠知道这方面的知识么?好像和webbrowser方面的知识有关?是吗?(我现在要做的是把HTML里的东西导入到PDF里,想先把HTML里面的元素读出来并存储,然后再导入PDF。)

------解决方案--------------------
是用JAVA来分析文件一样来分析一个指定的HTML么?如果这样就按照标签来获取属性 为什么不写到XML里 然后来解析XML呢
------解决方案--------------------
UP
------解决方案--------------------
不用那么麻吧,请参见我以前讨论过的一个贴子:
http://topic.csdn.net/u/20070921/09/f99e44b8-cd5c-47e7-aaff-d3bd84eba04f.html
------解决方案--------------------
参考一下lucene的解析
------解决方案--------------------
最好写个JS