htmlcleaner 使用示例.
原文出处:http://blog.chenlb.com/2008/11/htmlcleaner-use-demo.html
<!-- google_ad_section_start -->
编程的时候,有时数据源从html来。那就要对html分析提取数据。好在java社区里有好有相关库来解析html,经使用比较:个人
觉得 htmlcleaner 比 htmlparser 好用。htmlcleaner 的
xpath特好用。也可能我对htmlparser不熟悉。
htmlcleaner 下载地址:htmlcleaner2_1.jar
源码下载:htmlcleaner2_1-all.zip
写一个测试用的html文件:html-clean-demo.html
-
<!DOCTYPE?html?PUBLIC?"-//W3C//DTD?XHTML?1.0?Transitional"?"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd
"
>
??
-
<
html
?
xmlns
=
"http://www.w3.org/1999/xhtml
"
?
xml:lang
=
"zh-CN"
?
dir
=
"ltr"
>
??
-
<
head
>
??
-
????<
meta
?
http-equiv
=
"Content-Type"
?
content
=
"text/html;?charset=GBK"
/>
??
-
????<
meta
?
http-equiv
=
"Content-Language"
?
content
=
"zh-CN"
/>
??
-
????<
title
>
html?clean?demo
</
title
>
??
-
</
head
>
??
-
<
body
>
??
-
<
div
?
class
=
"d_1"
>
??
-
????<
ul
>
??
-
????????<
li
>
bar
</
li
>
??
-
????????<
li
>
foo
</
li
>
??
-
????????<
li
>
gzz
</
li
>
??
-
????</
ul
>
??
-
免责声明: 本文仅代表作者个人观点,与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。