日期:2014-05-17  浏览次数:20709 次

Jsoup-1.6.0的一个bug—解析html标签内容只是0被忽略掉了

有一个需求,想要把带html标签的字符串中的纯文本内容做截取,尝试使用Jsoup ,版本是 jsoup-1.6.0.jar , 使用起来确实方便,但发现一个问题标签中内容如果只有一个0 的话Jsoup居然不认,很奇怪

?

		String html = "<span lang=EN-US>0</span>";
		Document doc = Jsoup.parse(html);
		Elements eles = doc.getElementsByTag("span");
		Element span = eles.get(0);
		System.out.println(span.hasText());//false
		System.out.println(span.ownText());//空串

?

暂时没有好的解决办法。

?

--------------------

哈哈 , Stackoverflow 真强大,问题刚发就有人回应,一楼的哥们说是jsoup的bug,他用jsoup-1.3.3就正常。我试了一下,还真是但有一个问题是我用了Element.clone()方法,1.3.3的版本还不支持,我继续试了更新的版本,最好又支持clone方法又没有这个bug。结果发现是在1.6的时候新出的bug,所以可以使用1.6之前最新的版本 jsoup-1.5.2.jar ,哈,问题解决了。

?

注:

1. 问题放到了Stackoverflow 上,呵呵,第一次去那儿;

2. 初步感觉Stackoverflow上面问问题比je的问答频道更好些,呵呵。