日期:2014-05-20 浏览次数:20775 次
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; String text = "<TD HEIGHT=\"30\"><font color=\"#FF0000\"><b>【推荐】</b></font><A TARGET=\"_blank\" HREF=\"../wqst/66400.html\" ONCLICK=\"return ListensSt(this.href);\">【<font color=red><b>六步</b></font>】我的新娘在草原</A></TD>"; Document doc = Jsoup.parseBodyFragment(text); String result = doc.select("b").get(0).text() + doc.select("a").get(0).text(); // 【推荐】【六步】我的新娘在草原
------解决方案--------------------
取中文?
每个中文字符都是大于0x3400的,逐字符过滤文本就行了。
------解决方案--------------------
凑个热闹。
String text = "<TD HEIGHT=\"30\"><font color=\"#FF0000\"><b>【推荐】</b></font><A TARGET=\"_blank\" HREF=\"../wqst/66400.html\" ONCLICK=\"return ListensSt(this.href);\">【<font color=red><b>六步</b></font>】我的新娘在草原</A></TD>"; for (char c : text.toCharArray()) if (c>0x1000) System.out.print(c); //算上标点符号
------解决方案--------------------