日期:2014-05-17  浏览次数:20638 次

这段代码我该如何优化才能识别出更多的html标签!
public static String subValueHtml(String TDvalue){
TDvalue = TDvalue.toLowerCase();
if (TDvalue.indexOf("<a href") >= 0) {
TDvalue = TDvalue.substring(0, TDvalue
.indexOf("<a href"));
}
if (TDvalue.indexOf("<img src") >= 0) {
TDvalue = TDvalue.substring(0, TDvalue
.indexOf("<img src"));
}
if (TDvalue.contains("&nbsp;")) {
TDvalue = TDvalue.replaceAll("&nbsp;", "");
}
 return TDvalue;
}
这段代码我该如何优化才能识别出更多的html标签!
html 优化 java

------解决方案--------------------
引用:
public static String subValueHtml(String TDvalue){
TDvalue = TDvalue.toLowerCase();
if (TDvalue.indexOf("<a href") >= 0) {
TDvalue = TDvalue.substring(0, TDvalue
.indexOf("<a href"));
}
if (TDva……

html标签都有自己的type,你何不用这个来判断是什么标签;而且你上面的判断方法也有问题;
你判断标签都给加了个属性,如果某个标签没有给这个属性赋值,没有在html上显示该属性的时候呢。
------解决方案--------------------
不是很明白lz想问什么。
为什么要有下面这段代码,也不是很清楚:
if (TDvalue.contains("&nbsp;")) {
 TDvalue = TDvalue.replaceAll("&nbsp;", "");
 }
我知道在读取xml文件时使用到Element,其中有一个方法是getName(),可以获取标签名称。
不知道html中有没有类似的。
------解决方案--------------------
你可以试试直接用jsoup这个类库, 用法类似css选择器或jquery