这段代码我该如何优化才能识别出更多的html标签!
public static String subValueHtml(String TDvalue){
TDvalue = TDvalue.toLowerCase();
if (TDvalue.indexOf("<a href") >= 0) {
TDvalue = TDvalue.substring(0, TDvalue
.indexOf("<a href"));
}
if (TDvalue.indexOf("<img src") >= 0) {
TDvalue = TDvalue.substring(0, TDvalue
.indexOf("<img src"));
}
if (TDvalue.contains(" ")) {
TDvalue = TDvalue.replaceAll(" ", "");
}
return TDvalue;
}
这段代码我该如何优化才能识别出更多的html标签!
html
优化
java
------解决方案--------------------
html标签都有自己的type,你何不用这个来判断是什么标签;而且你上面的判断方法也有问题;
你判断标签都给加了个属性,如果某个标签没有给这个属性赋值,没有在html上显示该属性的时候呢。
------解决方案--------------------不是很明白lz想问什么。
为什么要有下面这段代码,也不是很清楚:
if (TDvalue.contains(" ")) {
TDvalue = TDvalue.replaceAll(" ", "");
}
我知道在读取xml文件时使用到Element,其中有一个方法是getName(),可以获取标签名称。
不知道html中有没有类似的。
------解决方案--------------------你可以试试直接用jsoup这个类库, 用法类似css选择器或jquery