htmlParser中NotFilter方法到底怎么用
我想提取table里面的文本内容,但不想要table里面的a标签里面的文本内容
AndFilter it=new AndFilter(new TagNameFilter( "table "),
new NotFilter (new HasChildFilter(new TagNameFilter( "a "))));
NodeList nL = parser.extractAllNodesThatMatch(it);
这样可以编译通过,不过还是有a标签的内容
OrFilter it=new OrFilter(new TagNameFilter( "table "),
new NotFilter (new HasChildFilter(new TagNameFilter( "a "))));
NodeList nL = parser.extractAllNodesThatMatch(it);
这样编译都不能通过
请各位指点一下该怎么提取
------解决方案--------------------a 的连接结点对应的类好你是 LinkXX 的,具体我忘了,它可以直接取到文字而丢掉 <a ...> 里面的东东
------解决方案--------------------HTTPParser 解析HTML中的Table的行列 手工设定需要解析的table
http://blog.csdn.net/eqxu/archive/2007/06/06/1640699.aspx
用html parser 来获取HTML网页中Form的各个属性名 值组
http://blog.csdn.net/eqxu/archive/2007/05/29/1629820.aspx