日期:2014-05-18  浏览次数:20737 次

htmlParser中NotFilter方法到底怎么用
我想提取table里面的文本内容,但不想要table里面的a标签里面的文本内容
AndFilter   it=new   AndFilter(new   TagNameFilter( "table "),
                    new   NotFilter   (new   HasChildFilter(new   TagNameFilter( "a "))));
NodeList   nL   =   parser.extractAllNodesThatMatch(it);
这样可以编译通过,不过还是有a标签的内容
OrFilter   it=new   OrFilter(new   TagNameFilter( "table "),
                    new   NotFilter   (new   HasChildFilter(new   TagNameFilter( "a "))));
NodeList   nL   =   parser.extractAllNodesThatMatch(it);
这样编译都不能通过
请各位指点一下该怎么提取

------解决方案--------------------
a 的连接结点对应的类好你是 LinkXX 的,具体我忘了,它可以直接取到文字而丢掉 <a ...> 里面的东东
------解决方案--------------------
HTTPParser 解析HTML中的Table的行列 手工设定需要解析的table
http://blog.csdn.net/eqxu/archive/2007/06/06/1640699.aspx
用html parser 来获取HTML网页中Form的各个属性名 值组
http://blog.csdn.net/eqxu/archive/2007/05/29/1629820.aspx