应用HtmlParser的Filter实例：根据id获取相应div文本-HTML教程-爱易网页

应用HtmlParser的Filter实例：根据id获取相应div文本

日期：2014-05-17　浏览次数：20965 次

使用HtmlParser的Filter实例：根据id获取相应div文本

public class ParseWork {
	private Parser parser;

	public ParseWork(String htmlAddress) throws ParserException {
		parser = new Parser(htmlAddress);
	}
	
	/**
	 * 获取网页标题和正文组成的文本
	 * **/
	protected String getText(String elementId) throws ParserException{
		NodeFilter TitleFilter = new NodeClassFilter(TitleTag.class);
		NodeFilter ElementIdFilter = new HasAttributeFilter("id", elementId);
		OrFilter orFilter = new OrFilter(TitleFilter, ElementIdFilter);  //做一个逻辑OR Filter组合
		NodeList list = parser.extractAllNodesThatMatch(orFilter);
		
		StringBuffer text = new StringBuffer();
		for (int i = 0; i < list.size(); i++)
			text = text.append(list.elementAt(i).toPlainTextString() + "\r\n");
		return text.toString().trim();
	}

	public static void main(String[] args) throws ParserException, IOException {
		ParseWork p = new ParseWork("E://JavaEye新闻.htm");
		String mainText = p.getText("news_content");
		
		//写网页正文文件
		FileUtils.writeStringToFile(new File("E://javaeye新闻.txt"), mainText, "utf-8");	
		//摘要
	}
}

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

应用HtmlParser的Filter实例：根据id获取相应div文本

相关资料更多>

推荐阅读更多>