htmlparser 获取页面婚配链接-HTML教程-爱易网页

htmlparser 获取页面婚配链接

日期：2014-05-17　浏览次数：20937 次

htmlparser 获取页面匹配链接

	private static String regex = "http://www.yifujx.com/cn/showclass\\.asp\\?id=\\d{1,2}&pid=\\d{1,2}";
	private static String urlRegex = "http://www.yifujx.com/cn/showProduct\\.asp\\?ID=\\d{1,2}";
	
	
	public static void main(String[] args) throws Exception {
//		Parser parser = Parser.createParser("http://www.yifujx.com/cn/", "gb2312");
		Parser parser = new Parser("http://www.yifujx.com/cn/");
		HtmlPage htmlPage = new HtmlPage(parser);
		parser.visitAllNodesWith(htmlPage);
		
		NodeList nodeList = htmlPage.getBody();
		NodeFilter nodeFilter = new TagNameFilter("A");
		nodeList = nodeList.extractAllNodesThatMatch(nodeFilter, true);
		int size = nodeList.size();
		for(int i=0; i<size; i++){
			LinkTag linkTag = (LinkTag)nodeList.elementAt(i);
			String link = linkTag.getLink();
			if( link.matches(regex) ){
				System.out.println( link + "\t" + linkTag.getChildrenHTML());
			}
		}
		
	}

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

htmlparser 获取页面婚配链接

相关资料更多>

推荐阅读更多>