日期:2014-05-17 浏览次数:20682 次
String str = "<li class=\"center\"><a href=\"http://hi.csdn.net/ever089010\" target=\"_blank\" onclick='LogClickCount(this,111);'><img src=\"http://avatar.profile.csdn.net/5/3/8/2_ever089010.jpg\" onmouseover=\"try{showUserCard(this,'ever089010')}catch(ex){};\"/></a></li>" + "<li title=\"总技术分:0;总技术排名:499417\"><dfn><a href=\"http://hi.csdn.net/ever089010\" target=\"_blank\" onclick='LogClickCount(this,111);'>ever089010</a></dfn></li>" + "<li class=\"center\"><a href=\"http://hi.csdn.net/ever089010\" target=\"_blank\" onclick='LogClickCount(this,111);'><img src=\"http://avatar.profile.csdn.net/5/3/8/2_ever089010.jpg\" onmouseover=\"try{showUserCard(this,'ever089010')}catch(ex){};\"/></a></li>" + "<li title=\"总技术分:0;总技术排名:499417\"><dfn><a href=\"http://hi.csdn.net/ever089010\" target=\"_blank\" onclick='LogClickCount(this,111);'>ever089010</a></dfn></li>"; Pattern pattern = Pattern.compile("<a\\s[^<]*href=\"([^\"]*)\"\\s[^<]*<img\\s[^<]*src=\"([^\"]*)\"\\s[^<]*</a>"); Matcher matcher = pattern.matcher(str); List<String> linkList=new ArrayList<String>(); List<String> picList=new ArrayList<String>(); while (matcher.find()) { linkList.add(matcher.group(1)); picList.add(matcher.group(2)); System.out.println(matcher.group(1)); System.out.println(matcher.group(2)); System.out.println("=========="); }
------解决方案--------------------
正则啊,楼主都没给出想抓那个网页……