日期:2014-05-16 浏览次数:20502 次
jsoup提取连接下载网站图片
所使用的包分别为commons-httpclient.jar和jsoup-1.6.1.jar; 
利用jsoup提取,页面src路径; 
利用 httpclient下载网站图片
1. [代码]jsoup提取src路径,下载网站图片
| 
 01  | 
 public class DownImages {  | 
|
| 
 02  | 
 private static int COUNT = 0;  | 
|
| 
 03  | 
 private static int DOWN_COUNT = 0;  | 
|
| 
 04  | 
 
  | 
|
| 
 05  | 
 public static void jsoupHTML(String urlPath) throws Exception{  | 
| 
 06  | 
 Document doc = Jsoup.connect(urlPath).timeout(1000000).get();  | 
| 
 07  | 
 //:当前页中的图片  | 
|
| 
 08  | 
 Elements srcLinks = doc.select("img[src$=.jpg]");  | 
|
| 
 09  | 
 for (Element link : srcLinks) {  | 
|
| 
 10  | 
 //:剔除标签,只剩链接路径  | 
|
| 
 11  | 
 String imagesPath = link.attr("src");  | 
|
| 
 12  | 
 System.out.println("当前访问路径:"+imagesPath);  | 
|
| 
 13  | 
 getImages(imagesPath, "d://images//0000"+ ++COUNT +".jpg");  | 
|
| 
 14  | 
 }  | 
|
| 
 15  | 
 
  | 
|
| 
 16  | 
 //:提取网站中所有的href连接  | 
|
| 
 17  | 
 Ele 
                        免责声明: 本文仅代表作者个人观点,与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
                     
                    
                
                
            
            
            
    
        
   
 | |