日期:2014-05-16  浏览次数:20433 次

jsoup提取连接下载网站图片

jsoup提取连接下载网站图片

所使用的包分别为commons-httpclient.jar和jsoup-1.6.1.jar; 
利用jsoup提取,页面src路径; 
利用 httpclient下载网站图片

1. [代码]jsoup提取src路径,下载网站图片     

01

public class DownImages {

02

    private static int COUNT = 0;

 

03

    private static int DOWN_COUNT = 0;

04

     

 

05

    public static void jsoupHTML(String urlPath) throws Exception{

06

        Document doc = Jsoup.connect(urlPath).timeout(1000000).get();

 

07

        //:当前页中的图片

08

        Elements srcLinks = doc.select("img[src$=.jpg]");

 

09

        for (Element link : srcLinks) {

10

            //:剔除标签,只剩链接路径

 

11

            String imagesPath = link.attr("src");

12

            System.out.println("当前访问路径:"+imagesPath);

 

13

            getImages(imagesPath, "d://images//0000"+ ++COUNT +".jpg");

14

        }

 

15

         

16

        //:提取网站中所有的href连接

 

17

        Ele