日期:2014-05-16 浏览次数:20433 次
jsoup提取连接下载网站图片
所使用的包分别为commons-httpclient.jar和jsoup-1.6.1.jar;
利用jsoup提取,页面src路径;
利用 httpclient下载网站图片
1. [代码]jsoup提取src路径,下载网站图片
01 |
public class DownImages { |
|
02 |
private static int COUNT = 0; |
03 |
private static int DOWN_COUNT = 0; |
|
04 |
|
05 |
public static void jsoupHTML(String urlPath) throws Exception{ |
06 |
Document doc = Jsoup.connect(urlPath).timeout(1000000).get(); |
07 |
//:当前页中的图片 |
|
08 |
Elements srcLinks = doc.select("img[src$=.jpg]"); |
09 |
for (Element link : srcLinks) { |
|
10 |
//:剔除标签,只剩链接路径 |
11 |
String imagesPath = link.attr("src"); |
|
12 |
System.out.println("当前访问路径:"+imagesPath); |
13 |
getImages(imagesPath, "d://images//0000"+ ++COUNT +".jpg"); |
|
14 |
} |
15 |
|
|
16 |
//:提取网站中所有的href连接 |
17 |
Ele
免责声明: 本文仅代表作者个人观点,与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
|