分享一个漫画网站数据的扒取方式!
今天有些小无聊,就想为自己的“漫画小屋”添加些数据来源!百度一搜“在线漫画” ,发现KuKu动漫这个网站! 于是写了段代码访问它的一部漫画,选的是http://comic.kukudm.com/comiclist/146?/1465/2.htm,一解析发现原来它漫画图片的路劲是这样显示的 ("+m200911d+"comic/kuku2comic/hunterXhunter/Vol_01/HunterXHunter_01_002.jpg?),关键就是“m200911d”具体是些什么内容!但是网页的全部代码里,都没有m200911d的值 ,又发现源码中有几个 js ,就?逐个打开,发现?原来http://comic.kukudm.com/js2/js4.js?
这个js里有m200911d的值,于是就得到了图片的完整路径http://cc.kukudm.com/comic/kuku2comic/hunterXhunter/Vol_01/HunterXHunter_01_002.jp?g
对漫画感兴趣的朋友可以打开,那张漫画图片就出现了, 通过这样方法这个网站上的所有漫画的的图片都能获取到了
此网站已做修改!