日期:2014-05-16  浏览次数:20369 次

请教js函数破解问题
想做一个网站的爬虫,但是网站中所有附件的url,甚至分页显示等都用js函数形式封装了,必须通过鼠标点击才可触发,看到下载地址或换页。

不知有何方法能够模拟这个过程?让爬虫可以自动去下载附件,并能够换页。

谢谢!

------解决方案--------------------
可以获取对象的onclick,得到设置的点击行为函数,然后存储起来,直到本页面里所有这样的onclick都搜集完,并对其中不是这类行为的onclick设置进行排除(根据情况自己处理),剩下的都是这类的。

如果abc('filename')会弹出新窗口,则只要for(var i=0;i<所读取到的数组.length;i++)eval(所读取到的数组[i]);即可
------解决方案--------------------
通过正则获取所有须有的onclick函数 abc('filename'),然后提取其中的filename参数,找到他的地址拼接规律后,自己通过filename参数去拼接好地址再去请求就好了