日期:2014-05-20  浏览次数:20667 次

httpClient怎样获取网页中js执行完后的网页源码
本帖最后由 michael2988 于 2010-11-22 18:42:20 编辑
最近用httpClient抓取网页源码的时候,如果源码是静态的能全部抓取,但是如果源码中含有js,httpClient抓取的源码不包括js,得到的源码不正确。我怎样才能获取网页中js执行完后的网页源码,比如获取"https://mail.qq.com/"的网页源码。
在论坛上看到有解决方案是:
调用一个浏览器组件来完成这个事, js执行完后再取其内容;具体怎样实现?
望请高手指点。。。
------解决方案--------------------
这个光靠httpclient是无法做到的,抓到的只能是最原始的数据