日期:2014-05-18  浏览次数:20676 次

关于httpunit抓取动态网页的小问题
现在写了一个抓取代码 所有功能已经配置好 

for (int i = 0; i < config.getMaxPage(); i++) {
int pagecount =i*20;
HtmlPage page = webClient
.getPage("http://video.baidu.com/v?word="
+ config.getKeyword()
+ "&ct=301989888&rn=20&pn=0&db=0&s=0&fbl=800&tpl=videoMultiNeed#pn="
+ pagecount);
                        String xml = page.asXml();//输出了一下xml 发现还是 pagecount第一次的值的url 各位大牛知道这是啥情况吗 可是输出了url 确实是改变后的了 

Document doc = Jsoup.parse(xml);

//下面是具体解析



------解决方案--------------------
恭喜楼主,问题解决了。