日期:2014-05-20  浏览次数:21081 次

求一java获取网页信息
在登录一个网站后,在获取信息时使用的get方法返回的数据,其网页地址不变其返回数据的headers:
(Request-Line) GET /(ehvksvrppj2sa2npxwwm3y45)/xs_main.aspx?xh=******* HTTP/1.1
Accept image/jpeg, application/x-ms-application, image/gif, application/xaml+xml, image/pjpeg, application/x-ms-xbap, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
Accept-Encoding gzip, deflate
Accept-Language zh-CN
Cache-Control no-cache
Connection Keep-Alive
Host jwc.***.edu.cn
Referer http://jwc.***.edu.cn/(ehvksvrppj2sa2npxwwm3y45)/default2.aspx
User-Agent Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; InfoPath.3)

打开其他连接时直接返回的是get方法返回的,
(Request-Line) GET /(ehvksvrppj2sa2npxwwm3y45)/xskbcx.aspx?xh=****&xm=****&gnmkdm=N121603 HTTP/1.1
Accept image/jpeg, application/x-ms-application, image/gif, application/xaml+xml, image/pjpeg, application/x-ms-xbap, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
Accept-Encoding gzip, deflate
Accept-Language zh-CN
Connection Keep-Alive
Host jwc.***.edu.cn
Referer http://jwc.***.edu.cn/(ehvksvrppj2sa2npxwwm3y45)/xs_main.aspx?xh=****
User-Agent Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; InfoPath.3)

但是总是得不到他数据返回的信息。返回的还是登录时的界面代码,其中的iform里面的信息无法获取
请高手帮忙。。
我使用的是java做一个应用来登录和获取网页信息。

------解决方案--------------------
首先确定登录这步也是使用java.
将java登录后的cookie完全复制,第二次使用java请求的时候,记着把之前获取的cookie内容也完全带上.

使用httpClient 这个项目吧.


------解决方案--------------------
探讨

我想问哈,怎么使用带参数的get方法,那个querystring怎样添加进去,我问过my teacher,他说是queryString传输不对,query里面就一个gnmkdm,xm(中文),xh三个参数。