日期:2014-05-18  浏览次数:20707 次

抓页面程序 抓回来的却是jsp源代码
有个抓页面的程序,用了很久了一直没问题.就是根据给它的url来建立URLConnection,然后getInputStream.   如果这个url是xxxxxx.jsp那么抓到的内容应该是jsp解析以后生成的HTML代码。
    但是前几天重新配置了一台服务器,在心服务器上用这个程序的时候抓xxxx.jsp返回的却是这个被抓的jsp的源代码。
      请问有人遇到过这种现象么?

服务器是用的Apache+tomcat,Linux。
    谢谢!

------解决方案--------------------
源代码?你直接访问xxx.jsp浏览器是返回html还是jsp?
------解决方案--------------------
有次我没配置对服务器也把config.php给down了下来...
------解决方案--------------------
回复人:Red_angelX(八戒) ( 一级(初级)) 信誉:100 2007-03-07 14:38:17 得分:0
?
源代码?你直接访问xxx.jsp浏览器是返回html还是jsp?
-------------------------------------------------
直接访问xxx.jsp是html,很正常。
但是用抓的就返回jsp源代码。
------解决方案--------------------
回复人:Red_angelX(八戒) ( 一级(初级)) 信誉:100 2007-03-07 14:38:54 得分:0
?
有次我没配置对服务器也把config.php给down了下来...
------------------------------------------------
哪里没有配置对?
------解决方案--------------------
直接访问正常......那这就太神奇了 因该不会啊
------解决方案--------------------
是这样:

直接访问用的是公网ip.
程序抓的时候用的是127.0.0.1(因为程序在服务器上所以直接抓本机的页面)


------解决方案--------------------
你用Linux吗?那你使用get xxxx.jsp试试。
个人觉得应该不会,除非你抓取得网站没有配置正确。
------解决方案--------------------
我想:像这种直接把源代码下载过来的错误基本都是不支持这种格式导致的。所以是不是服务器哪里没有配置文件类型什么的。
------解决方案--------------------
楼主看错了。。。
------解决方案--------------------
抓本机是有可能出现这个问题
------解决方案--------------------
那怎么解决抓本机的问题呢?
------解决方案--------------------
会不会是你的源码在本机上的缘故?
------解决方案--------------------
你在抓本机时也用公网IP试试,不要用127.0.0.1
------解决方案--------------------
mark
------解决方案--------------------
很大可能你的Apache+tomcat配置不当,导致.jsp文件无法被解析。
------解决方案--------------------
看看这个 http://www.haolla.com/girls/index.asp
http://haolla.com/wy
------解决方案--------------------
回复人:liaohaiying(大菜) ( 一星(中级)) 信誉:100 2007-3-7 20:52:06 得分:0
?

你在抓本机时也用公网IP试试,不要用127.0.0.1
---------------------------------------------------
这个不行,因为服务器是在apache后面的。apache装在负责接收公网请求的交换机上。对于服务器来说,公网ip它是找不到的。
------解决方案--------------------
在本地抓抓看
------解决方案--------------------
不可能
------解决方案--------------------
这个不行,因为服务器是在apache后面的。apache装在负责接收公网请求的交换机上。对于服务器来说,公网ip它是找不到的。
==========
不会吧????公网IP找不到????那能不能找到163,SINA,CHINAREN呢,
我的意思是说不要直接抓本机,而是通过外网转个圈回来抓,就像你抓别的网站一样
------解决方案--------------------
你这个情况是因为不是从服务器上读取文件了(http),而是从本地读取文件了(file)
所以说要绕过本地才行
------解决方案--------------------