日期:2014-05-16  浏览次数:20330 次

抓取page时遇到javascript问题

大家好,

我在使用工具抓取网页时遇到了问题:

我要抓取的网页中包含下面的代码片段

<div class="jsmenu" id="searchmenu">
    <ul>
      <li id="1_1" class="">
        <a href="javascript:ChangeTab('quick',1);SubmitTab('','SCAB','quick','',1);" title="AAA">search</a>
      </li>
      <li id ="1_2" class="active">
        <a href="javascript:ChangeTab('normol',2);SubmitTab('','SCAB','normol','',2);" title="BBB">standar</a>
      </li>
      <li id="1_3" class ="">
        <a href="javascript:ChangeTab('special',3);SubmitTab('','SCAB','special','',3);" title="CCC">special</a>
      </li>
    </ul>

... ... ....


我尝试了很多工具,诸如 TeleportUltra 、Offline_Explorer_Enterprise 等 都无法下载

<a href="javascript:ChangeTab 。。。 对应的链接页面,这些工具似乎都不会 解析 <a href="javascript:ChangeTab 的内容

然后打开并下载这些页面。还有其他什么工具可以用吗,或者编程的思路也行。

希望大家能指点指点我,先谢谢各位了。

另外,我的目标是 抓取  http URL 对应页面的所有内容,包括 css,js,images等,还要 上面提到的 <a href="javascript:ChangeTab

里面的内容,也就是整个页面的镜像 ,full page

------解决方案--------------------
火狐  页面另存外就会把那些东西一块下载下来放在一个文件夹里啊
------解决方案--------------------
javascript:ChangeTab 是js 函数。

用 firebug 之类的工具。看点击后请求了哪个网址?

或者直接看他的 ChangeTab  代码,分析他的代码。