日期:2014-05-17  浏览次数:20558 次

如何抓取网站上的指定信息,并保存到本地来?
asp.net我要抓取网站上的指定信息,不是全部信息(网上都是抓取全部信息),这个比较难搞,然后再保存到本地来呢?

------解决方案--------------------
用正则表达式获取指定数据即可,关键看规则。
------解决方案--------------------
这个必须要用正则表达式获取你想要的数据。
------解决方案--------------------
抓去了全部的网页,然后再用正则表达式提取你需要的数据呗。
------解决方案--------------------
得到网站HTML源码并保存到本地

正则表达式的使用

正则表达式匹配规则
------解决方案--------------------
<td width="770" valign="top" style='background: url("/images/bg8.gif") repeat-x; border-right-color: rgb(204, 204, 204); border-right-width: 1px; border-right-style: solid;'><table width="690" align="center" border="0" cellspacing="0" cellpadding="0">
      <tbody><tr>
        <td height="90" align="center" style="border-bottom-color: rgb(187, 187, 187); border-bottom-width: 1px; border-bottom-style: solid;"><div class="NewsTitle">中华恐龙园全新大门2014年开启 </div><div class="NewsTitleFu"></div></td>
      </tr>
      <tr>
        <td height="34" align="center">供稿部门:党政办&nbsp; 资料来源:常州日报&nbsp; 发布日期:2013-07-05&nbsp; 浏览量:<span id="NS_id_click_A2GE33G9F148320"></span><script language="JavaScript" src="http://www.cznd.gov.cn/Click.czfx?type=js&amp;SubSys=NS&amp;spanid=NS_id_click_A2GE33G9F148320"></script><script id="sobj_Click_NS_id_click_A2GE33G9F148320_" language="javascript" src="/Click_Ajax.czfx?no-cache=0.6692641476437098&amp;SubSys=NS&amp;ChildSys=&amp;Get=&amp;type=js&amp;spanid=NS_id_click_A2GE33G9F148320"></script>&nbsp; 字号:〖<a href="javascript:czfxfontzoom(16)">大</a> <a href="javascript:czfxfontzoom(14)">中</a> <a href="javascript:czfxfontzoom(12)">小</a>〗</td>
      </tr>
      <tr>