日期:2014-05-17  浏览次数:20667 次

简单php采集网页部分文字问题,求指点,多谢
本帖最后由 hi_5461 于 2013-06-09 15:54:50 编辑
目标采集页面如下代码(示例页面,数据可能变化,但格式不会变化)
要求得到table中主要的4项数据:序 号、违法时间、违法地点、违法行为(即93行~130行之间的)
希望能给出详细一点的php代码。

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<base href="http://218.25.58.44:80/" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>交警查询</title>
<link href="style/style.css" rel="stylesheet" type="text/css" />
<style>
.center_td {
text-align:center;
}
</style>
</head>

<body>
<div class="top">
<div class="menu"><ul><li><a href="#">网站首页</a></li><li> 沈阳交警</li><li> 交通新闻 </li><li> 视频播放 </li><li> 为您服务 </li><li> 在线办公 </li><li> 信息查询 </li><li> 征求意见 </li><li> 联系我们</ul>
</div>
<div class="txt"><!-- 沈阳小雨转小到中雨21~14   今天是:2010年5月28日    -->返回首页 / 设为首页 / 添加搜藏</div>
</div>
<div class="main">
<table width="100%" border="0" cellspacing="0" cellpadding="0">
  <tr>
    <td valign="top" class="lmenu" >
    <div class="l1">
    <h1><a href="#"><img src="images/cxx_04.png" border="0" /></a></h1>
    <ul>
    <li>业务指南</li>
    <li>表格下载<br />
机动车驾驶人身体条件证<br />
机动车驾驶申请表…</li>
    <li>自助报名</li>
    <li>模拟考场</li>
    <li>电子地图</li>
    <li>网上车管所</li>
    </ul>
    </div>    
    
    <div class="l1 l2">
    <h1><a href="#"><img src="images/cxx_10.png" border="0" /></a></h1>
    <ul>
    <li>业务指南</li>
    <li>表格下载<br />
机动车驾驶人身体条件证<br />
机动车驾驶申请表…</li>
    <li>自助报名</li>
    </ul>
    </div> 
    
    
    <div class="l1 l3">
    <h1><a href="#"><img src="images/cxx_12.png" border="0" /></a></h1>
    <ul>
    <li>业务指南</li>
    <li>表格下载<br />
机动车驾驶人身体条件证<br />
机动车驾驶申请表…</li>
    <li>自助报名</li>
    <li>模拟考场</li>
    <li>电子地图</li>
    <li>网上车管所</li>
    </ul>
   &n