日期:2014-05-18  浏览次数:21047 次

正则表达式截取页面内容
HTML code
<table width="97%" border="0" align="center" cellspacing="0" cellpadding="0">
<tr>
<td align="left" valign="middle" class="cvtitle">自我评价</td>
</tr>
<tr>
<td align="middle" valign="middle" height="4">
<img src="http://img01.51jobcdn.com/im/2009/resumetemplate/line1_1.gif" width="100%" height="4">
</td>
</tr>
<tr>
<td height="10" align="left" valign="middle">
</tr>
<tr>
<td id="Cur_Val" valign="top">1.具有良好的文案能力和表达能力;
<br>2.学习能力和适应能力强;
<br>3.具有良好亲和力和沟通协调能力;
<br>4.具有较强的数据分析能力;
<br>5.具有项目管理及执行能力;
<br>6.有进取心,勤奋。</td>
</tr>
<tr>
<td height="10" align="left" valign="middle">
</tr>
</table>


怎么把 自我评价 和 下面的1到6个自我评价的内容取出来。

------解决方案--------------------
(?is)(?<=<td\sid="Cur_Val"[^>]*?>).*?(?=</tr>)
------解决方案--------------------
正则表达式:a(b)
源字符串:ab
整个匹配结果为:ab
这个表达式有两个捕获组
Group[0],就是整个表达式a(b),捕获的内容是:ab
Group[1],是(b),捕获的内容是:b

正则表达式:a(?:b)
源字符串:ab
整个匹配结果为:ab
这个表达式只有一个捕获组,Group[0],捕获的内容就是:ab

(?:exp) 以上就是只匹配,但是不捕获到捕获组中