正则表达式提取内容
<table border=0 cellPadding=0 cellSpacing=0 width=98% valign=top align=center>
<tr>
<td width=4%> </td>
<td colspan=2 width=92% >
<table border=1 cellPadding=0 cellSpacing=0 width=100% valign=top align=center bordercolorlight= "#CCCCCC " bordercolordark= "#ccffcc ">
<tr height=26 bgcolor=#E3E3E3> <td colspan=4 align=center class=xt> <font color=black> 第一卷 莫名其妙 [ <a href= '# ' onclick=window.open( 'readchapterall.asp?bl_id=95133&bookchapterid=201 ') > 分卷阅读 </a> ] </td> </tr> <tr vlign=top class=xt align=left style= 'padding:4 '> <td width= '33.3333333333333% '>
<a href= 'javascript:gotopage(2533768) ' title= '本章字数:2835 更新日期:2007-1-22 ' target=_top> 第一章 色狼下山 </a>
</td> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2533771) '
title= '本章字数:2311
更新日期:2007-1-22 '
target=_top> 第二章 遭遇怪兽 </a> </td> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2533775) '
title= '本章字数:2307
更新日期:2007-1-22 '
target=_top> 第三章 人妖同流 </a> </td> </tr> <tr vlign=top class=xt align=left style= 'padding:4 '> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2535077) '
title= '本章字数:2651
更新日期:2007-1-23 '
target=_top> 第四章 英雄落魄 </a> </td> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2537127) '
title= '本章字数:2705
更新日期:2007-1-23 '
target=_top> 第五章 末日神功 </a> </td> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2539099) '
title= '本章字数:3270
更新日期:2007-1-24 '
target=_top> 第六章 初入警局 </a> </td> </tr> <tr vlign=top class=xt align=left style= 'padding:4 '> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2541114) '
title= '本章字数:3206
更新日期:2007-1-24 '
target=_top> 第七章 命相奇术 </a> </td> <td> </td> <td> </td> </tr>
</table>
</td>
<td width=4%> </td>
</tr>
</table>
</table>
不知怎样用正则表达式将 'javascript:gotopage(2541114)中的数字取出和将章节名称-例如:“第七章 命相奇术”取出。要取出全部章节。
------解决方案--------------------汗哪,刚才在那个帖子里问楼主是不是这个意思,楼主那么快就结帖了,那样取出来根本就是毫无意义的,试下下面的
MatchCollection mc=Regex.Matches(yourStr,@ "gotopage\((? <number> \d+)\)[\s\S]*?> (? <title> [\s\S]*?) </a> ",RegexOptions.IgnoreCase);
foreach(Match m in mc)
{
m.Groups[ "number "].Value; //数字串
m.Groups[ "title "].Value; //标题
}