日期:2014-05-17  浏览次数:20937 次

求正则匹配一个网页
有一段网页数据需要解析:


<tr><td width=100% align="center"><span>1</span>

<br/>

<a href="&my_video__201" title="1暮光:破晓2幕后花絮:群体舞蹈恶作剧" detail="视频长度: 01:48"><img src="http://192.168.1.19/VLCsite/source/video/photo/p.jpg" alt="2暮光:破晓2幕后花絮:群体舞蹈恶作剧" width="128" height="96"/><br/>暮光:破晓2幕后花絮:群体舞蹈恶作剧</a><br/>

视频长度:<span class="time"> 01:48</span><br /><br />

<a href="&my_video__202" title="【电影】胡夏-20120315微电影《我要见梅西》" detail="视频长度: 16:24"><img src="http://192.168.1.19/VLCsite/source/video/photo/hx.jpg" alt="【电影】胡夏-20120315微电影《我要见梅西》" width="128" height="96"/><br/>【电影】胡夏-20120315微电影《我要见梅西》</a><br/>

视频长度:<span class="time"> 16:24</span><br /><br />

<a href="&my_video__203" title="电影《致青春》制作特辑:《男生宿舍》" detail="视频长度: 02:58"><img src="http://192.168.1.19/VLCsite/source/video/photo/nsss.jpg" alt="电影《致青春》制作特辑:《男生宿舍》" width="128" height="96"/><br/>电影《致青春》制作特辑:《男生宿舍》</a><br/>

视频长度:<span class="time"> 02:58</span><br /><br />

<a href="&my_video__104" title="电影《致青春》制作特辑:《女生宿舍》" detail="视频长度: 03:07"><img src="http://192.168.1.19/VLCsite/source/video/photo/ns.jpg" alt="电影《致青春》制作特辑:《女生宿舍》" width="128" height="96"/><br/>电影《致青春》制作特辑:《女生宿舍》</a><br/>

视频长度:<span class="time"> 03:07</span><br /><br />

<a href="&my_video__105" title="致我们终将逝去的青春__先行预告" detail="视频长度: 01:38"><img src="http://192.168.1.19/VLCsite/source/video/photo/sqqc.jpg" alt="致我们终将逝去的青春__先行预告" width="128" height="96"/><br/>致我们终将逝去的青春__先行预告</a><br/>

视频长度:<span class="time"> 01:38</span><br /><br /><span>1</span>

<br/>

</td>
</tr>


需要将每个href,title,detail,src当中的数据解析出来,
我尝试
 string strRegex = @"<a href=(\?<value1>.*?\)title=(?<value2>.*?)detail=(?<value3>.*?)src=(?<value4>.*?)";
这么写,数据老是解析不出来,求教大神正则表达式该怎么写?c#语言。
c#?正则表达式?网页

------解决方案--------------------
(?is)<a\s*href="(?<value1>[^"]*?)"[^>]*?title="(?<value2>[^"]*?)"[^>]*?detail="(?<value3>[^"]*?)"[^>]*?>.*?<img\s*src="(?<value4>[^"]*?)"[^>]*?/>

string strRegex = @"(?is)<a\s*href=""(?<value1>[^""]*?)""[^>]*?title=""(?<value2>[^""]*?)""[^>]*?detail=""(?<value3>[^""]*?)""[^>]*?>.*?<img\s*src=""(?<value4>[^""]*?)""[^>]*?/>";
------解决方案--------------------
(?is)<a href="(?<value1>.*?)" title="(?<value2>.*?)" detail="(?<value3>.*?)">.*?<img src="(?<value4>.*?)"

你的问题在这里:
string strRegex = @"<a href=(\?<value1>.*?\)title=(?<value2>.*?)detail=(?<value3>.*?)src=(?<value4>.*?)";
------解决方案--------------------


    string txt = File.ReadAllText("1.txt", Encoding.Default);
 &n