日期:2014-05-17  浏览次数:20916 次

求高手帮忙写个正则表达式

小弟在做一个winform的爬虫,想写个正则表达式来读数据,但是技术有限,一直写不出来。请高手帮忙下。

<li>
<div>
<h3><a href="http://1.html" target="_blank" >标题</a></h3>
<p>摘要</p>
</div>
<p class="source">来自:<a href="2.html" target="_blank">来源</a>
作者:<a href="3.html" target="_blank">作者</a>
时间:<span>时间</span>
回复:<span>回复数</span></p>
</li>

想得到的结果
1.html 标题 摘要 来源 作者 时间 回复数
这几个数值,拜托啦~~~~
正则表达式 WinForm

------解决方案--------------------

(?is)<li>\s*<div>\s*<h3><a href="(?<html>.*?)".*?>(?<title>.*?)</a></h3>\s*<p>(?<sence>.*?)</p>\s*</div>\s*<p class="source">.*?<a href.*?>(?<source>.*?)</a>\s*.*<a href=".*?>(?<author>.*?)</a>\s*.*?<span>(?<time>.*?)</span>\s*.*?<span>(?<retimes>.*?)</span></p>\s*</li>


根据你的需求从左往右的去取吧