日期:2014-05-20  浏览次数:21124 次

正则表达式 筛选获取字符串
<dt><a href="http://www.abcd.com/1234-xxxx-xxxx.html">字符串</a><b></b></dt>

筛选<dt>获取xxxx(xxxx是3位或四位的数字)和字符串的值,请教如何写政策表达式
正则表达式 C# HTML

------解决方案--------------------
(?is)<dt>\s*<a[^>]*?href=(["'\s]?)[^"']*?/[\s\S]*?-(?<xxxx1>\d{3,4})-(?<xxxx2>\d{3,4})\.html\1[^>]*?>(?<content>.*?)</a>[\s\S]*?</dt>

取Groups["xxxx1"].Value
Groups["xxxx2"].Value

Groups["content"].Value