日期:2014-05-18  浏览次数:21228 次

正则表达式匹配超链接的
有如下文本:
<a href="/sort/172_1.htm">系统相关</a>&nbsp;&nbsp;|&nbsp;&nbsp;<a href="/sort/173_1.htm">软件教程</a>&nbsp;&nbsp;|&nbsp;&nbsp;<a href="/sort/174_1.htm">程序设计</a>&nbsp;&nbsp;|&nbsp;&nbsp;<a href="/sort/175_1.htm">网络编程</a>&nbsp;&nbsp;|&nbsp;&nbsp;<a href="/sort/176_1.htm">图形图像</a>&nbsp;&nbsp;|&nbsp;&nbsp;<a href="/sort/177_1.htm">数据库类</a>&nbsp;&nbsp;|&nbsp;&nbsp;<a href="/sort/178_1.htm">网络安全</a>

想要匹配出其中的URL,但是使用如下的正则表达式:
(?<URL><a\s*href=".*">.*</a>)
但是它把整行一起匹配成了一条结果,如何能够让其把那几个A标签都匹配出来呢?

------解决方案--------------------
(?is)(?<URL><a\s*href="[^"]*"[^>]*>.*?</a>)
------解决方案--------------------
探讨

(?is)(?<URL><a\s*href="[^"]*"[^>]*>.*?</a>)

------解决方案--------------------
(?is)(?<URL><a[^>]*?>.*?</a>)