关于C#正则表达式的一个困惑解决办法-C#教程-爱易网页

关于C#正则表达式的一个困惑解决办法

日期：2014-05-18　浏览次数：21150 次

关于C#正则表达式的一个困惑
表达式如下句:
<\s*a\s*href[^ <> ]*\W+clients1.htm[\s\S]*> [\s\S]* </a>

在以下字符串中搜索
<a href= "clients1.htm "> Thomasnet (美国1) </a> 
<a href= "clients2.htm "> Skf (瑞典1) </a> 
<a href= "clients3.htm "> Rentalhomesplus (美国2) </a> 
<a href= "clients4.htm "> Drilling (美国3) </a> 
<a href= "clients5.htm "> Nwa (美国4) </a> 
<a href= "clients6.htm "> Dunderdon (瑞典2) </a> 
<a href= "clients7.htm "> Cingular Wireless (美国5) </a> 
<a href= "clients8.htm "> Sega (美国6) </a>

得出结果为何是全部?
为何不是只到第一个 </a> 的内容?如下是我想要到得的:
<a href= "clients1.htm "> Thomasnet (美国1) </a> 

请问如何修改我的表达式,从第一个a href开始,到第一个 </a> 结束即可,只取这其中的内容?

------解决方案--------------------
如果按你的写法，应该改为这样

<\s*a\s*href[^ <> ]*\W+clients1.htm[\s\S]*?> [\s\S]*? </a>

用非贪婪模式，而不用贪婪模式
------解决方案--------------------
不过你的写法，前面那样写不好，一般来说，href=后可能为 '、 "或者直接接网址三种情况，可以这样写

<\s*a\s*href=([ ' "]?)clients1\.htm\1[^> ]*> [\s\S]*? </a>

.htm这里的.需要转义\.
之后用[^> ]*会比[\s\S]*?的效率高，且不易不现效率陷阱

关于贪婪模式和非贪婪模式，查一下相关资料吧

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

关于C#正则表达式的一个困惑解决办法

相关资料更多>

推荐阅读更多>