正则表达式中的单元解决方法-C#教程-爱易网页

正则表达式中的单元解决方法

日期：2014-05-20　浏览次数：21122 次

正则表达式中的单元
博客地址:blog.csdn.net/cj205
本文所有内容对编译原理有一定基础者没有任何意义！

而所谓的单元是我假想的一个()括起来的一个整体单位，你可以理解成运算符的优先级，其实就是这个意思，只是这个概念被弱化了。

很多情况下，我们都忽略了一些细节的知识点，今天冷静下来分析一个正则问题的时候，找到了一个小bug

(?!<a).*

对环视有点基础的一定能看出来这在干什么，也很容易看出来错误在什么地方。

(?:(?!<a).)*

这说明了一个小的单元概念，即 [元字符或普通字符] 加上 [量词] 组成一个单元。也就是说第一个正则中，这个环视作用范围是 .* 而非 .

正则表达式中的范围问题一直都是学习正则和理解（看）正则的一个问题，这对初学者来说必然有所感触。

比如,^a|b$

这样的正则简单是说被|一次性划开了，因此这个正则的含义是 ^a b$ 而非 ^ a|b $这样的结构。你可以想象成( (^a) | (b$) )

这里的小括号是我用来解释的假象单元

这样的单元还有如下情况下

[abcd]|[abcd][abcd]|[abcd]

与

([abcd]|[abcd])([abcd]|[abcd])

明显就有不同的意思

这个很容易理解，为什么呢，因为我用括号括起来了。但是前面2个情况却没有

第一个情况是， [元字符或普通字符] 加上 [量词]

第二个情况是，整个正则表达式就是一个单元，在这个大的单元里 | 的作用域是所谓“全局作用域”

在这里提醒一点，环视的作用范围是下个正则单元，而不是字符单元。即我一开始抛出的问题

那么(?!<a>)(<[^>]*>)+的环视作用域在哪呢，或者是正则单元是哪个呢。

看下面的例题

string str = "<a><t><t><a><a><a><t><t><t><t><t><a>";
Regex reg = new Regex("(?!<a>)(<[^>]*>)+");
Console.WriteLine(reg.Match(str));

output：<t><t><a><a><a><t><t><t><t><t><a>

现在你明白了正则单元是什么了对吧。好吧，再加上一条 [正则单元] + 量词还是一个正则单元

我的基础能力我很清楚，所以用编译原理来解释十分吃力，虽然自己能够理顺，但是真的不敢写出来，很期待过客续写这么一篇。他的博客和正则看起来都是那么的舒服。绝不拍马溜须，大家都懂的

其实本来这东西，简单而且没什么可说的，作为一个及其微不足道的知识点，抛出这个砖来实在有点过意不去，不过这2天同事抱怨正则难读时我连续发现几个由此造成的困难，加上今天晚上这事（别笑我哈），还是记下来比较好。至于发到这里来，一方面是为了散分，最近一段时间打算升星故此可能开始恬不知耻的抢分（不过也没多少时间回帖哈哈哈），另一方面是真的很希望过客更新博客了，到他版块来骚扰下子

------解决方案--------------------
其实，如果只看标题，从正则表达式单元说。
应该考虑

元子组：功能，阻止回溯。
(?>)

非命名捕获分组：压栈使用，match/split分开描述
()

命名捕获分组：压栈使用，同上，但有区别
(?<name>)

取消分组的单元
(?:)

(?n)模式

分组的目的是在回溯的时候，分组后表达式失配时，回溯点不是前一个标记，而是从整个分组前方重来。如果分组内回溯可能较多，分组后面稍微有个几十次的回溯，这个表达式的回溯就几何数量上涨了。可惜我们的.net 正则引擎是那么的诚实，就给你来一个超大循环，卡住程序了。

^_^ 我也抛砖。等客客。

------解决方案--------------------
明白了。你其实不是想说什么单元，量词。而是想说环视，对不？
你这个应该分解开。分3部分看

环视

分组

量词修饰的内容

环视中用了分组。是一个特殊的匹配过程。一步步的详解下匹配过程，和失配回溯的过程会让本帖更精彩。期待cj205的精彩分享。
------解决方案--------------------
顶
过客60楼回复也很精彩
(?!a).+
等价于
(?!a)..*
也就是它所作用的位置就是第一个小数点前的位置，而不是第二个小数点前的位置
平时还真没注意
64楼的例子很精彩，第二个正则比较好理解，但是第一个为什么只能匹配到字符a呢？
string str = "abcdefg";
Regex reg1 = new Regex("(?=(?<key>.)).*");
有点儿晕了

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

正则表达式中的单元解决方法

相关资料更多>

推荐阅读更多>