日期:2014-05-16  浏览次数:20684 次

linux正则获得分组
?

最近自己一个需求是需要正则提出一个文件里的某个标记,同时这个标记会带有一个附加属性,例如:

?

balabala? name=xxx,yyy&zzzzz_balabala

?

我希望同时提取出 xxx? 和 zzzzz ,可能的写法如果单独用egrep就是

egrep? '.*name=(.*?),(.+)&(.*?)_.*' -o | fgrep ????? | fgrep ????

?

或者配合cut使用为

?

egrep? '.*name=(.*?),(.+)&(.*?)_.*' -o | cut -d = -f 2 | cut? ?? ?? ??

?

总之会有多次的grep与cut,

?

其实看这个需求以及正则表达式,就是典型的正则分组而已,man egrep无果,没有直接能获得分组的功能,寻求go大神帮忙,发现以下一些好贴,解决了我的问题:

?

http://superuser.com/questions/11130/can-gnu-grep-output-a-selected-group

?

http://stackoverflow.com/questions/1891797/capturing-groups-from-a-grep-regex

?

?

故如果需要正则获取分组匹配的话,不能依赖egrep系列,需要使用sed来帮忙完成,例如?

?

echo "aaaaaaa balabala  name=xxx,yyy&zzzzz_balabala" | sed -r 's/.*name=(.*?),(.+)&(.*?)_**/\1 \2/'

?

同时附赠一个 正则表达式Sed

http://blogold.chinaunix.net/u/15010/showart_243352.html

?

上面2个帖子里同时还提到了在bash shell中如何用正则,这个时候正则分组是保存在 BASH_REMATCH 这个变量中的,具体参考见? http://www.gnu.org/software/bash/manual/bashref.html