日期:2014-05-16 浏览次数:20684 次
最近自己一个需求是需要正则提出一个文件里的某个标记,同时这个标记会带有一个附加属性,例如:
?
balabala? name=xxx,yyy&zzzzz_balabala
?
我希望同时提取出 xxx? 和 zzzzz ,可能的写法如果单独用egrep就是
egrep? '.*name=(.*?),(.+)&(.*?)_.*' -o | fgrep ????? | fgrep ????
?
或者配合cut使用为
?
egrep? '.*name=(.*?),(.+)&(.*?)_.*' -o | cut -d = -f 2 | cut? ?? ?? ??
?
总之会有多次的grep与cut,
?
其实看这个需求以及正则表达式,就是典型的正则分组而已,man egrep无果,没有直接能获得分组的功能,寻求go大神帮忙,发现以下一些好贴,解决了我的问题:
?
http://superuser.com/questions/11130/can-gnu-grep-output-a-selected-group
?
http://stackoverflow.com/questions/1891797/capturing-groups-from-a-grep-regex
?
?
故如果需要正则获取分组匹配的话,不能依赖egrep系列,需要使用sed来帮忙完成,例如?
?
echo "aaaaaaa balabala name=xxx,yyy&zzzzz_balabala" | sed -r 's/.*name=(.*?),(.+)&(.*?)_**/\1 \2/'
?
同时附赠一个 正则表达式Sed
http://blogold.chinaunix.net/u/15010/showart_243352.html
?
上面2个帖子里同时还提到了在bash shell中如何用正则,这个时候正则分组是保存在 BASH_REMATCH 这个变量中的,具体参考见? http://www.gnu.org/software/bash/manual/bashref.html