grep一般格式为:
grep [选项]基本正则表达式[文件]
这里基本正则表达式可为字符串。
单引号双引号
在g r e p命令中输入字符串参数时,最好将其用双引号括起来。
在调用模式匹配时,应使用单引号。
例如:“m y s t r i n g”。这样做有两个原因,一是以防被误解为s h e l l命令,二是可以用来查找多个单词组成的字符串。
在调用变量时,也应该使用双引号,诸如: g r e p“$ M Y VA R”文件名,如果不这样,将没有返回结果。
常用的g r e p选项有:
-c 只输出匹配行的计数。
-i 不区分大小写(只适用于单字符)。
-h 查询多文件时不显示文件名。
-l 查询多文件时只输出包含匹配字符的文件名。
-n 显示匹配行及行号。
-s 不显示不存在或无匹配文本的错误信息。
-v 显示不包含匹配文本的所有行。
举例:
1、查询多个文件
在所有文件中查询单词“ sort it”
$ grep "sort it" *
2、 行匹配
1)显示包含“4 8”字符串的文本:
$ grep? "48" data.f
2)输出匹配行的总数
$ grep -c "48" data.f
4
3)行数
显示满足匹配模式的所有行行数:
$ grep -n "48" data.f
行数在输出第一列,后跟包含4 8的每一匹配行。
4)显示非匹配行
$ grep -v "48" data.f
5)精确匹配
可能大家已注意到,在上一例中,抽取字符串“ 4 8”,返回结果包含诸如4 8 4和4 8 3等包含“4 8”的其他字符串,实际上应精确抽取只包含4 8的各行。
使用g r e p抽取精确匹配的一种更有效方式是在抽取字符串后加\ >。假定现在精确抽取4 8,方法如下:
$grep "48\>" data.f
6)大小写敏感
缺省情况下, g r e p是大小写敏感的,如要查询大小写不敏感字符串,必须使用- i开关。在d a t a . f文件中有月份字符S e p t,既有大写也有小写,要取得此字符串大小写不敏感查询,方法如下:
$grep -i "48" data.f
1、模式范围
抽取代码为4 8 4和4 8 3的城市位置,可以使用[ ]来指定字符串范围。
$ grep "48[34]" data.f
2、不匹配行首
使行首不是4或8,可以在方括号中使用^记号。
$ grep "^[^48]" data.f
如果是字符串48
$ grep -v "^[^48]" data.f
3、设置大小写
使用- i开关可以屏蔽月份S e p t的大小写敏感
$ grep -i "sept" data.f
也可以用另一种方式[ ]模式抽取各行包含S e p t和s e p t的所有信息。
$ grep '[sS]ept' data.f
如果要抽取包含S e p t的所有月份,不管其大小写,并且此行包含字符串483,可以使用管道命令,即符号“|”左边命令的输出作为“ |”右边命令的输入。举例如下:
[sam@chenwy sam]$ grep '[sS]ept' data.f | grep 48
483???? Sept??? 5AP1996 USP???? 65.00?? LVX2C?? 189
4、匹配任意字符
如果抽取以K开头,以D结尾的所有代码,可使用下述方法,因为已知代码长度为5个字符:
[sam@chenwy sam]$ grep 'K...D' data.f
47????? Oct???? 3ZL1998 LPSX??? 43.00?? KVM9D?? 512
483???? may???? 5PA1998 USP???? 37.00?? KVM9D?? 644
将上述代码做轻微改变,头两个是大写字母,中间两个任意,并以C结尾:
[sam@chenwy sam]$ grep '[A-Z]..C' data.f
5、日期查询
一个常用的查询模式是日期查询。先查询所有以5开始以1 9 9 6或1 9 9 8结尾的所有记录。使用模式5 . . 1 9 9 [ 6 , 8 ]。这意味着第一个字符为5,后跟两个点,接着是1 9 9,剩余两个数字是6或8。
[sam@chenwy sam]$ grep '5..199[6,8]' data.f
6、范围组合
必须学会使用[ ]抽取信息。假定要取得城市代码,第一个字符为0-9,第二个字符在0到5之间,第三个字符在0到6之间,使用下列模式即可实现。
[sam@chenwy sam]$ grep '[0-9][0-5[0-6]' data.f
7、模式出现机率
抽取包含数字4至少重复出现两次的所有行,方法如下
[sam@chenwy sam]$ grep '4\{2,\}' data.f
8、使用grep匹配“与”或者“或”模式
g r e p命令加- E参数,这一扩展允许使用扩展模式匹配。例如,要抽取城市代码为2 1 9或2 1 6,方法如下:
[sam@chenwy sam]$ grep -E '219|216' data.f
9、空行
结合使用^和$可查询空行。使用- c参数显示总行数:
[sam@chenwy sam]$ grep -c '^$' myfile
使用- n参数显示实际在哪一行:
[sam@chenwy sam]$ grep -n '^$' myfile
10、匹配特殊字符
查询有特殊含义的字符,诸如$ . ' " * [] ^ | \ + ? ,必须在特定字符前加\。假设要查询包含“.”的所有行,脚本如下:
[sam@chenwy sam]$ grep '\.' myfile
或者是一个双引号:
[sam@chenwy sam]$ grep '\"' myfile
以同样的方式,如要查询文件名c o n f t r o l l . c o n f(这是一个配置文件),脚本如下:
[sam@chenwy sam]$ grep 'conftroll\.conf' myfile
11、查询格式化文件名
使用正则表达式可匹配任意文件名。系统中对文本文件有其标准的命名格式。一般最多六个小写字符,后跟句点,接着是两个大写字符。
[sam@chenwy sam]$ grep '^[a-z]\{1,6\}\.[A-Z]\{1,2\}' filename
2、使用通配符*的匹配模式
grep "l.*s" testfile
如在行尾查询某一单词,试如下模式:
grep "ng$" testfile
这将在所有文件中查询行尾包含单词ng的所有行。