1. 简介
grep: Gloabal Search Regular Expression and Print out the line,意为全局搜索正则表达式并打印文本行。所以
- grep是一个强大的文本搜索工具
- grep与正则表达式联系紧密
之后也会从这两个大的方面来详细介绍。grep命令的基本语法如下:
grep [options] pattern [file...]
[options]表示选项,具体的命令选项见下表。pattern表示要匹配的模式(包括目标字符串、变量或者正则表达式),file表示要查询的文件名,可以是一个或者多个。pattern后面所有的字符串参数都会被理解为文件名。
选项 | 说明 |
---|---|
-c | 只打印匹配的文本行的行数,不显示匹配的内容 |
-i | 匹配时忽略字母的大小写 |
-h | 当搜索多个文件时,不显示匹配文件名前缀 |
-n | 列出所有的匹配的文本行,并显示行号 |
-l | 只列出含有匹配的文本行的文件的文件名,而不显示具体的匹配内容 |
-s | 不显示关于不存在或者无法读取文件的错误信息 |
-v | 只显示不匹配的文本行 |
-w | 匹配整个单词 |
-x | 匹配整个文本行 |
-r | 递归搜索,搜索当前目录和子目录 |
-q | 禁止输出任何匹配结果,而是以退出码的形式表示搜索是否成功,其中0表示找到了匹配的文本行 |
-b | 打印匹配的文本行到文件头的偏移量,以字节为单位 |
-E | 支持扩展正则表达式 |
-P | 支持Perl正则表达式 |
-F | 不支持正则表达式,将模式按照字面意思匹配 |
二、grep简单应用场景
首先介绍一下我的实验环境,在/home/tyrone下建立3个简单的txt文件:
#----------------------/home/tyrone/text1.txt---------------------
hello world
mailx
uuen
letitia
#----------------------/home/tyrone/text2.txt---------------------
hello world,this is for grep test
#----------------------/home/tyrone/text3.txt---------------------
hello world
tyrone
(1)多文件查询,file之间用空格隔开
grep -i "hello world" test1.txt test2.txt
#输出结果
test1.txt:hello world
test2.txt:hello world,this is for grep test
(2)多模式匹配,模式之间为“逻辑或”的关系,匹配任意一个
#方法1:使用-e选项
grep -e "hello world" -e "mailx" -r /home/tyrone
#方法2:使用正则表达式,-E
grep -E "hello world|mailx" -r /home/tyrone
#方法3:使用正则表达式,egrep,同grep -E等效
egrep "hello world|mailx" -r /home/tyrone
#输出结果均相同:
/home/tyrone/test1.txt:hello world
/home/tyrone/test1.txt:mailx
/home/tyrone/test2.txt:hello world,this is for grep test
/home/tyrone/test3.txt:hello world
(3)多模式匹配,模式之间为“逻辑与”的关系,匹配所有模式。
这个问题我查阅了很多方法,并逐一试验了一下。基本思想大致相同:先匹配一个模式,然后grep下面一个模式,将前一次grep的结果作为要查询文件路径依次向后传递。
注意:前一次grep的结果必须加上-l选项,否则会把匹配成功的文件内容作为要查询的文件名向后传递。
我希望做到的是能够显示出同时包含模式的文件,并且跟随显示匹配每个模式的内容。可惜我现在找到的方法都仅仅能够显示匹配最后一个模式的内容。
#方法1:比较笨,将其按一次的结果重定向到一个文件,然后xargs grep来依次读取。
grep -i "hello world" -rl /home/tyrone >> reslut.txt
cat result.txt | xargs grep -i "mailx"
#输出结果
/home/tyrone/test1.txt:mailx
#方法2:直接利用管道
grep -i "hello world" -rl /home/tyrone | xargs grep -i "mailx"
#输出结果
/home/tyrone/test1.txt:mailx
#方法3:使用find,适合于需要灵活判断条件的场景。例如查找指定路径下,同时匹配多个模式的txt文件。
#注意:本例中“mailx”后面的命令必须加上反引号 ` ,否则会被当作要查询的文件名。
grep -i "mailx" `find /home/tyrone -type f -name "*.txt" -exec grep -l "hello world" {} \;`
#输出结果
/home/tyrone/test1.txt:mailx
#方法4:同3
find /home/tyrone -name "*.txt" -exec grep -l "hello world" {} \; | xargs grep -i "mailx"
#输出结果
/home/tyrone/test1.txt:mailx
最后不得不感慨一下linux命令的组合方式,能像积木一样堆积出无穷的组合,是时候展现真正的想象力了。。。
(4)查找指定用户的进程
ps是查看当前进程的指令,e表示所有进程,f表示全格式。
ps -ef | grep "tyrone"
#输出结果
root 27200 1827 0 Jun15 ? 00:00:00 sshd: tyrone [priv]
tyrone 27434 27433 0 Jun15 pts/50 00:00:00 -bash
tyrone 43316 27434 2 02:14 pts/50 00:00:00 ps -ef
tyrone 43317 27434 0 02:14 pts/50 00:00:00 grep tyrone
三、团结就是力量
现在要搞一个脚本把前面总结的命令一锅炖了。先搜索同时匹配多个模式的文件,把它们先备份之后,替换目标字符串:
#----------------------/home/tyrone/myshell.ksh---------------------
#! /bin/ksh
grep "hello world" -rl /home/tyrone | xargs grep -l "mailx" > /home/tyrone/result5.txt
cat result5.txt | while read line
do
cp ${line} ${line}.bak20150616
sed -i "s/hello world/letitia/g" `grep "hello world" -rl ${line}`
done
#输出结果:只有test1.txt满足条件,将"hello world"替换成了"letitia"
#哦对了。。还有我的shell文件也同时包含了这两个模式,可以通过find限定文件后缀,不表
#----------------------/home/tyrone/text1.txt---------------------
letitia
mailx
uuen
letitia
#----------------------/home/tyrone/text2.txt---------------------
hello world,this is for grep test
#----------------------/home/tyrone/text3.txt---------------------
hello world
tyrone
#----------------/home/tyrone/text1.txt.bak20150616---------------
hello world
mailx
uuen
letitia
四、下回分解
grep与正则表达式的故事