grep 与 perl 正则 AWK

问题: 查看log中所有被调用的方法接口,抽取出方法名?

第一种方式

echo "456methodqwe789lmn"| grep -Po '(?<=method)\D+(?=\d)'
结果:qwe

 -P, --perl-regexp         PATTERN is a Perl regular expression
 -o, --only-matching       show only the part of a line matching 

第二种方式

echo "xxx=a yyy=234b zzz=c" | awk '{match($0,"yyy=([0-9]+)",a)}END{print a[1]}' 
结果:234

/tmp/log.xx 内容如下:
fiiiiiiidddbarrrr
foooooooddddbarrr
awk '{ if(match($0, /(fo+)(.+)(bar*)/, arr)){ print arr[1], arr[2], arr[3]} }'  /tmp/log.xx
输出:fooooooo dddd barrr

参考文档

第三种方式

只限查nginx日志
cat 50850210.log | awk -F 'method=' '{print $2}' | awk -F '&' '{print $1}'

综上所述 第二种方式抽取能力最强

解决这个问题的博文:

http://www.php-oa.com/2008/12/20/power-perl.html

摘录所需要的内容:

(?<=pattern) 后向查找声明,只有在 pattern 已经匹配下面的表达式,并且不将 pattern 的结果放入$& 变量中,才匹配下面的语句
如/(?<=\t)\W+/匹配制表符是否恰好在\W+前出现,但又不将制表符送到 $& 中;

(?=pattern) 前向查找声明,如果正则表达式在下一次匹配 pattern 时,就开始匹配,而且不影响匹配效果.如 /\w+(?=\t)/ 将匹配制表符是否恰好在 \w+ 后面出现,并且制表符不添加到 $& 的值中;

(?!pattern) 如果正则表达式在后面不匹配 pattern ,才会开始匹配.如/foo(?!bar)/,只有当出现 foo,并且后面不出现 bar 时才开始匹配;

perl处理完后会给匹配到的值存在三个特殊变量名

$&, $, $'.匹配上的那部分字符串将自动存储在 $& 之中.变量 $1 中的值为 $' 中的内容,而 $& 为整个被匹配的部分,匹配部分的前一部分存放在 $ 之中,后一部分被存到 $’.另一种说法是, $` 中含有正则表达式引擎在匹配 成功前所找到的变量,而 $’ 为此模式还没有匹配的剩余部分.如果将这三个变量放在一起,你将得到原始字符串

《grep 与 perl 正则 AWK》 Paste_Image.png

扩展博文:
http://www.cnblogs.com/chengmo/archive/2010/10/10/1847287.html
http://www.linuxsong.org/2010/09/awk-string-function/

    原文作者:果酱一一
    原文地址: https://www.jianshu.com/p/dd5b97f9385a
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞