Linux基础之三剑客AWK进阶

  • 上篇已经讲了AWK基础篇
  • 这篇开始讲进阶

awk工作原理

  • 一次读取一行文本,按输入分隔符进行切片,切成多个组成部分,将每片直接保存在内建的变量中,$1,$2,$3….,引用指定的变量,可以显示指定断,或者多个断。如果需要显示全部的,需要使用$0来引用
  • 可以对单个片断进行判断,也可以对所有断进行循环判断
  • 其默认分隔符为空格

awk PATTERN

  • PATTERN:根据pattern条件,过滤匹配的行,再做处理
  • 格式 awk [option] ‘pattern{action}’ file
  • 那什么是PATTERN
  • 如果有一个文件 ,这个文件每读入一行,PATTERN就会根据条件做过滤处理
  • 如正则表达式,如果符合条件他就会进入action进去处理
  • 如果不符合他就不管他,接着读取另外一行,以此类推

不过PATTERN有多种写法

 - 如果为指定:空模式,匹配每一行 ,意思就是说不写PATTERN,只写action
 - 示例
     [root@localhost ~]# awk -F: '{print $1,3}' /etc/passwd
root 3
bin 3
daemon 3
adm 3
lp 3
sync 3
shutdown 3
halt 3
mail 3
operator 3
games 3
ftp 3
nobody 3
systemd-bus-proxy 3
systemd-network 3
dbus 3
polkitd 3
colord 3
abrt 3
  • 我没有写PATTERN,所以他会对所有行的第一和第三行打印出来,这就是空模式,匹配每行

  • 正则表达式的限定,/regular expression/:仅处理能够模式匹配到的行,需要用/ /括起来

  • 示例

[root@localhost ~]# awk  /^UUID/ /etc/fstab 
UUID=5fa28b49-456d-4303-81d0-811b1bfa3ae9 /                       xfs     defaults        0 0
UUID=b0e8912e-cb67-4973-8557-f190f961c0cd /boot                   xfs     defaults        0 0
UUID=c204831a-efc0-4b13-bc39-259bd22cb677 /usr                    xfs     defaults        0 0
UUID=c8298654-edd5-44df-8014-1dbf1fb8dba7 swap                    swap    defaults        0 0
  • 我没有填写print 那是因为默认自动打印$0,就算我写了也一样,想取什么,就取什么
[root@localhost ~]# awk  '/^UUID/ {print $0  }' /etc/fstab 
UUID=5fa28b49-456d-4303-81d0-811b1bfa3ae9 /                       xfs     defaults        0 0
UUID=b0e8912e-cb67-4973-8557-f190f961c0cd /boot                   xfs     defaults        0 0
UUID=c204831a-efc0-4b13-bc39-259bd22cb677 /usr                    xfs     defaults        0 0
UUID=c8298654-edd5-44df-8014-1dbf1fb8dba7 swap                    swap    defaults        0 0
  • 还可以取反哦
    [root@localhost ~]# awk ‘!/^UUID/ {print $0 }’ /etc/fstab
#
# /etc/fstab
# Created by anaconda on Thu Jul 13 08:26:25 2017
#
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
  • 甚至我还可以拿他来取磁盘分区使用列表哦
[root@localhost ~]# df| awk '/^\/dev\/sd/ {print $5}'
1%
13%
30%
  • relational expression: 关系表达式,结果为“真”才会被处理
  • 真:结果为非0值,非空字符串
  • 假:结果为空字符串或0值
  • 意思就是只要不是为0都打印,为0就不打印
  • 示例
[root@localhost ~]# awk -F: '"" {print $0  }' /etc/fstab  
  • 没打印如果给他个任意字符串
[root@localhost ~]# awk -F: '"rrr" {print $0  }' /etc/fstab 

#
# /etc/fstab
# Created by anaconda on Thu Jul 13 08:26:25 2017
#
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
UUID=5fa28b49-456d-4303-81d0-811b1bfa3ae9 /                       xfs     defaults        0 0
UUID=b0e8912e-cb67-4973-8557-f190f961c0cd /boot                   xfs     defaults        0 0
UUID=c204831a-efc0-4b13-bc39-259bd22cb677 /usr                    xfs     defaults        0 0
UUID=c8298654-edd5-44df-8014-1dbf1fb8dba7 swap                    swap    defaults        0 0

line ranges:行范围

  • startline,endline:/pat1/,/pat2/ 不支持直接给出数字格式
  • 示例
[root@localhost ~]# awk -F: '/^b/,/^f/' /etc/passwd
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin

-还可以取中间

[root@localhost ~]# awk -F: 'NR>=10&&NR<=20{print NR,$0}'  /etc/passwd  
10 operator:x:11:0:operator:/root:/sbin/nologin
11 games:x:12:100:games:/usr/games:/sbin/nologin
12 ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
13 nobody:x:99:99:Nobody:/:/sbin/nologin
14 systemd-bus-proxy:x:999:997:systemd Bus Proxy:/:/sbin/nologin
15 systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin
16 dbus:x:81:81:System message bus:/:/sbin/nologin
17 polkitd:x:998:996:User for polkitd:/:/sbin/nologin
18 tss:x:59:59:Account used by the trousers package to sandbox the tcsd daemon:/dev/null:/sbin/nologin
19 postfix:x:89:89::/var/spool/postfix:/sbin/nologin
20 sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin

BEGIN/END模式

  • 通常,对于每个输入行,awk 都会执行每个脚本代码块一次。然而,在许多编程情况中
  • 可能需要在awk 开始处理输入文件中的文本之前执行初始化代码。对于这种情况,awk 允许
  • 您定义一个BEGIN 块。我们在前一个示例中使用了BEGIN 块。因为awk 在开始处理输入文件之前会执行BEGIN 块
  • 因此它是初始化 FS(字段分隔符)变量、打印页眉或初始化其它
  • 在程序中以后会引用的全局变量的极佳位置
  • 比如我打表头
[root@localhost ~]# awk -F: 'BEGIN{print" linenumber     username    userid"}NR>=10&&NR<=20{printf  "%s-12   %+15s %+10d \n " ,NR,$1,$3}'  /etc/passwd
 linenumber     username    userid
10-12          operator        +11 
 11-12             games        +12 
 12-12               ftp        +14 
 13-12            nobody        +99 
 14-12   systemd-bus-proxy       +999 
 15-12   systemd-network       +192 
 16-12              dbus        +81 
 17-12           polkitd       +998 
 18-12               tss        +59 
 19-12           postfix        +89 
 20-12              sshd        +74 

awk action,循环,数组

  • 常用的action分类
  • Expressions:算术,比较表达式等
  • Control statements:if, while等
  • Compound statements:组合语句
  • input statements
  • output statements:print等

awk控制语句if-else

  • 语法:if(condition){statement;…}[else statement]:简单语句,如果条件成立就执行语句,如果不成立我就执行else后面的语句
  • if(condition1){statement1}else if(condition2){statement2}:复杂语句,如果条件成立我就执行后面的语句,如果不成立我会检测后面的语句成立不成立,如果还不成立我就执行后面的else后面的语句
  • else{statement3}
  • 使用场景:对awk取得的整行或某个字段做条件判断,if,else可以写多个,和bash不同
  • 示例
  • 第一判断
[root@localhost ~]# awk -F: '{if($NF=="/bin/bash") print $1}' /etc/passwd
root

-第二判断

[root@localhost ~]# awk '{if(NF>5) print $0}' /etc/fstab
# Created by anaconda on Fri Jul 14 03:57:39 2017
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
/dev/mapper/cl-root     /                       xfs     defaults        0 0
/dev/mapper/cl-app      /app                    xfs     defaults        0 0
UUID=c15af5a4-49d5-4551-abda-921540bf8424 /boot                   xfs     defaults        0 0
/dev/mapper/cl-swap     swap                    swap    defaults        0 0
  • 第三判断
[root@localhost ~]# df -h|awk -F% '/^\/dev/{print $1}'|awk '$NF>=10{print $1,$5}' 
/dev/sda1 14

awk控制语句

  • while循环
  • 语法:while(condition){statement;…}
  • 条件“真”,进入循环;条件“假”,退出循环
  • 使用场景:
  • 对一行内的多个字段逐一类似处理时使用
  • 对数组中的各元素逐一处理时使用
  • while是处理字段的,要记住哦
  • 行循环AWK自带
  • awk 提供了非常好的类似于 C 语言的if 语句。
{ 
 if ( $1== "foo" ) { 
 if ( $2== "foo" ) { 
 print "uno" 
 } else { 
 print "one" 
 } 
 } elseif ($1== "bar" ) { 
 print "two" 
 } else { 
 print "three" 
 } 
} 
  • 示例一
[root@localhost ~]# awk '/^[[:space:]]*linux16/{i=1;while(i<=NF) {print $i,length($i); i++}}' /etc/grub2.cfg
linux16 7
/vmlinuz-3.10.0-514.el7.x86_64 30
root=/dev/mapper/cl-root 24
ro 2
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
rhgb 4
quiet 5
LANG=en_US.UTF-8 16
net.ifnames=0 13
linux16 7
/vmlinuz-0-rescue-a8151f75d28c4b7ba1db0b5ad8c60cd6 50
root=/dev/mapper/cl-root 24
ro 2
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
rhgb 4
quiet 5
  • 示例二
[root@localhost ~]# awk '/^[[:space:]]*linux16/{i=1;while(i<=NF) {if(length($i)>=10) {print $i,length($i)}; i++}}' /etc/grub2.cfg
/vmlinuz-3.10.0-514.el7.x86_64 30
root=/dev/mapper/cl-root 24
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
LANG=en_US.UTF-8 16
net.ifnames=0 13
/vmlinuz-0-rescue-a8151f75d28c4b7ba1db0b5ad8c60cd6 50
root=/dev/mapper/cl-root 24
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
  • do-while循环
  • 语法:do {statement;…}while(condition
  • 意义:无论真假,至少执行一次循环体
  • 示例
[root@localhost ~]#  awk 'BEGIN{ total=0;i=0;do{ total+=i;i++;}while(i<=100);print total}'
5050

for循环

  • for循环
  • 语法:for(expr1;expr2;expr3) {statement
  • 常见用法:
  • for(variable assignment;condition;iteration
  • {for-body}
  • 特殊用法:能够遍历数组中的元素
  • 语法:for(var in array) {for-body}
  • 示例
[root@localhost ~]# awk '/^[[:space:]]*linux16/{for(i=1;i<=NF;i++) {print $i,length($i)}}' /etc/grub2.cfg
linux16 7
/vmlinuz-3.10.0-514.el7.x86_64 30
root=/dev/mapper/cl-root 24
ro 2
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
rhgb 4
quiet 5
LANG=en_US.UTF-8 16
net.ifnames=0 13
linux16 7
/vmlinuz-0-rescue-a8151f75d28c4b7ba1db0b5ad8c60cd6 50
root=/dev/mapper/cl-root 24
ro 2
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
rhgb 4
quiet 5

其他语句

  • switch语句
  • 语法:switch(expression) {case VALUE1 or /REGEXP/:
  • statement1; case VALUE2 or /REGEXP2/: statement2;
  • break和continue
  • awk ‘BEGIN{sum=0;for(i=1;i<=100;i++)
  • {if(i%2==0)continue;sum+=i}print sum}‘
  • awk ‘BEGIN{sum=0;for(i=1;i<=100;i++)
  • {if(i==66)break;sum+=i}print sum}‘
  • 示例
[root@localhost ~]# awk -F: '{if($3%2!=0) next; print $1,$3}' /etc/passwd
root 0
daemon 2
lp 4
shutdown 6
mail 8
games 12
ftp 14
systemd-network 192
polkitd 998
libstoragemgmt 996
rpc 32
rtkit 172
geoclue 994
gdm 42
nfsnobody 65534
ntp 38
sshd 74
tcpdump 72
mageedu 1000

AWK数组

  • 关联数组:array[index-expression]
  • index-expression:
  • 可使用任意字符串;字符串要使用双引号括起来
  • 如果某数组元素事先不存在,在引用时,awk会自动创建此元素,并将其值初始化为“空串”
  • 若要判断数组中是否存在某元素,要使用“index in array”格式进行遍历
  • 示例一
  • 数组非常绕好好看
[root@localhost ~]# awk 'BEGIN{weekdays["mon"]="Monday";weekdays["tue"]="Tuesday";print weekdays["mon"]}'
Monday
    原文作者:O感悟人生O
    原文地址: https://www.jianshu.com/p/609bd2f0942b
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞