- 上篇已经讲了AWK基础篇
- 这篇开始讲进阶
awk工作原理
- 一次读取一行文本,按输入分隔符进行切片,切成多个组成部分,将每片直接保存在内建的变量中,$1,$2,$3….,引用指定的变量,可以显示指定断,或者多个断。如果需要显示全部的,需要使用$0来引用
- 可以对单个片断进行判断,也可以对所有断进行循环判断
- 其默认分隔符为空格
awk PATTERN
- PATTERN:根据pattern条件,过滤匹配的行,再做处理
- 格式 awk [option] ‘pattern{action}’ file
- 那什么是PATTERN
- 如果有一个文件 ,这个文件每读入一行,PATTERN就会根据条件做过滤处理
- 如正则表达式,如果符合条件他就会进入action进去处理
- 如果不符合他就不管他,接着读取另外一行,以此类推
不过PATTERN有多种写法
- 如果为指定:空模式,匹配每一行 ,意思就是说不写PATTERN,只写action
- 示例
[root@localhost ~]# awk -F: '{print $1,3}' /etc/passwd
root 3
bin 3
daemon 3
adm 3
lp 3
sync 3
shutdown 3
halt 3
mail 3
operator 3
games 3
ftp 3
nobody 3
systemd-bus-proxy 3
systemd-network 3
dbus 3
polkitd 3
colord 3
abrt 3
我没有写PATTERN,所以他会对所有行的第一和第三行打印出来,这就是空模式,匹配每行
正则表达式的限定,/regular expression/:仅处理能够模式匹配到的行,需要用/ /括起来
示例
[root@localhost ~]# awk /^UUID/ /etc/fstab
UUID=5fa28b49-456d-4303-81d0-811b1bfa3ae9 / xfs defaults 0 0
UUID=b0e8912e-cb67-4973-8557-f190f961c0cd /boot xfs defaults 0 0
UUID=c204831a-efc0-4b13-bc39-259bd22cb677 /usr xfs defaults 0 0
UUID=c8298654-edd5-44df-8014-1dbf1fb8dba7 swap swap defaults 0 0
- 我没有填写print 那是因为默认自动打印$0,就算我写了也一样,想取什么,就取什么
[root@localhost ~]# awk '/^UUID/ {print $0 }' /etc/fstab
UUID=5fa28b49-456d-4303-81d0-811b1bfa3ae9 / xfs defaults 0 0
UUID=b0e8912e-cb67-4973-8557-f190f961c0cd /boot xfs defaults 0 0
UUID=c204831a-efc0-4b13-bc39-259bd22cb677 /usr xfs defaults 0 0
UUID=c8298654-edd5-44df-8014-1dbf1fb8dba7 swap swap defaults 0 0
- 还可以取反哦
[root@localhost ~]# awk ‘!/^UUID/ {print $0 }’ /etc/fstab
#
# /etc/fstab
# Created by anaconda on Thu Jul 13 08:26:25 2017
#
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
- 甚至我还可以拿他来取磁盘分区使用列表哦
[root@localhost ~]# df| awk '/^\/dev\/sd/ {print $5}'
1%
13%
30%
- relational expression: 关系表达式,结果为“真”才会被处理
- 真:结果为非0值,非空字符串
- 假:结果为空字符串或0值
- 意思就是只要不是为0都打印,为0就不打印
- 示例
[root@localhost ~]# awk -F: '"" {print $0 }' /etc/fstab
- 没打印如果给他个任意字符串
[root@localhost ~]# awk -F: '"rrr" {print $0 }' /etc/fstab
#
# /etc/fstab
# Created by anaconda on Thu Jul 13 08:26:25 2017
#
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
UUID=5fa28b49-456d-4303-81d0-811b1bfa3ae9 / xfs defaults 0 0
UUID=b0e8912e-cb67-4973-8557-f190f961c0cd /boot xfs defaults 0 0
UUID=c204831a-efc0-4b13-bc39-259bd22cb677 /usr xfs defaults 0 0
UUID=c8298654-edd5-44df-8014-1dbf1fb8dba7 swap swap defaults 0 0
line ranges:行范围
- startline,endline:/pat1/,/pat2/ 不支持直接给出数字格式
- 示例
[root@localhost ~]# awk -F: '/^b/,/^f/' /etc/passwd
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
-还可以取中间
[root@localhost ~]# awk -F: 'NR>=10&&NR<=20{print NR,$0}' /etc/passwd
10 operator:x:11:0:operator:/root:/sbin/nologin
11 games:x:12:100:games:/usr/games:/sbin/nologin
12 ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
13 nobody:x:99:99:Nobody:/:/sbin/nologin
14 systemd-bus-proxy:x:999:997:systemd Bus Proxy:/:/sbin/nologin
15 systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin
16 dbus:x:81:81:System message bus:/:/sbin/nologin
17 polkitd:x:998:996:User for polkitd:/:/sbin/nologin
18 tss:x:59:59:Account used by the trousers package to sandbox the tcsd daemon:/dev/null:/sbin/nologin
19 postfix:x:89:89::/var/spool/postfix:/sbin/nologin
20 sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
BEGIN/END模式
- 通常,对于每个输入行,awk 都会执行每个脚本代码块一次。然而,在许多编程情况中
- 可能需要在awk 开始处理输入文件中的文本之前执行初始化代码。对于这种情况,awk 允许
- 您定义一个BEGIN 块。我们在前一个示例中使用了BEGIN 块。因为awk 在开始处理输入文件之前会执行BEGIN 块
- 因此它是初始化 FS(字段分隔符)变量、打印页眉或初始化其它
- 在程序中以后会引用的全局变量的极佳位置
- 比如我打表头
[root@localhost ~]# awk -F: 'BEGIN{print" linenumber username userid"}NR>=10&&NR<=20{printf "%s-12 %+15s %+10d \n " ,NR,$1,$3}' /etc/passwd
linenumber username userid
10-12 operator +11
11-12 games +12
12-12 ftp +14
13-12 nobody +99
14-12 systemd-bus-proxy +999
15-12 systemd-network +192
16-12 dbus +81
17-12 polkitd +998
18-12 tss +59
19-12 postfix +89
20-12 sshd +74
awk action,循环,数组
- 常用的action分类
- Expressions:算术,比较表达式等
- Control statements:if, while等
- Compound statements:组合语句
- input statements
- output statements:print等
awk控制语句if-else
- 语法:if(condition){statement;…}[else statement]:简单语句,如果条件成立就执行语句,如果不成立我就执行else后面的语句
- if(condition1){statement1}else if(condition2){statement2}:复杂语句,如果条件成立我就执行后面的语句,如果不成立我会检测后面的语句成立不成立,如果还不成立我就执行后面的else后面的语句
- else{statement3}
- 使用场景:对awk取得的整行或某个字段做条件判断,if,else可以写多个,和bash不同
- 示例
- 第一判断
[root@localhost ~]# awk -F: '{if($NF=="/bin/bash") print $1}' /etc/passwd
root
-第二判断
[root@localhost ~]# awk '{if(NF>5) print $0}' /etc/fstab
# Created by anaconda on Fri Jul 14 03:57:39 2017
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
/dev/mapper/cl-root / xfs defaults 0 0
/dev/mapper/cl-app /app xfs defaults 0 0
UUID=c15af5a4-49d5-4551-abda-921540bf8424 /boot xfs defaults 0 0
/dev/mapper/cl-swap swap swap defaults 0 0
- 第三判断
[root@localhost ~]# df -h|awk -F% '/^\/dev/{print $1}'|awk '$NF>=10{print $1,$5}'
/dev/sda1 14
awk控制语句
- while循环
- 语法:while(condition){statement;…}
- 条件“真”,进入循环;条件“假”,退出循环
- 使用场景:
- 对一行内的多个字段逐一类似处理时使用
- 对数组中的各元素逐一处理时使用
- while是处理字段的,要记住哦
- 行循环AWK自带
- awk 提供了非常好的类似于 C 语言的if 语句。
{
if ( $1== "foo" ) {
if ( $2== "foo" ) {
print "uno"
} else {
print "one"
}
} elseif ($1== "bar" ) {
print "two"
} else {
print "three"
}
}
- 示例一
[root@localhost ~]# awk '/^[[:space:]]*linux16/{i=1;while(i<=NF) {print $i,length($i); i++}}' /etc/grub2.cfg
linux16 7
/vmlinuz-3.10.0-514.el7.x86_64 30
root=/dev/mapper/cl-root 24
ro 2
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
rhgb 4
quiet 5
LANG=en_US.UTF-8 16
net.ifnames=0 13
linux16 7
/vmlinuz-0-rescue-a8151f75d28c4b7ba1db0b5ad8c60cd6 50
root=/dev/mapper/cl-root 24
ro 2
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
rhgb 4
quiet 5
- 示例二
[root@localhost ~]# awk '/^[[:space:]]*linux16/{i=1;while(i<=NF) {if(length($i)>=10) {print $i,length($i)}; i++}}' /etc/grub2.cfg
/vmlinuz-3.10.0-514.el7.x86_64 30
root=/dev/mapper/cl-root 24
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
LANG=en_US.UTF-8 16
net.ifnames=0 13
/vmlinuz-0-rescue-a8151f75d28c4b7ba1db0b5ad8c60cd6 50
root=/dev/mapper/cl-root 24
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
- do-while循环
- 语法:do {statement;…}while(condition
- 意义:无论真假,至少执行一次循环体
- 示例
[root@localhost ~]# awk 'BEGIN{ total=0;i=0;do{ total+=i;i++;}while(i<=100);print total}'
5050
for循环
- for循环
- 语法:for(expr1;expr2;expr3) {statement
- 常见用法:
- for(variable assignment;condition;iteration
- {for-body}
- 特殊用法:能够遍历数组中的元素
- 语法:for(var in array) {for-body}
- 示例
[root@localhost ~]# awk '/^[[:space:]]*linux16/{for(i=1;i<=NF;i++) {print $i,length($i)}}' /etc/grub2.cfg
linux16 7
/vmlinuz-3.10.0-514.el7.x86_64 30
root=/dev/mapper/cl-root 24
ro 2
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
rhgb 4
quiet 5
LANG=en_US.UTF-8 16
net.ifnames=0 13
linux16 7
/vmlinuz-0-rescue-a8151f75d28c4b7ba1db0b5ad8c60cd6 50
root=/dev/mapper/cl-root 24
ro 2
crashkernel=auto 16
rd.lvm.lv=cl/root 17
rd.lvm.lv=cl/swap 17
rhgb 4
quiet 5
其他语句
- switch语句
- 语法:switch(expression) {case VALUE1 or /REGEXP/:
- statement1; case VALUE2 or /REGEXP2/: statement2;
- break和continue
- awk ‘BEGIN{sum=0;for(i=1;i<=100;i++)
- {if(i%2==0)continue;sum+=i}print sum}‘
- awk ‘BEGIN{sum=0;for(i=1;i<=100;i++)
- {if(i==66)break;sum+=i}print sum}‘
- 示例
[root@localhost ~]# awk -F: '{if($3%2!=0) next; print $1,$3}' /etc/passwd
root 0
daemon 2
lp 4
shutdown 6
mail 8
games 12
ftp 14
systemd-network 192
polkitd 998
libstoragemgmt 996
rpc 32
rtkit 172
geoclue 994
gdm 42
nfsnobody 65534
ntp 38
sshd 74
tcpdump 72
mageedu 1000
AWK数组
- 关联数组:array[index-expression]
- index-expression:
- 可使用任意字符串;字符串要使用双引号括起来
- 如果某数组元素事先不存在,在引用时,awk会自动创建此元素,并将其值初始化为“空串”
- 若要判断数组中是否存在某元素,要使用“index in array”格式进行遍历
- 示例一
- 数组非常绕好好看
[root@localhost ~]# awk 'BEGIN{weekdays["mon"]="Monday";weekdays["tue"]="Tuesday";print weekdays["mon"]}'
Monday