一、awk的概念:
Awk它是行处理器。是一种样式扫描与处理工具,与sed和grep很相似。
二、awk的处理过程:
依次对每一行进行处理,然后输出。
三、Awk命令形式:
1、awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file
2、[-F|-f|-v] 大参数,-F指定分隔符,-f调用脚本,-v定义变量 var=value
3、 ' ' 引用代码块
4、BEGIN 初始化代码块,在对每一行进行处理之前,初始化代码,主要是引用全局变量,设置FS分隔符
5、// 匹配代码块,可以是字符串或正则表达式
6、{} 命令代码块,包含一条或多条命令
7、; 多条命令使用分号分隔
8、END 结尾代码块,在对每一行进行处理之后再执行的代码块,主要是进行最终计算或输出结尾摘要信息
四、Awk的特殊要点:
l $0 表示整个当前行
l $1 每行第一个字段
l NF 字段数量变量
l NR 每行的记录号,多文件记录递增
l FNR 与NR类似,不过多文件记录不递增,每个文件都从1开始
l \t 制表符
l \n 换行符
l FS BEGIN时定义分隔符
l RS 输入的记录分隔符, 默认为换行符(即文本是按一行一行输入)
l ~ 匹配,与==相比不是精确比较
l !~ 不匹配,不精确比较
l == 等于,必须全部相等,精确比较
l != 不等于,精确比较
l && 逻辑与
l || 逻辑或
l + 匹配时表示1个或1个以上
l /[0-9][0-9]+/ 两个或两个以上数字
l /[0-9][0-9]*/ 一个或一个以上数字
l FILENAME 文件名
l OFS 输出字段分隔符, 默认也是空格,可以改为制表符等
l ORS 输出的记录分隔符,默认为换行符,即处理结果也是一行一行输出到屏幕
l -F'[:#/]' 定义三个分隔符
五、print & $0
print 是awk打印指定内容的主要命令
awk '{print}' /etc/passwd == awk '{print $0}' /etc/passwd
awk '{print " "}' /etc/passwd //不输出passwd的内容,而是输出相同个数的空行,进一步解释了awk是一行一行处理文本
awk '{print "a"}' /etc/passwd //输出相同个数的a行,一行只有一个a字母
awk -F":" '{print $1}' /etc/passwd
awk -F: '{print $1; print $2}' /etc/passwd //将每一行的前二个字段,分行输出,进一步理解一行一行处理文本
awk -F: '{print $1,$3,$6}' OFS="\t" /etc/passwd //输出字段1,3,6,以制表符作为分隔符
六、-F指定分隔符
$1 指指定分隔符后,第一个字段,$3第三个字段, \t是制表符
一个或多个连续的空格或制表符看做一个定界符,即多个空格看做一个空格
awk -F":" '{print $1}' /etc/passwd
awk -F":" '{print $1 $3}' /etc/passwd //$1与$3相连输出,不分隔
awk -F":" '{print $1,$3}' /etc/passwd //多了一个逗号,$1与$3使用空格分隔
awk -F":" '{print $1 " " $3}' /etc/passwd //$1与$3之间手动添加空格分隔
awk -F":" '{print "Username:" $1 "\t\t Uid:" $3 }' /etc/passwd //自定义输出
awk -F: '{print NF}' /etc/passwd //显示每行有多少字段
awk -F: '{print $NF}' /etc/passwd //将每行第NF个字段的值打印出来
awk -F: 'NF==4 {print }' /etc/passwd //显示只有4个字段的行
awk -F: 'NF>2{print $0}' /etc/passwd //显示每行字段数量大于2的行
awk '{print NR,$0}' /etc/passwd //输出每行的行号
awk -F: '{print NR,NF,$NF,"\t",$0}' /etc/passwd //依次打印行号,字段数,最后字段值,制表符,每行内容
awk -F: 'NR==5{print}' /etc/passwd //显示第5行
awk -F: 'NR==5 || NR==6{print}' /etc/passwd //显示第5行和第6行
route -n|awk 'NR!=1{print}' //不显示第一行
面试题目:
将/data/oldboy中的oldboy.txt文件内容:”inet addr:10.0.0.255 Mask:255.255.255.0”(不包含引号)通过命令过滤只输出如下内容:10.0.0.8 10.0.0.255 255.255.255.0
提示:本题NR是行号,分隔符+号匹配,[]里一个或多个任意一个分隔符,这里就是匹配一个或多个冒号或空格。
1)awk -F 后面跟分隔符‘[空格:]+’,其中[空格:]多分隔符写法,意思是以空格或冒号做分隔,后面的"+"号是正则表达式,意思是匹配前面空格或冒号,两者之一的1个或1个以上。
2)NR==2和sed -n "2p",相当,意思都是选择第几行,例:
[root@oldboy ~]# ifconfig eth0|awk NR==2
inet addr:10.0.0.185 Bcast:10.0.0.255 Mask:255.255.255.0
3)指定awk -F '[ :]+'分隔符后,不同字符串被分隔的列依次为:
4)整个答案awk部分意思是,通过NR==2取出第二行,然后,通过-F '[-:]+多分隔符正则匹配,然后通过{print $4}打印出第四列 !