0

0

awk工具详解

絕刀狂花

絕刀狂花

发布时间:2025-07-21 11:40:15

|

1015人浏览过

|

来源于php中文网

原创

大家好,欢迎再次光临,我是你们的老朋友全栈君。

目录

awk简介

awk的工作原理

awk命令的使用格式

awk简介

AWK是一种专门用于处理文本文件的编程语言,是一个功能强大的文本分析工具。它旨在进行文本处理工作,通常用于扫描、过滤和统计汇总数据,这些数据可以来自标准输入、管道或文件。

awk的工作原理(1):

在读取第一行时,AWK会根据条件进行匹配,并执行相应的操作,然后继续处理下一行数据。默认情况下,不会自动输出数据。如果没有指定匹配条件,AWK会默认匹配所有行。它有一个隐含的循环,条件匹配的次数就是操作执行的次数。

awk的工作原理(2):

AWK逐行读取文本文件,默认以空格或制表符作为分隔符,将每一行分成多个字段,并将这些字段存储在内建变量中,根据模式或条件执行编辑命令。sed命令常用于处理整行,而AWK更倾向于将一行分割成多个“字段”后进行处理。AWK读取信息也是逐行进行的,处理结果可以通过print功能将字段数据显示出来。在使用AWK命令时,可以使用逻辑操作符“&&”表示“与”,“||”表示“或”,“!”表示“非”;还可以进行简单的数学运算,如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方。

awk命令的使用格式

awk选项 ‘模式或条件{操作}’ 文件1 文件2 ...

awk -f 脚本文件 文件1 文件2 ...

格式: awk关键字 选项 命令部分 '{xxxx}' 文件名

AWK包含几个特殊的内建变量(可以直接使用),如下所示:

FS:指定每行文本的字段分隔符,默认为空格或制表符。

NF:当前处理行的字段数量。

NR:当前处理行的行号。

$0:当前处理行的整行内容。

$n:当前处理行的第n个字段(第n列)。

FILENAME:被处理的文件名。

RS:行分隔符。AWK从文件读取数据时,会根据RS的定义将数据分割成多条记录,而AWK一次仅读入一条记录进行处理。默认值是'\n'。

简说:数据记录分隔,默认为\n,即每行为一条记录。

案例

awk工具详解awk工具详解awk工具详解awk工具详解AWK常用的内置变量包括:$1、$2、NF、NR、

$1:代表第一列,$2:代表第二列,以此类推。

$0:代表整行,NF:一行的列数。

NR:行数。

案例:

awk工具详解awk工具详解awk工具详解awk -F: 'NR==10{print $1}' zz ##打印第10行第一列

awk -F : '{print $NF}' zz ##打印最后一列

awk 'END{print NR}' zz ##打印总行数

awk 'END{print $0}' zz ##打印最后一整行内容

awk工具详解生产案例:

awk工具详解在逐行执行之前和之后执行特定任务,可以使用BEGIN和END关键字。

BEGIN通常用于初始化操作,只在读取数据记录之前执行一次;END通常用于汇总操作,只在读取完数据记录之后执行一次。

awk工具详解AWK的运算:

awk工具详解模糊匹配,用~表示包含,!~表示不包含。

awk -F: '$1~/root/' zz ##包含root的所有行

awk -F: '$7!~/nologin/{print $1,$7}' zz ##打印除了以nologin结尾的第一列和第七列

关于数值与字符串的比较

比较符号:== != >

案例:

awk -F: '$3==0' zz ##打印第三列等于0的行

awk 'NR==5{print}' zz ##打印第五行

商汤商量
商汤商量

商汤科技研发的AI对话工具,商量商量,都能解决。

下载

awk 'NR

awk -F: '$1=="root"' zz ##打印第一列有root的行

awk -F: '$3>=1000' /etc/passwd ##打印第三列大于等于1000的行

awk -F: '$3=1000' /etc/passwd ##打印第三列小于10或者大于等于1000的所有行

awk -F: '$3>10 && $3

awk 'NR>2 && NR

seq 200 | awk '$1%7==0 && $1~/7/' ##打印200内被7整除并且包含7的所有数字

其他内置变量的用法FS、OFS、NR、FNR、RS、ORS

案例:

awk 'BEGIN{FS=":"}{print $1}' zz ##打印之前定义字段分隔符为冒号

awk 'BEGIN{FS=":";OFS="--"} {print $1,$2}' zz ##OFS定义了输出时以什么分隔,$1和$2中间要用逗号分隔,因为逗号默认被映射为OFS变量,而这个变量默认是空格

awk '{print FNR,$0}' /etc/hosts /etc/passwd ##可以看出FNR的行号在追加当有多个文件时

awk 'BEGIN{RS=":"}{print $0}' zz ##打印出以冒号换行输出

awk 'BEGIN{ORS=" "}{print $0}' zz ##把多行合并成一行输出,输出的时候自定义以空格分隔每行,本来默认的是回车键

AWK的高级用法

定义引用变量

a=100

awk -v b="$a" 'BEGIN{print b}' ##将系统的变量a,在AWK里赋值为变量b,然后调用变量b

awk 'BEGIN{print "'$a'"}' ##直接调用的话需要先用双引号再用单引号

awk -v c=50 'BEGIN{print c}' ##AWK直接定义变量引用

调用函数getline,读取一行数据的时候并不是得到当前行而是当前行下一行

案例:

df -h | awk 'BEGIN{getline}/dev\/sda3/{print $0}'

[root@localhost ky17]# seq 12 | awk '{getline;print $0}' 24681012[root@localhost ky17]# seq 12 | awk '{print $0;getline}' 1357911

if语句:AWK的if语句也分为单分支、双分支和多分支

单分支为if() {}

双分支为if() {} else {}

多分支为if() {} else if() {} else {}

案例:

awk工具详解AWK还支持for循环、while循环、函数、数组等

案例:

awk 'BEGIN{x=0};/\/bin\/bash$/ {x++;print x,$0};END {print x}' /etc/passwd

统计以/bin/bash结尾的行数,等同于

grep -c "/bin/bash$" /etc/passwdBEGIN模式表示,在处理指定的文本之前,需要先执行BEGIN模式中指定的动作;AWK再处理指定的文本,之后再执行END模式中指定的动作,END{}语句块中,往往会放入打印结果等语句

awk工具详解awk -F ":" '!($3

awk 'BEGIN {FS=":"}; {if($3>=1000){print}}' /etc/passwd ##先处理完BEGIN的内容,再打印文本里面内容

awk -F ":" '{max=($3>=$4) ? $3:$4; {print max}}' /etc/passwd (了解)#($3>$4)?$3:$4三元运算符,如果第3个字段的值大于等于第4个字段的值,则把第3个字段的值赋给max,否则第4个字段的值赋给max

awk工具详解awk -F ":" '$7~/bash/{print $1}' zz ##输出以冒号分隔且第7个字段中包含/bash行的第一字段

awk -F ":" '($1~/root/) && (NF==7) {print $1,$2,$NF}' /etc/passwd ##第1个字段中包含root且有7个字段的行的第1/2个字段

awk -F ":" '($7!="/bin/bash") && ($7!="/sbin/nologin/"){print}' /etc/passwd ##/etc/passwd输出第7个字段既不为/bin/bash,也不为/sbin/nologin的所有行#输出第7个字段既不为/bin/bash,也不为/sbin/nologin的所有行

awk -F ":" '($NF != "/bin/bash")&&($NF!="/sbin/nologin"){print NR,$0}' /etc/passwd ##跟上面一样效果

通过管道、双引号调用shell命令:echo $PATH | awk 'BEGIN{RS=":"};END {print NR}'

统计以冒号分隔的文本段落数,END{}语句块中,往往会放入打印结果等语句echo $PATH | awk 'BEGIN{RS=": "}; {print NR,$0}; END{print NR}'

awk -F: '/bash$/{print "wc -l"}'/etc/passwd #调用wc -l命令统计使用bash的用户个数,

等同于grep -c "bash$" etc/passwdawk -F: '/bash$/ {print }' passwd | wc -l

发布者:全栈程序员栈长,转载请注明出处:https://www.php.cn/link/da502cff136c2848905d8c0e169ba278

相关专题

更多
html版权符号
html版权符号

html版权符号是“©”,可以在html源文件中直接输入或者从word中复制粘贴过来,php中文网还为大家带来html的相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

616

2023.06.14

html在线编辑器
html在线编辑器

html在线编辑器是用于在线编辑的工具,编辑的内容是基于HTML的文档。它经常被应用于留言板留言、论坛发贴、Blog编写日志或等需要用户输入普通HTML的地方,是Web应用的常用模块之一。php中文网为大家带来了html在线编辑器的相关教程、以及相关文章等内容,供大家免费下载使用。

655

2023.06.21

html网页制作
html网页制作

html网页制作是指使用超文本标记语言来设计和创建网页的过程,html是一种标记语言,它使用标记来描述文档结构和语义,并定义了网页中的各种元素和内容的呈现方式。本专题为大家提供html网页制作的相关的文章、下载、课程内容,供大家免费下载体验。

470

2023.07.31

html空格
html空格

html空格是一种用于在网页中添加间隔和对齐文本的特殊字符,被用于在网页中插入额外的空间,以改变元素之间的排列和对齐方式。本专题为大家提供html空格的相关的文章、下载、课程内容,供大家免费下载体验。

245

2023.08.01

html是什么
html是什么

HTML是一种标准标记语言,用于创建和呈现网页的结构和内容,是互联网发展的基石,为网页开发提供了丰富的功能和灵活性。本专题为大家提供html相关的各种文章、以及下载和课程。

2895

2023.08.11

html字体大小怎么设置
html字体大小怎么设置

在网页设计中,字体大小的选择是至关重要的。合理的字体大小不仅可以提升网页的可读性,还能够影响用户对网页整体布局的感知。php中文网将介绍一些常用的方法和技巧,帮助您在HTML中设置合适的字体大小。

506

2023.08.11

html转txt
html转txt

html转txt的方法有使用文本编辑器、使用在线转换工具和使用Python编程。本专题为大家提供html转txt相关的文章、下载、课程内容,供大家免费下载体验。

312

2023.08.31

html文本框代码怎么写
html文本框代码怎么写

html文本框代码:1、单行文本框【<input type="text" style="height:..;width:..;" />】;2、多行文本框【textarea style=";height:;"></textare】。

426

2023.09.01

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

19

2026.01.20

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.5万人学习

swoole入门物联网开发与实战
swoole入门物联网开发与实战

共15课时 | 1.2万人学习

swoole项目实战(第二季)
swoole项目实战(第二季)

共15课时 | 1.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号