linux怎么使用awk命令_linux处理结构化数据【命令】

尼克

发布时间：2026-03-15 16:10:48

603人浏览过

来源于php中文网

原创

awk按列提取字段默认以空格或制表符分隔，$1为第一列，$NF为最后一列；非空格分隔需用-F指定，如-F','处理CSV；特殊字符分隔符要转义；可加NF条件跳过空行；字符串比较须加引号；匹配前可清理空格或转小写；正则匹配更灵活；多条件用&&或||并加括号；累加用sum+=$n和END块；多行日志需重定义RS或手动拼接；复杂场景（如JSON、UTF-8中文）建议换工具。

linux怎么使用awk命令_linux处理结构化数据【命令】

awk怎么按列提取字段

默认用空格或制表符分隔，$1 是第一列，$NF 是最后一列。别硬记列号，先用 awk '{print NF}' file 看实际有多少列。

字段分隔符不是空格？加 -F 参数：awk -F',' '{print $2}' data.csv（处理 CSV）
分隔符含特殊字符（如竖线 |），要转义：awk -F'\|' '{print $3}' log.txt
想跳过空行？加条件：awk 'NF {print $1}' file（NF 非零才执行）
注意：$0 是整行，$1 到 $NF 才是字段，$NF+1 不会报错但值为空字符串

awk匹配某列等于某个值再处理

别写成 awk '$3 == "error" {print}' 就完事——字符串比较必须带引号，数字可以不带，但混用容易出错。

匹配失败常见原因：字段前后有空格？加 gsub(/^ +| +$/, "", $3) 清理，或直接用 $3 ~ /^error$/
大小写敏感？用小写转换：tolower($2) == "warn"
正则匹配更灵活：awk '$4 ~ /202[4-9]/ {print $1, $4}' access.log（匹配 2024–2029 年）
多个条件用 && 或 ||，别漏括号：awk '($2 > 100) && ($3 ~ /success/)' data

awk计算和累加时变量没生效

awk 每行执行一次脚本块，变量默认不跨行保留——但其实会保留，问题常出在作用域或初始化时机。

In3D

把真人变成化身，创建逼真且可自定义的虚拟角色

下载

累加总和？直接写：awk '{sum += $5} END {print sum}' data.txt（END 块只在最后执行一次）
想统计非空行数？别用 NR（它包含空行），改用 NR > 0 && NF > 0 判断，或用 FNR 处理多文件
浮点精度问题：printf "%.2f\n", $1/$2 比 print $1/$2 更可控
变量未声明就用？awk 允许，但值为 "" 或 0，容易掩盖逻辑错误；建议显式初始化：BEGIN {total=0}

awk处理多行或跨行日志的坑

标准 awk 按行读取，遇到换行符就切分——而有些日志一条记录占多行（比如 Java 异常堆栈）。这时不能靠 $0 直接匹配。

把多行合并成一条：用 RS（记录分隔符）重定义，比如以时间戳开头为新记录：awk 'BEGIN{RS="^[0-9]{4}-[0-9]{2}-[0-9]{2}"} {print}' log（注意需 GNU awk 支持正则 RS）
更兼容的做法：用 /^20/ {if (buf) print buf; buf=$0; next} {buf = buf "\n" $0} END{print buf}' 手动拼接
性能提醒：大文件里频繁字符串拼接（buf = buf "\n" $0）可能变慢，优先考虑 RS 方案或换 perl
注意：NR 和 FNR 在多行模式下仍按物理行计数，不是逻辑记录数

真正麻烦的是字段嵌套（比如 JSON 片段混在日志里）或编码不一致（UTF-8 含中文时 substr 计算字节偏移出错）——这时候 awk 就该让位了，别硬扛。

相关标签:

perl json print if Error printf 字符串栈堆作用域 linux gnu Access

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：linux怎么安装dotnet_linux配置netcore环境【实战】下一篇：Linux如何配置静态IP地址以防止IP变动？（网络基础）

作者最新文章

composer怎么安装爬虫插件_composer怎么配置网页抓取库【手册】

2026-03-15 14:54

linux怎么安装网卡驱动_linux编译安装硬件驱动【教程】

2026-03-15 14:56

腾讯文档怎么生成分享海报腾讯文档怎么自定义分享样式【分享】

2026-03-15 14:56

win10怎么更改电脑休眠后的唤醒壁纸 win10个性化锁屏图片【分享】

2026-03-15 15:08

谷歌浏览器标签页分组怎么用？Chrome管理多个标签页【教学】

2026-03-15 15:11

composer如何导出所有类名_利用composer生成类映射表【笔记】

2026-03-15 15:14

如何在Composer中使用--apcu-autoloader开启缓存优化？（性能加速）

2026-03-15 15:16

Excel怎么提取身份证信息_Excel文本函数应用【步骤】

2026-03-15 15:19

今日头条怎么提现到银行卡今日头条怎么绑定收款账户信息【方案】

2026-03-15 15:21

C++ short int加法溢出规律 C++ short运算规则【原理】

2026-03-15 15:28

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23