Linux文件内容统计_wc与sort实战

舞夢輝影

发布时间：2026-03-14 10:28:49

575人浏览过

来源于php中文网

原创

wc 和 sort 是 Linux 中轻量高效的内容统计与排序工具，wc 统计行数、单词数、字节数及最长行长度，sort 支持数值、逆序、多列、去重及自定义分隔符排序，二者配合管道可完成日志分析、高频词提取等任务。

linux文件内容统计_wc与sort实战

wc 和 sort 是 Linux 中最常用、最轻量的内容统计与排序工具。它们不依赖额外安装，配合管道使用，能快速完成日志分析、代码行数统计、高频词提取等任务。

用 wc 快速统计文件基础信息

wc 默认输出三列：行数、单词数、字节数。常用选项有：

-l：仅统计行数（适合查日志条目、配置项数量）
-w：仅统计单词数（按空白符分隔，可用于粗略估算文本量）
-c：仅统计字节数（比 du 更精准，不含元数据）
-L：显示最长一行的字符数（排查超长日志或格式异常）

例如：wc -l /var/log/syslog 查看系统日志总行数；wc -L *.py 找出所有 Python 文件中最长的一行。

用 sort 对文本内容做多维排序

sort 默认按 ASCII 码升序排列，但实际中常需控制排序逻辑：

-n：按数值大小排序（避免 10 排在 2 前面）
-r：逆序（降序），常与 -n 联用，如 sort -nr
-k：指定按第几列排序（如 sort -k3,3n 表示只按第 3 列数值排序）
-u：去重（配合 sort | uniq 更推荐用 sort -u，效率更高）
-t：指定字段分隔符（如 sort -t: -k3,3n /etc/passwd 按 UID 数值排序用户）

wc + sort 组合实战：找日志里访问最多的 IP

假设 Nginx 日志格式为：192.168.1.100 - - [10/Jan/2024:08:30:12] "GET /index.html"

Otter.ai

一个自动的会议记录和笔记工具，会议内容生成和实时转录

下载

提取第一列 IP：awk '{print $1}' access.log
统计各 IP 出现次数：awk '{print $1}' access.log | sort | uniq -c
按次数倒序排列：awk '{print $1}' access.log | sort | uniq -c | sort -nr
取前 5 名：awk '{print $1}' access.log | sort | uniq -c | sort -nr | head -5

这个流程本质是：切分 → 归类 → 计数 → 排序 → 截取。wc 不直接参与计数，但可辅助验证，比如 wc -l access.log 看总请求数，再和 uniq -c | wc -l 对比，判断是否有大量单一 IP 请求。

小技巧：处理空行、空白符干扰

真实数据常含空行或首尾空格，影响统计结果：

过滤空行：grep -v '^$' 或 awk 'NF'
去掉每行首尾空格：awk '{$1=$1};1'（利用赋值触发重格式化）
统计非空行数：grep -v '^$' file.txt | wc -l
查看某列是否全数字（防 -n 排序出错）：awk '{print $3}' data.txt | grep -v '^[0-9]\+$'

不复杂但容易忽略。

Linux磁盘空间监控_磁盘告警方案设计

Linux进程无法结束原因_kill失效问题分析

Linux环境下查看进程内线程运行状态的常用命令行工具

Linux反向代理部署_代理优化技巧

Linux云磁盘抖动_云存储性能排查

相关标签:

linux nginx print sort var ASCII linux Access

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux系统利用Slabtop查看内核缓存对进程性能的影响下一篇：暂无

作者最新文章

如何办理签证?办理签证最全流程

2026-03-11 11:26

SQL长事务优化_事务拆分与锁控制技巧

2026-03-11 11:28

Linux用户文件无法访问_权限继承问题分析

2026-03-11 13:31

Linux网络异常排查_route与ARP分析

2026-03-11 13:49

Linux日志审计如何实施_安全审计实践思路

2026-03-11 13:55

SQL视图性能问题_视图查询优化方法

2026-03-11 14:03

Adobe如何拆分PDF Adobe PDF页面拆分操作指南

2026-03-11 14:04

腾讯会议电脑如何投屏

2026-03-11 14:08

PHP PDO 安全机制面试考点

2026-03-11 14:35

Linux CPU任务优先级调整_nice优化策略

2026-03-11 14:49

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

nginx 重启

nginx重启对于网站的运维来说是非常重要的，根据不同的需求，可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容，供大家免费下载体验。

248

2023.07.27

nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件，可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大，允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

522

2023.08.04

nginx配置详解

NGINX与其他服务类似，因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章，大家可以免费学习。

610

2023.08.04

tomcat和nginx有哪些区别

tomcat和nginx的区别：1、应用领域；2、性能；3、功能；4、配置；5、安全性；6、扩展性；7、部署复杂性；8、社区支持；9、成本；10、日志管理。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

244

2024.02.23

nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误，表明服务器无法找到请求资源，可以通过以下步骤解决：1. 检查文件是否存在且路径正确；2. 检查文件权限并更改为 644 或 755；3. 检查 nginx 配置，确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

714

2024.07.09