讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

首页 > 系统教程 > LINUX > 正文

LINUX的uniq命令如何正确使用_LINUX下文本去重前为何要先排序

下次还敢

发布： 2025-12-06 18:55:02

原创

439人浏览过

使用uniq去重前需先排序，因其仅处理相邻重复行。1. 通过sort file.txt | uniq实现完整去重；2. 直接用uniq input.txt output.txt去除连续重复行；3. 使用uniq -c统计每行出现次数，并可结合sort -nr按频次排序；4. 添加-i选项忽略大小写比较，需配合sort -f确保一致性；5. 利用-f N跳过前N个字段或-s N跳过前N字符，实现基于部分字段的去重，如sort -k2 file | uniq -f 1按第二字段去重。

linux的uniq命令如何正确使用_linux下文本去重前为何要先排序

如果您在处理大量文本数据时发现存在重复行，希望将其合并或统计出现次数，LINUX系统中的uniq命令是一个高效的工具。但需要注意的是，该命令仅能识别并处理相邻的重复行，因此在使用前通常需要先对文本进行排序。

本文运行环境：联想ThinkPad X1 Carbon，Ubuntu 22.04。

一、为何去重前必须先排序

uniq命令的工作机制决定了它只能检测连续的重复行。当相同的行分散在文件不同位置时，未排序的情况下，uniq会将它们视为独立条目。只有通过sort命令预先整理文本，使相同内容的行相邻排列，才能确保所有重复项被正确识别和处理。

1、执行sort file.txt可生成按字典序排列的输出结果。

2、将排序结果传递给uniq命令：sort file.txt | uniq，即可实现完整去重。

二、去除连续重复行

直接使用uniq命令可以删除相邻的重复行，保留每组重复行中的第一行。这种方法适用于已经排序过的数据。

1、输入uniq input.txt output.txt，从input.txt读取内容并将去重后结果写入output.txt。

2、若省略输出文件名，则结果会输出到标准输出设备（屏幕）。

3、注意：如果原始文件包含非连续的重复行，此方法无法完全去除所有重复项。

三、统计每行出现的次数

使用-c选项可以让uniq显示每一行出现的频次，便于分析数据分布情况。

1、运行uniq -c data.txt，将在每行前添加该行重复次数。

Sitekick

Sitekick

一个AI登陆页面自动构建器

Sitekick

121

Sitekick

2、输出格式为“数字行内容”，例如“3 apple”表示apple连续出现了三次。

3、结合sort命令可实现按频率排序：sort data.txt | uniq -c | sort -nr，其中-nr表示按数值逆序排列。

四、忽略大小写进行比较

在某些场景下，需将大写与小写字母视为相同内容进行去重。此时可通过-i选项实现不区分大小写的匹配。

1、执行sort -f input.txt | uniq -i，-f参数让sort也忽略大小写排序。

2、这样，“Hello”和“hello”会被当作同一行处理。

3、此操作特别适用于处理用户输入或日志记录等不规范文本。务必保证排序与去重阶段均忽略大小写，否则可能导致遗漏。

五、比较指定字段而非整行

有时只需根据行中某一部分（如第二列）判断是否重复，这时可用-f和-s选项跳过或截断字段。

1、使用-f N跳过前N个空白分隔的字段，例如uniq -f 1 log.txt表示忽略每行第一个字段。

2、使用-s N跳过每行前N个字符，适合固定格式的日志文件。

3、组合使用时，先跳字段再跳字符，例如sort -k2 file | uniq -f 1基于第二字段去重。

以上就是LINUX的uniq命令如何正确使用_LINUX下文本去重前为何要先排序的详细内容，更多请关注php中文网其它相关文章！

相关标签：

linux app ubuntu 工具联想 apple linux系统 thinkpad 排列 carbon sort input linux ubuntu

大家都在看：

LINUX的lsof命令实战_查看LINUX系统中文件被哪个进程占用 LINUX的SWAP分区是什么_详解LINUX虚拟内存的创建与优化 LINUX怎么修改系统的locale语言设置_Linux系统Locale语言修改方法 LINUX的sort命令高级技巧_LINUX下按数字、月份、版本号排序 LINUX如何使用cURL测试API接口_在LINUX命令行发送GET与POST请求

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：LINUX的strace与ltrace命令是什么_跟踪LINUX程序系统调用与库函数调用下一篇：没有了

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

“高开”和“低开”在币圈K线中意味着什么？

2025-12-06 21:07:39
为什么说“横有多长，竖有多高”？盘整时间和未来涨跌幅的关系是什么？

2025-12-06 21:08:14
币圈说的“画门”行情是什么样的？它是如何形成的？

2025-12-06 21:09:15
MACD柱状图的“面积”和“高度”有什么分析价值？

2025-12-06 21:10:10
网易云音乐网页版免登录入口网易云音乐在线直接听

2025-12-06 21:14:02
c++如何实现备忘录设计模式_c++ Memento模式与状态撤销

2025-12-06 21:21:07
如何在Windows上创建网络连接桥_将有线网络转为无线热点【网络技巧】

2025-12-06 21:23:35
MAC怎么设置一个只允许运行部分App的用户账户_MAC使用家长控制或屏幕使用时间进行限制

2025-12-06 21:52:52
Win10受保护的文件夹访问已阻止怎么办 Win10关闭勒索软件防护【设置】

2025-12-06 21:55:02
win11怎么管理可选功能 Win11安装或卸载画图/记事本等系统组件【详解】

2025-12-06 22:01:02

最新问题

LINUX的uniq命令如何正确使用_LINUX下文本去重前为何要先排序使用uniq去重前需先排序，因其仅处理相邻重复行。1.通过sortfile.txt|uniq实现完整去重；2.直接用uniqinput.txtoutput.txt去除连续重复行；3.使用uniq-c统计每行出现次数，并可结合sort-nr按频次排序；4.添加-i选项忽略大小写比较，需配合sort-f确保一致性；5.利用-fN跳过前N个字段或-sN跳过前N字符，实现基于部分字段的去重，如sort-k2file|uniq-f1按第二字段去重。

2025-12-06 18:55:02

438

LINUX的strace与ltrace命令是什么_跟踪LINUX程序系统调用与库函数调用使用strace和ltrace可分别跟踪程序的系统调用与库函数调用：1.strace通过捕获open、read等系统调用诊断文件、网络及权限问题，支持输出重定向（-o）、附加进程（-p）和过滤调用类型（-etrace=xxx）；2.ltrace用于监控malloc、printf等共享库函数调用，结合-f选项可追踪子进程，-e支持按函数名模式过滤，-o保存日志；3.综合使用strace-c和ltrace-c进行性能统计，定位高频或耗时操作，再通过过滤条件深入分析具体调用链，对比正常与异常状态下的返

2025-12-06 17:48:07

299

LINUX怎么查找文件_LINUX find命令使用详解 find命令用于在Linux中按路径、条件和动作查找文件。首先指定搜索路径如/home或.，然后通过表达式匹配文件名（-name/-iname）、类型（-typef/d/l等）、大小（-size+10M/-100K）或修改时间（-mtime-7/+30）等条件，最后执行-print（默认）、-delete或-exec命令操作。例如find/home-name"test.txt"查找指定文件，find.-name"*.log"-mtime+7-execgzip{}\;压缩7天前日志。使用-maxd

2025-12-06 15:50:42

683

LINUX如何查看系统版本信息_获取LINUX内核与发行版详情的命令汇总使用uname-r查看内核版本，cat/etc/os-release获取发行版信息。

2025-12-06 12:58:34

374

LINUX怎么开启SSH服务_LINUX远程连接配置方法首先安装OpenSSH服务端，Ubuntu/Debian执行sudoaptupdate&&sudoaptinstallopenssh-server，CentOS/RHEL/Fedora使用yum或dnf安装；然后启动并启用服务：sudosystemctlstartsshd和enablesshd（或ssh）；接着编辑/etc/ssh/sshd_config文件可修改端口、禁止root登录、指定允许用户；保存后重启服务sudosystemctlrestartsshd；确保防火墙放行端口，Ubuntu

2025-12-06 12:41:29

342

LINUX的jobs、fg、bg命令详解_LINUX前后台任务切换与管理首先使用jobs查看任务状态，通过fg将指定作业调回前台运行，用bg使暂停的任务在后台继续执行，可在命令后加&直接启动后台任务，最后用kill结合作业编号终止特定任务。

2025-12-06 12:36:07

350

LINUX的inode是什么，满了怎么办_Linux inode概念与管理方法 inode耗尽会导致无法创建新文件。通过df-i检查使用率，用du--inodes定位高占用目录，清理日志、缓存等小文件，必要时迁移数据或调整mkfs参数优化inode分配。

2025-12-06 10:51:06

448

LINUX系统如何进行备份与恢复_使用tar与rsync工具的LINUX数据保护策略使用tar进行完整备份，用rsync实现增量同步；先通过tar–czvf创建备份，再用rsync-avz更新，将数据存于外部或远程设备，并定期测试恢复以确保数据完整性与系统恢复能力。

2025-12-06 02:59:35

729

LINUX怎么卸载软件_LINUX删除已安装程序答案：Linux卸载软件需根据发行版和安装方式选择对应命令。Debian/Ubuntu用sudoaptremove或purge，CentOS/RHEL7及之前用yumremove，Fedora/CentOS8+用dnfremove，Snap安装的用snapremove，Flatpak安装的用flatpakuninstall，源码编译的可尝试makeuninstall或手动删除文件。

2025-12-05 13:13:02

121

LINUX的lsof命令实战_查看LINUX系统中文件被哪个进程占用首先使用lsof命令定位占用文件或目录的进程，再通过kill命令终止对应PID的进程以释放资源。具体步骤：1.用lsof/path/to/file查看指定文件被哪个进程占用；2.用lsof+D/mnt/data查找占用指定目录的所有进程；3.用lsof-pPID反向查询某进程打开的所有文件；4.用lsof-i:80检查指定端口占用情况；5.获取PID后执行kill-9PID终止进程，并重新验证文件是否已释放。

2025-12-05 12:12:06

989

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部