0

0

Sublime如何快速删除重复行?(文本处理技巧)

冰火之心

冰火之心

发布时间:2026-02-22 17:46:02

|

941人浏览过

|

来源于php中文网

原创

sublime text 自带功能不能直接去重;需用正则匹配重复行后剪切,或安装 text pastry 插件执行 remove duplicates 命令实现可靠去重。

sublime如何快速删除重复行?(文本处理技巧)

Sublime Text 自带功能能去重吗?

不能直接去重,但自带的 Sort Lines 功能配合手动操作可以间接实现——前提是重复行必须相邻。真实文本里重复行往往散落各处,这时候靠排序再删相邻项不仅费时,还容易漏删或误删。

用正则 + Find All 快速标记所有重复行

核心思路是:先找出“后面还出现过”的某一行,把它选中,再一次性删除。关键在正则写法和操作顺序:

  • 打开 Find → Find...Ctrl+F),勾选 Regular ExpressionWhole Line
  • 输入正则:^(.*$)\n(?=.*^\1$) —— 它匹配“后面还有完全相同行”的当前行(含换行符)
  • Find All,所有可被删除的重复行(保留第一个)会被高亮选中
  • Ctrl+X 剪切,就完成了去重

注意:\1 是反向引用,^$ 确保整行匹配;如果文本含空行或首尾空格不一致,这个正则会失效。

装 Package Control 后用 Text Pastry 插件更稳

原生命令和正则对多行重复、跨段落、大小写混杂等情况支持弱。Text Pastry 插件提供 Remove Duplicates 命令,逻辑更可靠:

知元AI
知元AI

AI智能语音聊天 对讲问答 AI绘画 AI写作 AI创作助手工具

下载
  • 先装好 Package Control(没装的话搜 “Install Package Control sublime” 三分钟搞定)
  • Ctrl+Shift+P → 输入 Install Package → 搜 Text Pastry 并安装
  • 全选文本(Ctrl+A),再按 Ctrl+Shift+P → 输入 Remove Duplicates 回车

它默认保留首次出现的行,不依赖行序,也不吃空格/换行差异,比手写正则容错高得多。

为什么不用 Sort Lines + Unique?

因为 Sublime 的 Sort Lines 本身没有 Unique 选项。有人误以为排序后手动删相邻重复就行,但实际有三个坑:

  • 排序会打乱原始顺序,如果你依赖上下文位置(比如日志时间戳、配置项顺序),就不能用
  • Sort Lines 对中文、数字、特殊字符排序规则不直观,可能把 item10 排在 item2 前面
  • 没批量去重能力,只能靠眼睛扫,500 行文本里漏掉一两处重复几乎必然发生

真正省心的做法,是接受“去重 = 先标记再删”这个动作闭环,而不是幻想一键排序完事。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

404

2023.09.04

c语言编程软件有哪些
c语言编程软件有哪些

c语言编程软件有GCC、Clang、Microsoft Visual Studio、Eclipse、NetBeans、Dev-C++、Code::Blocks、KDevelop、Sublime Text和Atom。更多关于c语言编程软件的问题详情请看本专题的文章。php中文网欢迎大家前来学习。

617

2023.11.02

batoto漫画官网入口与网页版访问指南
batoto漫画官网入口与网页版访问指南

本专题系统整理batoto漫画官方网站最新可用入口,涵盖最新官网地址、网页版登录页面及防走失访问方式说明,帮助用户快速找到batoto漫画官方平台,稳定在线阅读各类漫画内容。

122

2026.02.25

Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法
Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法

本专题系统整理Steam官网最新可用入口,涵盖网页版登录地址、新用户注册流程、账号登录方法及官方游戏商店访问说明,帮助新手玩家快速进入Steam平台,完成注册登录并管理个人游戏库。

10

2026.02.25

TypeScript全栈项目架构与接口规范设计
TypeScript全栈项目架构与接口规范设计

本专题面向全栈开发者,系统讲解基于 TypeScript 构建前后端统一技术栈的工程化实践。内容涵盖项目分层设计、接口协议规范、类型共享机制、错误码体系设计、接口自动化生成与文档维护方案。通过完整项目示例,帮助开发者构建结构清晰、类型安全、易维护的现代全栈应用架构。

13

2026.02.25

Python数据处理流水线与ETL工程实战
Python数据处理流水线与ETL工程实战

本专题聚焦 Python 在数据工程场景下的实际应用,系统讲解 ETL 流程设计、数据抽取与清洗、批处理与增量处理方案,以及数据质量校验与异常处理机制。通过构建完整的数据处理流水线案例,帮助开发者掌握数据工程中的性能优化思路与工程化规范,为后续数据分析与机器学习提供稳定可靠的数据基础。

1

2026.02.25

Java领域驱动设计(DDD)与复杂业务建模实战
Java领域驱动设计(DDD)与复杂业务建模实战

本专题围绕 Java 在复杂业务系统中的建模与架构设计展开,深入讲解领域驱动设计(DDD)的核心思想与落地实践。内容涵盖领域划分、聚合根设计、限界上下文、领域事件、贫血模型与充血模型对比,并结合实际业务案例,讲解如何在 Spring 体系中实现可演进的领域模型架构,帮助开发者应对复杂业务带来的系统演化挑战。

1

2026.02.25

Golang 生态工具与框架:扩展开发能力
Golang 生态工具与框架:扩展开发能力

《Golang 生态工具与框架》系统梳理 Go 语言在实际工程中的主流工具链与框架选型思路,涵盖 Web 框架、RPC 通信、依赖管理、测试工具、代码生成与项目结构设计等内容。通过真实项目场景解析不同工具的适用边界与组合方式,帮助开发者构建高效、可维护的 Go 工程体系,并提升团队协作与交付效率。

18

2026.02.24

Golang 性能优化专题:提升应用效率
Golang 性能优化专题:提升应用效率

《Golang 性能优化专题》聚焦 Go 应用在高并发与大规模服务中的性能问题,从 profiling、内存分配、Goroutine 调度、GC 机制到 I/O 与锁竞争逐层分析。结合真实案例讲解定位瓶颈的方法与优化策略,帮助开发者建立系统化性能调优思维,在保证代码可维护性的同时显著提升服务吞吐与稳定性。

9

2026.02.24

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号