0

0

如何在Linux中文件分割 Linux split按行分割

P粉602998670

P粉602998670

发布时间:2025-08-30 12:14:01

|

578人浏览过

|

来源于php中文网

原创

split命令可将大文件按行分割为小文件,使用-l指定行数、-d生成数字后缀,如split -l 1000 large.log part_ -d生成part_00、part_01等文件,便于并行处理,最后用cat合并。

如何在linux中文件分割 linux split按行分割

在Linux中,split 命令是一个非常实用的工具,用于将大文件分割成多个小文件。当你需要处理超大文本文件,比如日志文件或数据导出文件时,按行分割可以让你更方便地并行处理或传输。

split 命令基本语法

split 的基本格式如下:

split [选项] [输入文件] [前缀]

如果不指定输入文件,默认从标准输入读取。前缀是生成的小文件的名称前缀,不指定时默认为 xaxbxc 等。

按行数分割文件

使用 -l(lines)选项可以按指定行数分割文件。

例如,将文件 large.log 每 1000 行分割成一个新文件:

split -l 1000 large.log part_

这会生成如下文件:

  • part_aa
  • part_ab
  • part_ac
  • ...

每个文件包含 1000 行(最后一个可能不足)。

自定义输出文件后缀

默认情况下,split 使用两个字母作为后缀(aa, ab, ...)。你可以改为使用数字后缀,更便于排序和识别。

使用 -d 选项启用数字后缀:

甲骨文AI协同平台
甲骨文AI协同平台

专门用于甲骨文研究的革命性平台

下载
split -l 500 data.txt chunk_ -d

生成的文件为:

  • chunk_00
  • chunk_01
  • chunk_02
  • ...

如果你希望后缀位数更多,可以加上 --numeric-suffixes=--suffix-length=

限制输出文件大小(可选)

虽然你主要关注按行分割,但也可以结合文件大小控制。注意:不能同时使用 -l-b

例如,按 100MB 分割:

split -b 100M bigfile.tar.gz piece_

合并分割后的文件

分割后的文件可以通过 cat 命令还原:

cat part_* > restored_file.txt

确保文件顺序正确,使用通配符通常能按字母顺序合并。

基本上就这些。split 命令简单高效,特别适合在 shell 脚本中批量处理大文件。按行分割能保证每块数据结构完整,避免某条记录被截断。实际使用时,根据行数或文件数量需求调整参数即可。

相关专题

更多
treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

535

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

17

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

21

2026.01.06

length函数用法
length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度,以便在查询和处理字符串数据时进行操作和判断。 需要注意的是length函数计算的是字符串的字符数,而不是字节数。对于多字节字符集,一个字符可能由多个字节组成。因此,length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法,大家可以阅读本专题下面的文章。

922

2023.09.19

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1349

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

704

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

294

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

776

2023.07.05

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

19

2026.01.20

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.5万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号