0

0

如何使用Golang实现文件流式读取与写入_Golang文件流式处理技巧

P粉602998670

P粉602998670

发布时间:2026-02-07 08:49:24

|

355人浏览过

|

来源于php中文网

原创

io.Copy 比 os.ReadFile 更适合大文件,因其用固定32KB缓冲区流式处理,内存恒定;而 os.ReadFile 会一次性加载全文件到内存,易导致 OOM。

如何使用golang实现文件流式读取与写入_golang文件流式处理技巧

为什么 io.Copyos.ReadFile 更适合大文件

因为 os.ReadFile 会一次性把整个文件加载进内存,1GB 文件就占 1GB 内存;而 io.Copy 默认用 32KB 缓冲区边读边写,内存占用恒定。实际项目中遇到 500MB 日志归档或视频转存时,直接 panic:out of memory 就是这么来的。

实操建议:

立即学习go语言免费学习笔记(深入)”;

  • 始终优先用 io.Copy 处理 >10MB 的文件
  • 若需自定义缓冲区大小(比如 SSD 上调高吞吐),传入带 io.CopyBuffer 的版本
  • 注意:源 io.Reader 和目标 io.Writer 都必须支持流式操作,不能是已关闭的 *os.File

如何安全地边读边处理(如 JSON 行解析)

常见错误是用 bufio.Scanner 读取超长行导致内存暴涨,或未检查 Err() 导致静默截断。正确做法是控制单次读取上限,并显式判断错误类型。

实操建议:

立即学习go语言免费学习笔记(深入)”;

  • scanner := bufio.NewScanner(file) 后立刻调 scanner.Buffer(make([]byte, 4096), 1 限制最大行长度
  • 每次 scanner.Scan() 后必须检查 scanner.Err(),尤其要区分 io.EOFbufio.ErrTooLong
  • 若处理的是结构化流(如 NDJSON),改用 json.DecoderDecode() 方法,它天然支持流式反序列化

os.OpenFile 的 flag 组合怎么选才不丢数据

误用 os.O_CREATE | os.O_WRONLY 而不加 os.O_TRUNC 会导致写入位置从文件开头开始覆盖,但旧数据尾部残留;加了 os.O_APPEND 又可能破坏原子性。日志轮转、断点续传这类场景极易出错。

Palette
Palette

在线生成整套UI调色板

下载

实操建议:

立即学习go语言免费学习笔记(深入)”;

  • 追加写入(如日志):只用 os.O_CREATE | os.O_WRONLY | os.O_APPEND,系统保证写入位置在末尾
  • 覆盖写入(如配置更新):必须显式加 os.O_TRUNC,且建议先写临时文件再 os.Rename
  • 断点续传:打开时用 os.O_CREATE | os.O_RDWR,再用 file.Seek(0, io.SeekEnd) 定位,避免依赖 os.O_APPEND 的竞态

流式压缩/解压时为何 gzip.NewReader 报 “invalid header”

典型原因是底层 reader 已被提前消费(比如用 io.Copy 读过前几个字节做 magic check),导致 gzip.NewReader 拿不到完整的 gzip header。这个问题在 HTTP body 解包、分片上传合并时高频出现。

实操建议:

立即学习go语言免费学习笔记(深入)”;

  • 永远不要对同一个 io.Reader 多次构造解压器;需要预检时,用 io.MultiReaderbytes.NewReader 复制 header 字节
  • 更稳妥的做法:用 gzip.NewReader(io.TeeReader(src, hashWriter)),把校验和计算和解压串在一起
  • 如果源是 *os.File,优先用 file.Seek(0, io.SeekStart) 重置偏移量,而不是反复创建新 reader

流式处理真正的难点不在 API 调用,而在边界条件——谁关文件、谁清缓冲、错误后偏移是否可恢复。这些细节不会报编译错误,但会让服务在线上跑三天后突然卡死。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

184

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

232

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

344

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

210

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

398

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

282

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

196

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

661

2025.06.17

Golang处理数据库错误教程合集
Golang处理数据库错误教程合集

本专题整合了Golang数据库错误处理方法、技巧、管理策略相关内容,阅读专题下面的文章了解更多详细内容。

2

2026.02.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.9万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号