如何在 Go 中逐字符读取文件（高效处理大 JSON 文件）

聖光之護

发布时间：2026-03-11 15:54:14

360人浏览过

来源于php中文网

原创

如何在 Go 中逐字符读取文件（高效处理大 JSON 文件）

本文介绍使用 bufio.Reader.ReadRune() 高效逐字符读取大文件的方法，避免内存溢出，适用于流式解析 JSON 等场景，并通过实测对比验证其性能优势。

本文介绍使用 `bufio.reader.readrune()` 高效逐字符读取大文件的方法，避免内存溢出，适用于流式解析 json 等场景，并通过实测对比验证其性能优势。

在处理大型 JSON 文件（如数十 MB）时，将整个文件加载进内存解析不仅浪费资源，还可能触发 OOM（Out-of-Memory）错误。此时，逐字符（更准确地说：逐 Unicode 码点，即 rune）流式读取成为关键策略。Go 标准库提供了轻量、可靠且语义清晰的方案——bufio.Reader.ReadRune()，它专为按 Unicode 字符安全读取而设计，能正确处理 UTF-8 多字节编码（如中文、俄文、emoji），无需手动解码。

以下是一个完整、可直接运行的示例，演示如何从字符串模拟的文件源中逐 rune 读取并打印：

IBM Watson

IBM Watson文字转语音

下载

package main

import (
    "bufio"
    "fmt"
    "io"
    "log"
    "strings"
)

var sampleJSON = `{"name":"张三","city":"北京","hobbies":["coding","☕"]}`

func main() {
    reader := bufio.NewReader(strings.NewReader(sampleJSON))

    for {
        r, size, err := reader.ReadRune()
        if err != nil {
            if err == io.EOF {
                break // 文件结束，正常退出
            }
            log.Fatal("读取字符时发生错误:", err)
        }
        // r 是 rune 类型（int32），size 是该 rune 在 UTF-8 中占用的字节数（1–4）
        fmt.Printf("rune: %q (U+%04X), bytes: %d\n", string(r), r, size)
    }
}

关键要点说明：

✅ ReadRune() 返回 rune、字节数 size 和 error，语义明确，一次调用完成一个逻辑字符的提取；
✅ 自动处理 UTF-8 编码边界，对 ASCII、中文、emoji 等均健壮；
✅ 底层基于缓冲（默认 4KB），I/O 效率高，实测性能优于 bufio.Scanner 配合 ScanRunes（前者平均耗时 0.65s，后者达 2.40s，测试样本为 23MB JSON）；
❌ 不要使用 ReadByte() 或 Read() + byte 切片——它们按字节操作，会破坏多字节字符，导致乱码或解析失败；
⚠️ 注意：rune 并非总是“视觉字符”（如组合字符、零宽连接符需额外处理），但对于标准 JSON 解析（仅需识别 {, }, :, " 等 ASCII 控制符及合法字符串内容）完全足够。

实际应用建议：
若用于自定义 JSON 流解析器，可结合状态机，根据当前 rune 类型（空格、引号、括号、数字、字母等）推进解析状态；同时务必检查 err == io.EOF 作为循环终止条件，其他 err（如 I/O 错误、损坏的 UTF-8）应视为异常并中断处理。此外，对超大文件，可进一步封装为带上下文取消（context.Context）和进度回调的迭代器，提升工程鲁棒性。

总之，bufio.Reader.ReadRune() 是 Go 中平衡简洁性、安全性与性能的首选方案——无需引入第三方库，开箱即用，精准满足“逐字符流式读取”的核心需求。

如何在Golang中使用Cond实现条件变量同步 Go语言sync.Cond使用详解

如何在Golang中格式化输出二进制与十六进制 Go语言fmt.Printf进制转换

如何在Golang中处理间接依赖Indirect Go语言go.mod文件维护细节

如何在Golang中实现数据库的分区策略Partitioning Go语言海量数据存储

如何在Golang中利用RabbitMQ解耦微服务 Go语言消息队列异步通信

相关标签:

go golang json EOF 封装 Error 字符串循环切片 ASCII

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在Golang中批量插入大量数据 Go语言SQL Bulk Insert优化下一篇：暂无

作者最新文章

如何在页面刷新后持久化保存复选框的选中状态

2026-03-09 13:20

Go 程序中 HTTP 连接复用导致内存持续增长的解决方案

2026-03-09 13:22

Python正则表达式中字符类内连字符（-）的位置规则详解

2026-03-09 13:24

一键启动！KiriGiri发布D加密虚拟机破解启动器

2026-03-09 13:33

Python中批量替换列表中所有匹配元素的正确方法

2026-03-09 13:41

如何在 Pandas 中安全获取首个存在的列值（避免 KeyError）

2026-03-09 13:54

如何在时间类中保留原始输入值以实现准确的总秒数计算

2026-03-09 13:56

《杀戮尖塔2》Steam峰值超57万成2026年首发最高游戏

2026-03-09 13:59

如何在单页中正确结合 AJAX 与 PHP 实现用户名实时校验

2026-03-09 14:01

壹心理如何提问

2026-03-09 14:15

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

golang如何定义变量

golang定义变量的方法：1、声明变量并赋予初始值“var age int =值”；2、声明变量但不赋初始值“var age int”；3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

210

2024.02.23

golang有哪些数据转换方法

golang数据转换方法：1、类型转换操作符；2、类型断言；3、字符串和数字之间的转换；4、JSON序列化和反序列化；5、使用标准库进行数据转换；6、使用第三方库进行数据转换；7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

247

2024.02.23

golang常用库有哪些

golang常用库有：1、标准库；2、字符串处理库；3、网络库；4、加密库；5、压缩库；6、xml和json解析库；7、日期和时间库；8、数据库操作库；9、文件操作库；10、图像处理库。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

356

2024.02.23

golang和python的区别是什么

golang和python的区别是：1、golang是一种编译型语言，而python是一种解释型语言；2、golang天生支持并发编程，而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

214

2024.03.05

golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型，并具有垃圾回收功能的开源编程语言，采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

409

2024.05.21

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

490

2025.06.09

golang相关判断方法

本专题整合了golang相关判断方法，想了解更详细的相关内容，请阅读下面的文章。

200

2025.06.10

golang数组使用方法

本专题整合了golang数组用法，想了解更多的相关内容，请阅读专题下面的文章。

1438

2025.06.17

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板