如何在 Go 中逐字符读取文件

霞舞

发布时间：2026-03-11 17:16:02

236人浏览过

来源于php中文网

原创

如何在 Go 中逐字符读取文件

本文介绍在 Go 中高效逐字符（rune）读取大文件的三种主流方法，重点推荐 bufio.Reader.ReadRune() 方案，并通过实测对比性能与代码简洁性，适用于 JSON 等流式解析场景。

本文介绍在 go 中高效逐字符（rune）读取大文件的三种主流方法，重点推荐 `bufio.reader.readrune()` 方案，并通过实测对比性能与代码简洁性，适用于 json 等流式解析场景。

在处理大型 JSON 文件等场景时，避免将整个文件加载到内存中至关重要。Go 的字符串和文本处理以 Unicode rune 为基本单位（而非字节），因此“逐字符读取”实际应理解为“逐 rune 读取”，以正确支持 UTF-8 编码的多字节字符（如中文、俄文、emoji 等）。Go 标准库提供了多种方式实现该需求，其中最直接、高效且语义清晰的是 bufio.Reader.ReadRune() 方法。

✅ 推荐方案：bufio.Reader.ReadRune()

ReadRune() 每次调用返回一个 rune、其 UTF-8 编码字节数（size）及错误。它内部自动处理 UTF-8 解码，无需手动拼接字节，API 简洁，性能优异（实测 23 MB 文件耗时仅 0.65 秒）。以下是完整示例：

package main

import (
    "bufio"
    "fmt"
    "io"
    "log"
    "os"
)

func readRuneByRune(filename string) error {
    file, err := os.Open(filename)
    if err != nil {
        return fmt.Errorf("failed to open %s: %w", filename, err)
    }
    defer file.Close()

    reader := bufio.NewReader(file)
    for {
        r, size, err := reader.ReadRune()
        if err != nil {
            if err == io.EOF {
                break // 正常结束
            }
            return fmt.Errorf("read rune failed: %w", err)
        }
        // 示例：打印字符及其 UTF-8 字节长度
        fmt.Printf("rune: %q (size: %d)\n", string(r), size)
    }
    return nil
}

func main() {
    if len(os.Args) < 2 {
        log.Fatal("usage: go run main.go <filename>")
    }
    if err := readRuneByRune(os.Args[1]); err != nil {
        log.Fatal(err)
    }
}

? 注意：ReadRune() 返回的 rune 是 int32 类型，需用 string(r) 转为可显示字符串；size 表示该 rune 在原始字节流中占用的字节数（1–4），对调试或流控有参考价值。

纳米漫剧流水线
360推出的国内首个工业级AI漫剧生产平台

下载

⚠️ 其他方案对比与注意事项

bufio.Scanner + ScanRunes 分割器
虽然可行（调用 scanner.Split(bufio.ScanRunes) 后循环 scanner.Scan()），但每次迭代需额外调用 scanner.Bytes() 或 scanner.Text()，引入切片分配开销，实测比 ReadRune() 慢约 3.7 倍（2.40 s vs 0.65 s），且代码更冗长，不推荐用于纯逐 rune 场景。
io.ReadFull / file.Read() 逐字节读取
❌ 绝对避免：无法正确处理 UTF-8 多字节字符，会导致乱码（如将中文拆成多个无效字节），违背“逐字符”本意。
内存与错误处理要点
- ReadRune() 是流式操作，内存占用恒定（仅缓冲区大小，默认 4KB），天然适合超大文件；
- 务必区分 io.EOF（正常结束）与其他 error（如磁盘 I/O 错误、编码损坏），不可一概而论；
- 若需回退一个 rune（例如解析器需要 peek），可使用 reader.UnreadRune(r)，但注意 UnreadRune 最多支持一次未读取。

总结

对于需要流式、低内存、正确 Unicode 支持的逐字符处理任务，bufio.Reader.ReadRune() 是 Go 中最平衡的选择：性能最优、代码最简、语义最准。它既规避了全量加载的风险，又避免了底层字节操作的复杂性，是构建高性能 JSON 流解析器、日志分析器或自定义文本处理器的理想基石。

如何在Golang中实现一个简单的负载均衡算法 Go语言轮询与加权随机

如何在Golang中实现基于时间的重试策略 Go语言指数退避算法

Golang桥接模式实现跨平台的UI组件库设计

Golang中的代码覆盖率对性能压测的影响 Go语言测试与性能的平衡

如何在Golang中应用中介者模式实现聊天室广播 Go语言并发消息路由

相关标签:

go golang json EOF String Error 字符串循环切片

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在Golang中处理OPTIONS预检请求 Go语言CORS复杂跨域配置下一篇：暂无

作者最新文章

如何在网页中正确禁用默认右键菜单并显示自定义上下文菜单

2026-03-09 14:23

如何在 HTML 输入框中安全显示含双引号的 PHP 变量值

2026-03-09 14:25

如何正确使用 Go 的 syscall.Exec 调用 Git 命令

2026-03-09 14:40

如何在 ProGuard 中保留 Kotlin 的 @Throws 注解

2026-03-09 14:43

如何在 Go 中将多个 JSON 字段名映射到同一结构体字段？

2026-03-09 14:47

抖音平台券退款能退回吗？抖音平台券退款了,但是退款了

2026-03-09 14:53

抖音音频如何提取？如何提取视频中的音频

2026-03-09 15:05

如何动态访问嵌套 JSON 中变动的键名对象

2026-03-09 15:18

抖音等级账号出售怎么弄？一个人可以注册几个抖音账号

2026-03-09 15:19

百度搜索栏vscode怎么做

2026-03-09 15:41

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

golang如何定义变量

golang定义变量的方法：1、声明变量并赋予初始值“var age int =值”；2、声明变量但不赋初始值“var age int”；3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

210

2024.02.23

golang有哪些数据转换方法

golang数据转换方法：1、类型转换操作符；2、类型断言；3、字符串和数字之间的转换；4、JSON序列化和反序列化；5、使用标准库进行数据转换；6、使用第三方库进行数据转换；7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

247

2024.02.23

golang常用库有哪些

golang常用库有：1、标准库；2、字符串处理库；3、网络库；4、加密库；5、压缩库；6、xml和json解析库；7、日期和时间库；8、数据库操作库；9、文件操作库；10、图像处理库。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

356

2024.02.23

golang和python的区别是什么

golang和python的区别是：1、golang是一种编译型语言，而python是一种解释型语言；2、golang天生支持并发编程，而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

214

2024.03.05

golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型，并具有垃圾回收功能的开源编程语言，采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

409

2024.05.21

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

490

2025.06.09

golang相关判断方法

本专题整合了golang相关判断方法，想了解更详细的相关内容，请阅读下面的文章。

200

2025.06.10

golang数组使用方法

本专题整合了golang数组用法，想了解更多的相关内容，请阅读专题下面的文章。

1438

2025.06.17

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板