0

0

使用 Go 处理包含非 JSON 内容的 JSON 流

碧海醫心

碧海醫心

发布时间:2025-10-18 11:34:01

|

336人浏览过

|

来源于php中文网

原创

使用 go 处理包含非 json 内容的 json 流

本文介绍了如何使用 Go 语言处理从标准输入读取的 JSON 数据流,该数据流中 JSON 结构体之间穿插着非 JSON 字符串(例如 "end")。我们将探讨如何读取数据流,过滤掉非 JSON 内容,并将有效的 JSON 数据反序列化为 Go 结构体。

处理混合 JSON 和非 JSON 内容的数据流

在某些情况下,我们可能需要处理包含 JSON 数据和其他类型数据的混合数据流。例如,一个应用程序可能通过标准输入发送 JSON 结构体,并在每个结构体之后添加一个 "end" 字符串作为分隔符。Go 的 encoding/json 包默认情况下无法直接处理这种数据流,因为它期望输入是纯粹的 JSON 格式。

以下是一种处理这种情况的方法,它放弃了 json.Decoder,转而使用 io.Reader 和 json.Unmarshal:

示例代码

package main

import (
    "bytes"
    "encoding/json"
    "fmt"
    "os"
)

// MyStruct 定义了要反序列化的 JSON 结构
type MyStruct struct {
    Command string `json:"command"`
    ID      string `json:"id"`
    Msg     string `json:"msg,omitempty"` //omitempty 表示如果 Msg 字段为空,则在 JSON 中省略
}

func main() {
    // 创建一个缓冲区来保存流数据
    data := make([]byte, 5000)

    // 从 stdin 循环读取数据
    for {
        n, err := os.Stdin.Read(data)
        if err != nil {
            fmt.Println("Error reading from stdin:", err)
            return // 或者根据需要进行错误处理
        }

        // 查找换行符的索引,用于分隔 JSON 结构
        index := bytes.Index(data[:n], []byte("\n"))

        // 如果没有找到换行符,则继续读取更多数据
        if index == -1 {
            fmt.Println("No newline found, reading more data")
            continue
        }

        // 提取 JSON 数据部分
        jsonData := data[:index]

        // 创建 MyStruct 实例
        var myStruct MyStruct

        // 将 JSON 数据反序列化到 MyStruct
        err = json.Unmarshal(jsonData, &myStruct)
        if err != nil {
            fmt.Println("Error unmarshalling JSON:", err)
            continue // 或者根据需要进行错误处理
        }

        // 对 myStruct 进行操作
        fmt.Printf("Received: %+v\n", myStruct)

        // 移除已处理的数据和 "end\n" 字符串
        remainingData := data[index+len("\nend\n"):]
        copy(data, remainingData)

        // 重置 buffer 的剩余部分
        for i := len(remainingData); i < len(data); i++ {
            data[i] = 0
        }
    }
}

代码解释:

  1. 定义结构体: MyStruct 定义了要从 JSON 数据反序列化到的 Go 结构体。 json:"command" 等标记用于指定 JSON 字段与结构体字段之间的映射关系。
  2. 读取数据: 使用 os.Stdin.Read(data) 从标准输入读取数据到缓冲区 data 中。
  3. 查找分隔符: bytes.Index(data[:n], []byte("\n")) 查找换行符的索引,用于分隔 JSON 结构体和 end 字符串。 data[:n] 确保只在实际读取到的数据范围内查找。
  4. 提取 JSON 数据: jsonData := data[:index] 提取 JSON 数据部分。
  5. 反序列化 JSON: json.Unmarshal(jsonData, &myStruct) 将 JSON 数据反序列化到 MyStruct 结构体中。
  6. 错误处理: 代码包含错误处理逻辑,用于处理读取和反序列化过程中可能出现的错误。
  7. 移除已处理的数据: remainingData := data[index+len("\nend\n"):] 获取剩余未处理的数据,并将数据复制到 data 缓冲区的起始位置。 copy(data, remainingData) 确保数据不会丢失。
  8. 重置缓冲区: 将缓冲区中剩余部分重置为 0,避免旧数据干扰下一次读取。

编译并运行代码

将代码保存为 main.go,然后在终端中运行以下命令:

go run main.go

现在,你可以向标准输入发送包含 JSON 数据和 "end" 字符串的混合数据流。例如:

企业易站EES3.0 beta 1
企业易站EES3.0 beta 1

企业易站网站内容发布管理系统,根据国际最流行的B/S模式设计,同时采用了页面模板与域变量相结合的网站发布管理方式,企业能够很方便的使用这套软件轻松迅速地发布网站以及页面出来,包含了"系统管理"、"权限管理"、"网站发布"、"新闻发布"、"信息自动采集"、"流量统计"、"

下载
echo '{"command": "ack", "id": "1231231"}' | cat - && echo 'end' | cat - && echo '{"command": "fail", "id": "1231231"}' | cat - && echo 'end' | cat -

或者,你可以将数据存储在文件中,然后使用以下命令将文件内容重定向到程序的标准输入:

cat input.txt | go run main.go

其中 input.txt 包含以下内容:

{"command": "ack", "id": "1231231"}
end
{"command": "fail", "id": "1231231"}
end
{
    "command": "log",
    "msg": "hello world!"
}
end

程序将解析 JSON 数据并将其打印到控制台。

注意事项

  • 缓冲区大小: data := make([]byte, 5000) 定义了缓冲区的大小。你需要根据实际情况调整缓冲区的大小,以确保能够容纳完整的 JSON 结构体和分隔符。
  • 错误处理: 示例代码包含基本的错误处理,但在实际应用中,你可能需要更完善的错误处理机制,例如记录错误日志或采取其他补救措施。
  • 性能: 对于非常大的数据流,这种方法可能不是最有效的。在这种情况下,可以考虑使用流式 JSON 解析器,例如 github.com/json-iterator/go,它可以更有效地处理大型 JSON 数据。
  • 分隔符的灵活性: 代码假设分隔符始终是 "end\n"。如果分隔符可能发生变化,你需要修改代码以适应不同的分隔符。
  • 多余的 end 字符: 如果JSON数据中存在 end 字符,可能会导致解析错误。

总结

本文介绍了一种使用 Go 语言处理包含非 JSON 内容的 JSON 数据流的方法。通过使用 io.Reader 和 json.Unmarshal,我们可以灵活地读取数据流,过滤掉非 JSON 内容,并将有效的 JSON 数据反序列化为 Go 结构体。在实际应用中,你需要根据具体情况调整代码,例如缓冲区大小、错误处理和性能优化。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

419

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

535

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

311

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

77

2025.09.10

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1501

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

624

2023.11.24

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

158

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.6万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号