0

0

解析非标准多对象JSON响应的Python教程

霞舞

霞舞

发布时间:2025-12-05 11:59:15

|

692人浏览过

|

来源于php中文网

原创

解析非标准多对象JSON响应的Python教程

本教程旨在解决接收到由多个独立json对象直接拼接而成,而非封装在数组或以逗号分隔的非标准json响应数据。我们将介绍一种基于行检测的python方法,通过识别相邻的`}`和`{`字符序列来精确分割并解析每个独立的json对象,从而有效处理此类特殊数据格式。

在数据交换中,JSON(JavaScript Object Notation)因其轻量级和易于解析的特性而广受欢迎。通常,当我们需要传输多个JSON对象时,它们会被封装在一个JSON数组中,例如 [{...}, {...}],或者以逗号分隔。然而,在某些特定场景下,我们可能会遇到一种非标准的JSON响应格式,即多个独立的JSON对象直接拼接在一起,既没有外部的数组方括号,也没有对象之间的逗号分隔符。这种格式 {...}{...} 无法直接使用标准的 json.loads() 方法进行解析,因为它不构成一个合法的JSON文档。

1. 理解非标准JSON响应格式

标准的JSON规范要求一个JSON文档要么是一个对象,要么是一个数组。当服务器返回多个JSON对象时,它们通常会像这样组织:

[
  {
    "id": 1,
    "name": "Object One"
  },
  {
    "id": 2,
    "name": "Object Two"
  }
]

然而,本教程所讨论的场景是接收到以下形式的数据:

{
"self": "https://example1.com",
"key": "keyOne",
"name": "nameOne",
"emailAddress": "mailOne",
"avatarUrls": {
  "48x48": "https://test.com/secure/useravatar?avatarId=1",
  "24x24": "https://test.com/secure/useravatar?size=small&avatarId=1",
  "16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=1",
  "32x32": "https://test.com/secure/useravatar?size=medium&avatarId=1"
},
"displayName": "displayNameOne",
"active": true,
"timeZone": "Europe",
"locale": "en_UK"
}
{
"self": "https://example2.com",
"key": "keyTwo",
"name": "nameTwo",
"emailAddress": "mailTwo",
"avatarUrls": {
  "48x48": "https://test.com/secure/useravatar?avatarId=2",
  "24x24": "https://test.com/secure/useravatar?size=small&avatarId=2",
  "16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=2",
  "32x32": "https://test.com/secure/useravatar?size=medium&avatarId=2"
},
"displayName": "displayNameTwo",
"active": false,
"timeZone": "Europe",
"locale": "en_US"
}

这种格式在Python中直接使用 json.loads() 会导致 json.JSONDecodeError,因为它被视为一个包含多个根级别元素的无效JSON字符串。

立即学习Python免费学习笔记(深入)”;

2. 基于行检测的解析策略

要成功解析这种非标准格式,我们需要一种方法来识别每个独立JSON对象的边界。观察上述数据结构,可以发现一个关键模式:一个JSON对象的结束标记 } 紧接着下一行就是下一个JSON对象的开始标记 {。我们可以利用这个特征来手动分割整个响应字符串。

核心思路如下:

  1. 将整个响应字符串按行分割成一个列表。
  2. 遍历这些行,寻找 } 字符出现在某一行,并且紧随其后的下一行是 { 字符。
  3. 当检测到这种模式时,意味着我们找到了一个JSON对象的结束和下一个JSON对象的开始,从而可以提取出当前已收集的行,将其拼接成一个完整的JSON字符串,并使用 json.loads() 进行解析。
  4. 重复此过程,直到所有对象都被解析。

3. Python实现步骤与代码示例

以下是使用Python实现此解析策略的详细步骤和代码:

首先,准备我们的非标准JSON数据:

data = '''
{
"self": "https://example1.com",
"key": "keyOne",
"name": "nameOne",
"emailAddress": "mailOne",
"avatarUrls": {
  "48x48": "https://test.com/secure/useravatar?avatarId=1",
  "24x24": "https://test.com/secure/useravatar?size=small&avatarId=1",
  "16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=1",
  "32x32": "https://test.com/secure/useravatar?size=medium&avatarId=1"
},
"displayName": "displayNameOne",
"active": true,
"timeZone": "Europe",
"locale": "en_UK"
}
{
"self": "https://example2.com",
"key": "keyTwo",
"name": "nameTwo",
"emailAddress": "mailTwo",
"avatarUrls": {
  "48x48": "https://test.com/secure/useravatar?avatarId=2",
  "24x24": "https://test.com/secure/useravatar?size=small&avatarId=2",
  "16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=2",
  "32x32": "https://test.com/secure/useravatar?size=medium&avatarId=2"
},
"displayName": "displayNameTwo",
"active": false,
"timeZone": "Europe",
"locale": "en_US"
}
'''

接下来是解析代码:

腾讯交互翻译
腾讯交互翻译

腾讯AI Lab发布的一款AI辅助翻译产品

下载
from json import loads, dumps

jlist = [] # 用于存储解析后的JSON对象
k = 0      # 标记当前JSON对象开始的行索引

# 将原始数据按行分割
lines = data.splitlines()

# 遍历所有行,查找对象边界
for i, line in enumerate(lines):
    # 检查当前行是否为 '{' 且前一行是否为 '}'
    # i > 0 确保不是第一行,避免索引越界
    if i > 0 and line.strip() == "{" and lines[i-1].strip() == "}":
        # 找到了一个对象边界,将从 k 到 i 的行拼接成一个JSON字符串并解析
        json_str_segment = "".join(lines[k:i])
        jlist.append(loads(json_str_segment))
        k = i # 更新 k 为新对象的起始行

# 处理最后一个JSON对象
# 循环结束后,从 k 到末尾的行构成了最后一个JSON对象
json_str_segment = "".join(lines[k:])
jlist.append(loads(json_str_segment))

# 打印解析后的每个JSON对象以验证
for j_obj in jlist:
    print(dumps(j_obj, indent=2, ensure_ascii=False))
    print("-" * 30) # 分隔符,便于查看

代码解释:

  • lines = data.splitlines(): 将多行字符串 data 分割成一个字符串列表,每个元素代表一行。
  • for i, line in enumerate(lines): 使用 enumerate 同时获取行索引 i 和行内容 line。
  • if i > 0 and line.strip() == "{" and lines[i-1].strip() == "}": 这是核心的边界检测逻辑。
    • i > 0: 确保我们不是在处理第一行,因为需要比较 lines[i-1]。
    • line.strip() == "{": 检查当前行去除空白后是否为 {。
    • lines[i-1].strip() == "}": 检查前一行去除空白后是否为 }。
    • .strip() 方法用于移除行首和行尾的空白字符,增加了对数据格式中可能存在的额外空白的容错性。
  • json_str_segment = "".join(lines[k:i]): 当检测到边界时,将从 k(当前JSON对象起始行)到 i(当前JSON对象结束行,但不包含 i)的所有行拼接起来,形成一个完整的JSON字符串。
  • jlist.append(loads(json_str_segment)): 使用 json.loads() 解析拼接好的字符串,并将其添加到 jlist 中。
  • k = i: 更新 k 为当前行的索引 i,表示下一个JSON对象将从这里开始。
  • json_str_segment = "".join(lines[k:]): 循环结束后,最后一部分数据(从 k 到 lines 列表的末尾)构成了最后一个JSON对象,需要单独解析。

4. 运行结果展示

执行上述代码后,你将看到每个独立的JSON对象都被正确解析并格式化打印出来:

{
  "self": "https://example1.com",
  "key": "keyOne",
  "name": "nameOne",
  "emailAddress": "mailOne",
  "avatarUrls": {
    "48x48": "https://test.com/secure/useravatar?avatarId=1",
    "24x24": "https://test.com/secure/useravatar?size=small&avatarId=1",
    "16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=1",
    "32x32": "https://test.com/secure/useravatar?size=medium&avatarId=1"
  },
  "displayName": "displayNameOne",
  "active": true,
  "timeZone": "Europe",
  "locale": "en_UK"
}
------------------------------
{
  "self": "https://example2.com",
  "key": "keyTwo",
  "name": "nameTwo",
  "emailAddress": "mailTwo",
  "avatarUrls": {
    "48x48": "https://test.com/secure/useravatar?avatarId=2",
    "24x24": "https://test.com/secure/useravatar?size=small&avatarId=2",
    "16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=2",
    "32x32": "https://test.com/secure/useravatar?size=medium&avatarId=2"
  },
  "displayName": "displayNameTwo",
  "active": false,
  "timeZone": "Europe",
  "locale": "en_US"
}
------------------------------

5. 注意事项与健壮性考量

  • 格式依赖性: 此方法高度依赖于 } 和 { 字符在独立行上且彼此相邻的特定模式。如果JSON对象内部的字符串值恰好包含 } 或 { 并在行尾/行首,或者 } 和 { 不在单独的行上(例如,{"a":1}{"b":2} 这种单行拼接),此方法可能需要调整甚至失效。

  • 空白字符: 代码中使用了 .strip() 来处理行首尾的空白,这增强了对格式变化的容错性。但如果 } 或 { 周围有其他非空白字符,则此方法将不适用。

  • 错误处理: json.loads() 在遇到任何无效的JSON片段时都会抛出 json.JSONDecodeError 异常。在生产环境中,强烈建议将 loads() 调用封装在 try-except 块中,以便优雅地处理可能出现的解析错误,例如:

    try:
        jlist.append(loads(json_str_segment))
    except json.JSONDecodeError as e:
        print(f"Error decoding JSON segment: {e}")
        print(f"Problematic segment: {json_str_segment}")
        # 可以选择跳过此段或进行其他错误处理
  • 性能: 对于非常大的文件,按行读取和拼接字符串可能会有一定的性能开销。但对于大多数常见的JSON响应大小,这种方法是高效且可接受的。

  • 替代方案: 如果数据格式更加复杂或不规则,例如 }{ 不总是出现在独立行上,或者对象之间有其他非JSON内容,那么可能需要更强大的文本处理工具,如正则表达式 (re 模块) 来匹配和提取每个JSON对象。

6. 总结

当面对非标准的多个JSON对象直接拼接的响应数据时,直接使用 json.loads() 是行不通的。通过分析其独特的结构特征,即 } 紧接着 { 的行模式,我们可以设计一个基于行检测的Python解析策略。此方法能够有效地将整个响应字符串分割成独立的、可解析的JSON片段,从而成功提取出所有数据。在实际应用中,务必考虑数据格式的稳定性和可能出现的异常情况,并添加相应的错误处理机制,以确保程序的健壮性。理解并适应各种数据格式是处理外部数据时的关键技能。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

457

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

547

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

335

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

530

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

258

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

766

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

219

2023.08.11

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.4万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号