0

0

生成带有正确转义单斜杠的 JSON 文件:Python 实现指南

花韻仙語

花韻仙語

发布时间:2025-10-04 14:07:26

|

1012人浏览过

|

来源于php中文网

原创

生成带有正确转义单斜杠的 JSON 文件:Python 实现指南

本教程详细介绍了如何使用 Python 的 json 模块生成一个特殊的 JSON 结构,其中某个字段的值是另一个经过 JSON 序列化且包含单斜杠转义的字符串。文章解释了常见双反斜杠问题的根源,并提供了一种分步序列化的解决方案,确保内部 JSON 字符串的引号被正确转义为单反斜杠,以满足特定数据处理(如 BigQuery GIS)的需求。

引言:理解 GeoJSON 嵌入需求

在处理地理空间数据时,我们有时会遇到需要将 geojson 几何对象作为字符串嵌入到另一个 json 对象中的情况。具体来说,目标结构可能要求 geometry 字段的值是一个字符串,该字符串本身是有效的 geojson 几何对象的 json 表示,并且其中的双引号需要用单个反斜杠进行转义。例如,从以下 python 字典表示的 geojson 几何:

{"type": "LineString", "coordinates": [[25.4907, 35.29833], [25.49187, 35.28897]]}

我们希望最终的 JSON 文件中 geometry 字段的值是:

"{"type": "LineString", "coordinates": [[25.4907, 35.29833], [25.49187, 35.28897]]}"

而不是:

"{\"type\": \"LineString\", \"coordinates\": [[25.4907, 35.29833], [25.49187, 35.28897]]}"

后者是 Python json 模块在对一个已经包含转义反斜杠的字符串进行再次序列化时常见的行为。

问题解析:Python json 模块的转义行为

当使用 json.dumps() 或 json.dump() 方法将 Python 对象序列化为 JSON 字符串时,如果对象中包含字符串值,并且这些字符串本身包含需要转义的特殊字符(如双引号 "、反斜杠 等),json 模块会按照 JSON 规范进行转义。

立即学习Python免费学习笔记(深入)”;

问题的核心在于,如果我们将一个包含双引号的原始字符串(例如 {"type": "LineString", ...})直接赋值给一个字典字段,然后对整个字典进行 json.dumps(),Python 会将这个字符串视为一个普通的 Python 字符串。当 json.dumps() 遇到这个字符串中的双引号时,它会将其转义为 "。如果这个字符串中已经包含反斜杠(例如,我们尝试手动添加 "),那么 json.dumps() 还会将这些反斜杠本身也转义,导致出现 \"。

例如,如果 obj['geometry'] 的值是 "{"type": "LineString"}",当对其进行 json.dumps() 时,它会将其中的 转义为 ,导致输出 {"type": "LineString"}。这并不是我们想要的结果。

PathFinder
PathFinder

AI驱动的销售漏斗分析工具

下载

解决方案:分步序列化策略

解决这个问题的关键在于理解 json.dumps() 应该作用于哪个层次。我们需要的不是手动在字符串中添加反斜杠,而是让 json 模块在正确的时间点自动完成转义。正确的策略是分两步进行序列化:

  1. 首先,将内部的 GeoJSON 几何对象(作为 Python 字典)序列化为一个 JSON 字符串。 这一步会生成一个没有额外反斜杠的 JSON 字符串,例如 {"type": "LineString", ...}。
  2. 然后,将这个 JSON 字符串作为值,赋给外部 JSON 结构中的相应字段。 当对外部结构进行最终的 json.dumps() 时,json 模块会识别到这个值是一个字符串,并正确地将其中包含的双引号转义为 "。

代码示例

假设我们有一个 GeoJSON 几何对象,我们希望将其嵌入到另一个 JSON 结构中:

import json
from pathlib import Path

# 原始的 GeoJSON 几何对象(作为 Python 字典)
original_geometry_data = {
    "type": "LineString",
    "coordinates": [[25.4907, 35.29833], [25.49187, 35.28897]],
}

# 步骤 1: 将内部几何对象序列化为 JSON 字符串
# 这一步会得到像 '{"type": "LineString", "coordinates": [[...]]}' 这样的字符串
geometry_as_string = json.dumps(original_geometry_data)

# 步骤 2: 构建包含该字符串的外部字典
# 现在 geometry_as_string 是一个普通的 Python 字符串,
# 它的内容是 GeoJSON 的 JSON 表示。
# 当 dict_to_write 被序列化时,json.dumps 会正确地转义 geometry_as_string 中的双引号。
dict_to_write = {"geometry": geometry_as_string}

# 将最终的字典写入 JSON 文件
output_filepath = Path("result.json")
with output_filepath.open(mode="w", encoding="utf-8") as fp:
    json.dump(dict_to_write, fp, indent=2, ensure_ascii=False)

print(f"JSON 文件已生成至: {output_filepath.resolve()}")

# 验证输出内容
with output_filepath.open(mode="r", encoding="utf-8") as fp:
    print("
生成的 JSON 文件内容:")
    print(fp.read())

运行上述代码,result.json 文件的内容将是:

{
  "geometry": "{"type": "LineString", "coordinates": [[25.4907, 35.29833], [25.49187, 35.28897]]}"
}

这正是我们所期望的,geometry 字段的值是一个字符串,其中的双引号都用单个反斜杠进行了转义。

实际应用场景:BigQuery GIS 数据加载

这种特定的 JSON 格式在某些数据加载场景中非常有用,尤其是在将 GeoJSON 数据导入到支持地理信息系统 (GIS) 的数据库(如 Google BigQuery GIS)时。根据 BigQuery GIS 的要求,有时需要将地理几何信息作为 GEOGRAPHY 数据类型加载,而这通常涉及到将几何部分作为字符串嵌入到更大的 JSON 结构中。通过上述分步序列化方法,可以确保数据以 BigQuery 能够正确解析的格式进行传输。

注意事项与最佳实践

  • 理解 JSON 规范: 深入理解 JSON 字符串中转义字符的规则是避免此类问题的关键。" 是 JSON 中表示双引号的正确转义方式。
  • json.dumps() 参数:
    • indent: 用于美化输出,使其更具可读性。在生产环境中,为节省空间通常不使用缩进。
    • ensure_ascii=False: 如果 JSON 字符串中包含非 ASCII 字符(如中文),设置为 False 可以避免这些字符被转义为 uXXXX 形式。
  • 数据源处理: 如果原始数据是从 API 获取的 GeoJSON 格式,它通常已经是 Python 字典或列表的形式。直接操作这些 Python 对象,而不是尝试对原始 JSON 字符串进行文本替换,是更健壮的方法。
  • 错误排查: 当遇到意外的转义行为时,逐层检查 json.dumps() 的输入和输出,有助于定位问题。

通过掌握这种分步序列化策略,您可以有效地处理复杂的 JSON 结构,确保数据按照特定需求进行精确的格式化和转义,从而满足各种数据处理和集成场景的要求。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

457

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

549

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

337

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

338

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

225

2025.10.31

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

138

2026.02.12

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号