0

0

Python教程:高效将JSON中的字典列表写入CSV文件

心靈之曲

心靈之曲

发布时间:2025-12-14 10:50:12

|

965人浏览过

|

来源于php中文网

原创

Python教程:高效将JSON中的字典列表写入CSV文件

本教程旨在指导用户如何使用python高效地将包含字典列表的json数据转换为结构化的csv文件。文章详细介绍了从理解复杂json数据结构到利用强大的pandas库进行数据处理和导出的完整流程,包括示例代码和最佳实践,确保数据能够准确、清晰地写入csv的每一行。

引言

在数据处理和系统集成中,JSON(JavaScript Object Notation)是一种广泛使用的数据交换格式。然而,当需要将这些数据导入到电子表格或数据库中时,CSV(Comma Separated Values)文件格式更为常见。对于简单的扁平化JSON字典,将其键值对直接写入CSV行相对直接。但当JSON数据结构变得复杂,特别是当它包含一个字典列表时,传统的csv模块可能需要更多的手动迭代和处理。本教程将重点介绍如何优雅且高效地处理这种“字典列表”类型的JSON数据,并将其转换为规范的CSV文件。

理解数据结构:从单一字典到字典列表

在处理JSON数据时,首先要明确其结构。最初,您可能遇到的是一个扁平的JSON字典,例如:

{
    "id": 1702,
    "subnet": "10.111.0.0",
    "mask": "21",
    "description": "POD"
    // ... 其他键值对
}

对于这种结构,可以直接提取其键作为CSV的标题行,值作为数据行。

然而,更常见且复杂的情况是,JSON数据中包含一个键,其值是一个字典列表,例如来自API的响应通常会以这种形式返回多个记录:

立即学习Python免费学习笔记(深入)”;

{
    "data": [
        {"id": 1713, "subnet": "10.111.0.0", "mask": "27", "description": "POD_Site"},
        {"id": 1714, "subnet": "10.111.0.32", "mask": "27", "description": "POD_Site"},
        {"id": 1715, "subnet": "10.111.0.64", "mask": "27", "description": "POD_Site"}
    ]
}

在这种结构中,"data"是一个键,其对应的值是一个列表,而列表的每个元素又是一个独立的字典。我们的目标是让CSV文件中的每一行对应这个列表中的一个字典,字典的键成为CSV的列头,值成为对应列的数据。

解决方案:使用Pandas库

Python的pandas库是处理和分析数据的强大工具,它提供了DataFrame这一核心数据结构,非常适合处理表格型数据。DataFrame能够直接从字典列表构建,并提供了便捷的方法将数据导出到CSV文件,极大地简化了这一过程。

实现步骤

1. 导入必要的库

首先,我们需要导入pandas库。如果您的环境中尚未安装,可以使用pip install pandas进行安装。

import pandas as pd
import json # 如果数据是从JSON字符串加载而来

2. 准备JSON数据

假设我们从API或其他来源获取了一个JSON字符串,并将其解析为Python字典。我们需要定位到包含字典列表的部分。

怪兽AI数字人
怪兽AI数字人

数字人短视频创作,数字人直播,实时驱动数字人

下载
# 模拟从API获取的JSON响应
raw_json_data = """
{
    "data": [
        {"id": 1713, "subnet": "10.111.0.0", "mask": "27", "sectionId": 3, "description": "POD_Site", "linked_subnet": null, "firewallAddressObject": null, "vrfId": null, "masterSubnetId": 1702, "allowRequests": 0, "vlanId": null, "showName": 0, "device": null, "permissions": "{\\"4\\":\\"3\\"}", "pingSubnet": 0, "discoverSubnet": 0, "resolveDNS": 0, "DNSrecursive": 0, "DNSrecords": 0, "nameserverId": 0, "scanAgent": 0, "customer_id": null, "isFolder": 0, "isFull": 0, "isPool": 0, "tag": 2, "threshold": 0, "location": null, "editDate": null, "lastScan": null, "lastDiscovery": null},
        {"id": 1714, "subnet": "10.111.0.32", "mask": "27", "sectionId": 3, "description": "POD_Site", "linked_subnet": null, "firewallAddressObject": null, "vrfId": null, "masterSubnetId": 1702, "allowRequests": 0, "vlanId": null, "showName": 0, "device": null, "permissions": "{\\"4\\":\\"3\\"}", "pingSubnet": 0, "discoverSubnet": 0, "resolveDNS": 0, "DNSrecursive": 0, "DNSrecords": 0, "nameserverId": 0, "scanAgent": 0, "customer_id": null, "isFolder": 0, "isFull": 0, "isPool": 0, "tag": 2, "threshold": 0, "location": null, "editDate": null, "lastScan": null, "lastDiscovery": null},
        {"id": 1715, "subnet": "10.111.0.64", "mask": "27", "sectionId": 3, "description": "POD_Site", "linked_subnet": null, "firewallAddressObject": null, "vrfId": null, "masterSubnetId": 1702, "allowRequests": 0, "vlanId": null, "showName": 0, "device": null, "permissions": "{\\"4\\":\\"3\\"}", "pingSubnet": 0, "discoverSubnet": 0, "resolveDNS": 0, "DNSrecursive": 0, "DNSrecords": 0, "nameserverId": 0, "scanAgent": 0, "customer_id": null, "isFolder": 0, "isFull": 0, "isPool": 0, "tag": 2, "threshold": 0, "location": null, "editDate": null, "lastScan": null, "lastDiscovery": null}
    ]
}
"""
parsed_json = json.loads(raw_json_data)

# 提取包含字典列表的部分
data_for_csv = parsed_json["data"]

在实际应用中,parsed_json可能直接是您的API响应对象,或者通过json.loads(res.content)等方式获得。关键是识别出那个包含列表的键(在本例中是"data"),并获取其值。

3. 创建Pandas DataFrame

有了字典列表data_for_csv,创建DataFrame就非常简单了。pandas的DataFrame构造函数可以直接接受一个字典列表,并自动将每个字典转换为一行,字典的键作为列名。

df = pd.DataFrame(data_for_csv)

此时,df就是一个结构化的表格数据,包含了原始JSON数据中的所有信息。您可以通过print(df.head())查看前几行数据,确认其结构。

4. 将DataFrame写入CSV文件

DataFrame对象提供了一个to_csv()方法,用于将数据导出到CSV文件。

df.to_csv('ipamsubnet.csv', index=False, encoding='utf-8')
  • 'ipamsubnet.csv':指定输出文件的名称。
  • index=False:这是一个非常重要的参数。默认情况下,to_csv()会将DataFrame的索引(通常是0, 1, 2...)写入CSV文件的第一列。如果您不希望在CSV中包含这个索引列,务必将其设置为False。
  • encoding='utf-8':推荐指定编码,以避免在处理包含非ASCII字符(如中文、特殊符号)的数据时出现乱码问题。

完整示例代码

将以上步骤整合,形成一个完整的代码示例:

import pandas as pd
import json

# 模拟从API获取的JSON响应字符串
raw_json_data = """
{
    "data": [
        {"id": 1713, "subnet": "10.111.0.0", "mask": "27", "sectionId": 3, "description": "POD_Site", "linked_subnet": null, "firewallAddressObject": null, "vrfId": null, "masterSubnetId": 1702, "allowRequests": 0, "vlanId": null, "showName": 0, "device": null, "permissions": "{\\"4\\":\\"3\\"}", "pingSubnet": 0, "discoverSubnet": 0, "resolveDNS": 0, "DNSrecursive": 0, "DNSrecords": 0, "nameserverId": 0, "scanAgent": 0, "customer_id": null, "isFolder": 0, "isFull": 0, "isPool": 0, "tag": 2, "threshold": 0, "location": null, "editDate": null, "lastScan": null, "lastDiscovery": null},
        {"id": 1714, "subnet": "10.111.0.32", "mask": "27", "sectionId": 3, "description": "POD_Site", "linked_subnet": null, "firewallAddressObject": null, "vrfId": null, "masterSubnetId": 1702, "allowRequests": 0, "vlanId": null, "showName": 0, "device": null, "permissions": "{\\"4\\":\\"3\\"}", "pingSubnet": 0, "discoverSubnet": 0, "resolveDNS": 0, "DNSrecursive": 0, "DNSrecords": 0, "nameserverId": 0, "scanAgent": 0, "customer_id": null, "isFolder": 0, "isFull": 0, "isPool": 0, "tag": 2, "threshold": 0, "location": null, "editDate": null, "lastScan": null, "lastDiscovery": null},
        {"id": 1715, "subnet": "10.111.0.64", "mask": "27", "sectionId": 3, "description": "POD_Site", "linked_subnet": null, "firewallAddressObject": null, "vrfId": null, "masterSubnetId": 1702, "allowRequests": 0, "vlanId": null, "showName": 0, "device": null, "permissions": "{\\"4\\":\\"3\\"}", "pingSubnet": 0, "discoverSubnet": 0, "resolveDNS": 0, "DNSrecursive": 0, "DNSrecords": 0, "nameserverId": 0, "scanAgent": 0, "customer_id": null, "isFolder": 0, "isFull": 0, "isPool": 0, "tag": 2, "threshold": 0, "location": null, "editDate": null, "lastScan": null, "lastDiscovery": null}
    ]
}
"""

# 1. 解析JSON字符串为Python字典
parsed_json = json.loads(raw_json_data)

# 2. 提取包含字典列表的"data"键的值
data_to_process = parsed_json["data"]

# 3. 使用Pandas创建一个DataFrame
df = pd.DataFrame(data_to_process)

# 4. 将DataFrame写入CSV文件,不包含索引列,并指定UTF-8编码
output_filename = 'ipamsubnet.csv'
df.to_csv(output_filename, index=False, encoding='utf-8')

print(f"数据已成功写入到 {output_filename}")

运行上述代码后,您将在脚本所在的目录下找到一个名为ipamsubnet.csv的文件。打开该文件,您会看到每个字典对应CSV中的一行,并且所有键都作为列标题。

注意事项与最佳实践

  1. 处理缺失键(Missing Keys):如果字典列表中的某些字典缺少某个键,Pandas会自动在对应的列中填充NaN(Not a Number),这在CSV中通常显示为空白。
  2. 数据清洗与转换:在将数据写入CSV之前,您可能需要对DataFrame进行进一步的数据清洗、格式化或转换操作。Pandas提供了丰富的函数和方法来完成这些任务,例如处理日期时间、数值转换、字符串操作等。
  3. 错误处理:在实际应用中,应考虑文件写入可能失败的情况(如权限问题、磁盘空间不足等),并添加适当的try-except块来捕获和处理这些异常。
  4. 大型数据集:对于非常大的JSON数据集,Pandas能够高效处理。但如果内存成为瓶颈,可以考虑分块读取JSON或使用其他流式处理方法。
  5. 嵌套字典/列表:如果字典列表中某个字典的值本身又是嵌套的字典或列表,Pandas默认会将其作为单个字符串写入CSV单元格。如果需要将这些嵌套结构扁平化为更多列,则需要额外的预处理步骤(例如,使用json_normalize函数)。

总结

通过本教程,我们学习了如何利用Python的pandas库高效地将包含字典列表的复杂JSON数据转换为结构化的CSV文件。pandas.DataFrame的强大功能和to_csv()方法的便捷性,使得这一常见的数据处理任务变得异常简单和直观。掌握这一技巧,将大大提升您在处理各种数据源时的效率和灵活性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

420

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

536

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

313

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

77

2025.09.10

Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

71

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

1

2026.01.31

pip安装使用方法
pip安装使用方法

安装步骤:1、确保Python已经正确安装在您的计算机上;2、下载“get-pip.py”脚本;3、按下Win + R键,然后输入cmd并按下Enter键来打开命令行窗口;4、在命令行窗口中,使用cd命令切换到“get-pip.py”所在的目录;5、执行安装命令;6、验证安装结果即可。大家可以访问本专题下的文章,了解pip安装使用方法的更多内容。

340

2023.10.09

更新pip版本
更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容,请阅读专题下面的文章。

416

2024.12.20

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

54

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 4.4万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 2.6万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号