如何在 Pandas 中安全地将含缺失值的列转为 JSON 列表

心靈之曲

发布时间：2026-01-30 11:51:00

815人浏览过

来源于php中文网

原创

如何在 Pandas 中安全地将含缺失值的列转为 JSON 列表

将 pandas series 转为 json 字符串时，nan 值会导致 `json.dumps()` 报错（因 json 标准不支持 nan），需先剔除或替换缺失值；推荐使用 `dropna()` 清洗后再序列化。

在使用 Pandas 处理标识符（如股票代码、产品 ID）列并导出为 JSON 供下游系统（如 PostgreSQL 的 JSONB 查询、API 请求体）使用时，一个常见陷阱是：原始数据中存在缺失值（NaN），而 Python 的 json.dumps() 默认无法序列化 NaN——它会将其转为字符串 "NaN"，但该字符串不符合 RFC 7159 JSON 规范，导致数据库或服务端解析失败（如报错 Token "NaN" is invalid）。

正确做法是在序列化前彻底移除或标准化缺失值。最简洁、安全的方式是使用 .dropna()：

import json
import pandas as pd

# 示例数据
df = pd.DataFrame({
    'identifier': ['US00B8KQN827', 'US0530151036', 'CA82509L1076', None, 'GB00BH4HKS39', float('nan')]
})

# ✅ 正确：先丢弃 NaN/None，再转 JSON 列表
json_list = json.dumps(df['identifier'].dropna().tolist())
print(json_list)
# 输出: ["US00B8KQN827", "US0530151036", "CA82509L1076", "GB00BH4HKS39"]

⚠️ 注意事项：

Tome

先进的AI智能PPT制作工具

下载

dropna() 同时移除 None、numpy.nan 和 pandas.NA，兼容多种缺失值类型；
若需保留空字符串占位（而非删除），可用 fillna("") 替代，但需确保业务逻辑允许空字符串；
切勿使用 str.replace('NaN', '') 或正则清洗 JSON 字符串——这属于事后补救，易引入格式错误（如破坏嵌套结构或引号配对）；
在构建 SQL 查询（如 WHERE identifier IN (...)）时，建议进一步校验列表长度，避免空列表导致语法错误。

总结：JSON 序列化前的数据清洗应在 Pandas 层完成，df['col'].dropna().tolist() 是处理含缺失值标识符列转 JSON 的标准、高效且健壮的模式。

Python 字符串拼接的多种方式与性能对比

Python 上下文管理器的自定义实现

Python gc 模块的调试技巧

Python aiohttp 异步请求的实践指南

如何正确实现 Python 异步任务的依赖执行顺序

相关标签:

python js json 数据清洗 sql json numpy pandas Token 标识符字符串值类型 postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Google Cloud VM 上正确使用服务账号凭证访问自托管服务下一篇：如何正确模拟已实例化的类中方法的返回值

作者最新文章

Pinterest 裁员约 15%，探索采用开源 AI 模型降低开发成本

2026-01-29 16:12

如何用 Python 实现一个支持浮点结果的简易大小写敏感计算器

2026-01-29 16:20

Intel显卡战未来！官方确认：XeSS 3多帧生成下月支持B580

2026-01-29 16:25

猫眼电影如何添加电影收藏

2026-01-29 16:51

如何在 Jupyter Notebook 中正确导入自定义类

2026-01-29 16:53

恋小帮搜索话术怎么找

2026-01-29 16:57

如何在运行时通过全限定类名动态反序列化 JSON 并调用 save 方法

2026-01-29 16:59

脉脉怎么开会员-脉脉会员开通方法

2026-01-29 17:00

电脑端如何下载安装网易云音乐客户端

2026-01-29 17:07

美团外卖怎么用

2026-01-29 17:29

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

749

2023.10.12