Python DataFrame怎么变字典_to_dict()各种 orient 格式对比

P粉602998670

发布时间：2026-03-15 14:46:34

315人浏览过

来源于php中文网

原创

orient='dict'返回每列对应一个字典（键为索引、值为单元格），orient='list'返回每列对应一个列表；orient='records'按行转字典列表；orient='index'易因非字符串或重复索引引发KeyError；NaN需手动转None以防JSON序列化失败；大DF中orient='records'性能最差。

python dataframe怎么变字典_to_dict()各种 orient 格式对比

orient='dict' 和 orient='list' 最常用，但含义容易搞反

很多人以为 orient='dict' 是把 DataFrame 变成“字典”，orient='list' 是变成“列表”——其实完全相反：orient='dict' 的结果是每个列对应一个字典（键是索引，值是单元格），而 orient='list' 才是每个列对应一个 Python 列表。

实际用法取决于你后续怎么取数：要按列名快速查某行所有字段？选 orient='records'；要按索引查某列所有值？orient='dict' 更直接。

orient='dict' → 返回 {'col_a': {0: val1, 1: val2}, 'col_b': {0: val3, 1: val4}}
orient='list' → 返回 {'col_a': [val1, val2], 'col_b': [val3, val4]}
orient='records' → 返回 [{'col_a': val1, 'col_b': val3}, {'col_a': val2, 'col_b': val4}]

orient='index' 容易报 KeyError，尤其索引不是字符串时

orient='index' 把索引变成外层 key，列名变成内层 key。问题在于：如果原始 DataFrame 索引是整数（比如默认 RangeIndex），转出的字典 key 就是数字，但很多人下意识当字符串用，一查就 KeyError。

更隐蔽的是：如果索引含重复值，_to_dict() 不报错，但后出现的行会覆盖前面同索引的值，数据直接丢。

立即学习“Python免费学习笔记（深入）”；

灵机语音

下载

检查索引类型：df.index.dtype，非字符串索引建议先 df.index = df.index.astype(str)
检查索引唯一性：df.index.is_unique，不唯一时慎用 orient='index'
示例错误：result[0] 报错？试试 result[0] → 实际可能是 result['0'] 或根本不存在

NaN 值在不同 orient 下表现不一致，JSON 序列化前必须处理

to_dict() 对 NaN 的处理不是统一的：orient='list' 和 orient='records' 里 NaN 变成 None，但 orient='dict' 里仍是 nan（float 类型），这会导致后续 json.dumps() 直接报 TypeError: Object of type float32 is not JSON serializable。

别指望 pandas 自动转，它只管结构不管序列化兼容性。

统一转 None：用 df = df.where(pd.notna(df), None) 再调 to_dict()
或用 df.fillna(float('nan')).replace({float('nan'): None}).to_dict(...)
注意：fillna(None) 在某些 pandas 版本中不生效，必须用 where 或 replace

大 DataFrame 调用 to_dict() 性能跳变，orient='records' 最慢

同样一个 10 万行 × 10 列的 DataFrame，orient='list' 耗时约 80ms，orient='dict' 约 95ms，但 orient='records' 可能飙到 400ms 以上——因为它是逐行构造 dict，Python 层开销大，且每行都新建 dict 对象。

如果你只是想遍历数据，别急着全量转字典；如果最终要 JSON，df.to_json(orient='records') 比 to_dict().to_json() 快 3–5 倍。

性能排序（快→慢）：list ≈ dict split index records
内存占用：orient='records' 生成最多新对象，GC 压力明显
替代方案：用 df.itertuples(index=False) 或 df.values.tolist() + 列名 zip，更快更省内存

事情说清了就结束

Python FastAPI怎么用_基于类型提示的极速异步API开发

Python RPC怎么写_gRPC接口定义与Protobuf代码生成

Python包下载太慢怎么办_临时使用国内源镜像加速下载命令

Python while循环怎么用_条件循环与死循环预防技巧

Python断言失败怎么看详细差异_pytest精细的错误回溯(Traceback)与对象比对输出解析

相关标签:

python json pandas Float Object 字符串 float32 对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python怎么过滤空行读取_if line.strip()跳过空白行处理下一篇：如何在 Python 中约束可变参数函数的所有参数均为 JSON 兼容类型

作者最新文章

悟空浏览器怎么关闭启动时的加载动画闪屏_悟空浏览器秒开优化

2026-03-13 17:04

如何在Golang中通过反射创建并操作切片 Go语言reflect.MakeSlice实战

2026-03-13 17:05

如何避免PL/SQL中的SQL注入_绑定变量Bind Variables的最佳实践

2026-03-13 17:05

Safari浏览器如何关闭网页的安全证书警告_Safari浏览器继续访问

2026-03-13 17:06

宝塔面板下如何安装Node.js的特定版本镜像源？

2026-03-13 17:09

如何在Golang中实现优雅的请求超时控制 Go语言http.TimeoutHandler使用

2026-03-13 17:09

如何在Golang中利用Trace工具分析延迟 Go语言执行链路可视化追踪

2026-03-13 17:09

如何在Golang中利用SQLite进行本地存储 Go语言嵌入式数据库应用

2026-03-13 17:11

如何在Golang中利用Finalizer清理非内存资源 Go语言runtime.SetFinalizer使用

2026-03-13 17:11

如何为Oracle配置多监听器_不同端口的并发监听机制实现

2026-03-13 17:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23