Python Pandas如何将DataFrame导出为指定XML

畫卷琴夢

发布时间：2026-01-30 12:47:02

396人浏览过

来源于php中文网

原创

Pandas不原生支持XML导出，截至2.2版本无to_xml()方法；推荐用to_dict()结合xml.etree.ElementTree手动构造，需处理NaN、中文编码、非法列名等问题，并避免使用非主流第三方包。

python pandas如何将dataframe导出为指定xml

XML导出不是Pandas原生支持的功能

Pandas没有内置的to_xml()方法（截至2.2版本），直接调用df.to_xml()会抛出AttributeError。这不是你代码写错了，是功能确实没实装——官方GitHub上长期有相关PR和讨论，但尚未合并进主线。

用`to_dict()` + `xml.etree.ElementTree`手动构造最稳妥

这是生产环境推荐做法：可控、无额外依赖、兼容所有Pandas版本。核心思路是把DataFrame转为记录列表，逐条生成Element节点，再统一包装根元素。

常见错误包括：NaN导致TypeError、中文字符编码失败、列名含空格或特殊字符引发XML格式错误。

先用df.fillna("")或df.astype(str)统一字段类型，避免None/NaN传入ElementTree
根节点名建议显式指定（如"data"），不要硬编码为"root"——业务系统常依赖特定根名
列名自动转为XML标签名时，需替换非法字符：空格→"_"，"-"→"_"，开头数字加前缀（如"col_123"）

import xml.etree.ElementTree as ET
import pandas as pd
def df_to_xml(df, root_name="data", row_name="record"):
root = ET.Element(rootname)
for , row in df.iterrows():
record = ET.SubElement(root, row_name)
for col_name, val in row.items():
清洗列名：只保留字母、数字、下划线，且不能以数字开头
        safe_tag = "".join(c if c.isalnum() else "_" for c in str(col_name))
        if safe_tag and safe_tag[0].isdigit():
            safe_tag = "col_" + safe_tag
        # 值转字符串并处理None
        text = "" if pd.isna(val) else str(val)
        ET.SubElement(record, safe_tag).text = text
return ET.tostring(root, encoding="unicode", method="xml")
示例
df = pd.DataFrame([{"user id": 101, "full-name": "Alice", "score": 95.5}])
xml_str = df_to_xml(df, root_name="users")
print(xml_str)
第三方库lxml能简化但引入新依赖
如果你已用lxml处理HTML/XML，可用其etree替代标准库，性能略好，且对命名空间、CDATA等支持更全。但注意：lxml需单独安装（pip install lxml），Windows用户可能遇到编译问题。

							
								
								
									玄鲸Timeline
									一个AI驱动的历史时间线生成平台
								
								下载 
							
						
立即学习“Python免费学习笔记（深入）”；


lxml.etree的tostring()默认不换行，加pretty_print=True才可读
若需声明XML版本和编码（如），必须用xml_declaration=True

避免混用xml.etree.ElementTree和lxml.etree——对象不兼容，会报TypeError: expected ElementTree instance


别碰pandas-xml这类非主流包
PyPI上有几个叫pandas-xml或dfxml的包，下载量低、更新停滞、文档缺失。实测发现它们对多级索引、时序列、嵌套字典支持极差，且部分版本会静默丢数据（比如把datetime64转成时间戳整数后截断毫秒）。小脚本试试无妨，线上流程请绕开。
真正容易被忽略的是：XML规范要求属性值必须加引号、标签名区分大小写、空元素要闭合（而非）。手动用ElementTree时这些由底层保障；自己拼字符串则大概率出错——宁可多写几行，别省那点代码量。

Excel数据如何转换为复杂的XML结构？

如何用Python的lxml库验证XML是否符合XSD

SystemVerilog如何读取XML配置文件并用于芯片验证

XML上传后如何存入图形数据库(Neo4j)

SBOM (软件物料清单) 是什么如何上传和解析CycloneDX/SPDX格式的XML

相关标签:

python html git windows github 编码 win xml处理标准库 pandas pip print 命名空间 xml 字符串对象 github windows

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Ehcache的ehcache.xml配置文件详解下一篇：暂无

作者最新文章

个人所得税工资与实际收入不一致怎么办什么原因

2026-01-30 11:34

汽车油箱盖在左边还是右边？仪表盘上有提示吗？

2026-01-30 11:52

办信用卡需要什么条件各大银行信用卡申请攻略

2026-01-30 11:55

C# Channel使用方法 C#如何实现高性能的生产者消费者队列

2026-01-30 11:55

电脑时间不准怎么同步电脑系统时间自动校准设置

2026-01-30 12:00

Apple ID密码错误怎么办解决Apple ID密码不对的技巧

2026-01-30 12:17

C# MethodImplOptions使用方法 C# AggressiveInlining有什么作用

2026-01-30 12:19

MAUI怎么实现文件下载功能 MAUI下载并保存文件方法

2026-01-30 12:27

C# NAudio音频处理方法 C#如何录制和播放音频

2026-01-30 12:38

钉钉思维导图怎么把图片放进去钉钉脑图插入本地图片详细步骤【教程】

2026-01-30 12:40

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

pip安装使用方法

安装步骤：1、确保Python已经正确安装在您的计算机上；2、下载“get-pip.py”脚本；3、按下Win + R键，然后输入cmd并按下Enter键来打开命令行窗口；4、在命令行窗口中，使用cd命令切换到“get-pip.py”所在的目录；5、执行安装命令；6、验证安装结果即可。大家可以访问本专题下的文章，了解pip安装使用方法的更多内容。

339

2023.10.09

更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容，请阅读专题下面的文章。

415

2024.12.20

pip设置清华源

设置方法：1、打开终端或命令提示符窗口；2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件；3、打开pip.conf文件，然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容，这将把pip的镜像源设置为清华大学的镜像源；4、保存并关闭文件即可。

761

2024.12.23