Python怎么把CSV数据转换成嵌套XML

月夜之吻

发布时间：2025-12-22 09:14:02

638人浏览过

来源于php中文网

原创

Python将CSV转为嵌套XML的核心是明确嵌套规则：按字段值分组、构建父子树或固定模板；推荐用csv+xml.etree.ElementTree实现，需注意编码、转义及结构预定义。

python怎么把csv数据转换成嵌套xml

Python 将 CSV 转为嵌套 XML，核心是：读取 CSV 行数据 → 按逻辑分组（如按某列值归类）→ 构建层级结构 → 用标准库生成合规 XML。关键不在“能不能”，而在“怎么定义嵌套规则”——CSV 本身是扁平的，嵌套关系需你明确指定。

明确嵌套结构（先想清楚再写代码）

CSV 没有天然层级，必须人工约定规则。常见方式有：

按字段值分组嵌套：例如 CSV 有 category, name, price，你想让每个 category 成为一个 <category> 元素，其下包含多个 <item>
多级父子关系：如含 parent_id 和 id 列，可构建成树形 XML（需递归或字典索引）
固定模板嵌套：如每行对应一个 <record>，内部固定嵌套 <header> + <details> 子元素

用 csv + xml.etree.ElementTree 实现（推荐，无第三方依赖）

这是最轻量、最可控的方式。以下是一个按 category 分组的典型示例：

假设 CSV 文件 data.csv 内容如下：

立即学习“Python免费学习笔记（深入）”；

category,name,price
electronics,Phone,999
electronics,Laptop,1299
books,Python Crash Course,39
books,Clean Code,45

目标 XML 结构：

<root>
  <category name="electronics">
    <item><name>Phone</name><price>999</price></item>
    <item><name>Laptop</name><price>1299</price></item>
  </category>
  <category name="books">
    <item><name>Python Crash Course</name><price>39</price></item>
    <item><name>Clean Code</name><price>45</price></item>
  </category>
</root>

对应 Python 代码：

吐槽大师

吐槽大师（Roast Master） - 终极 AI 吐槽生成器，适用于 Instagram，Facebook，Twitter，Threads 和 Linkedin

下载

import csv
import xml.etree.ElementTree as ET
from collections import defaultdict
<h1>读 CSV 并按 category 分组</h1><p>groups = defaultdict(list)
with open('data.csv', newline='', encoding='utf-8') as f:
reader = csv.DictReader(f)
for row in reader:
groups[row['category']].append(row)</p><h1>构建 XML 树</h1><p>root = ET.Element('root')
for cat_name, items in groups.items():
cat_elem = ET.SubElement(root, 'category', attrib={'name': cat_name})
for item in items:
item_elem = ET.SubElement(cat_elem, 'item')
ET.SubElement(item_elem, 'name').text = item['name']
ET.SubElement(item_elem, 'price').text = item['price']</p><h1>写入文件（美化缩进可选）</h1><p>tree = ET.ElementTree(root)
tree.write('output.xml', encoding='utf-8', xml_declaration=True)</p><h1>（可选）添加缩进使 XML 可读（Python 3.9+ 可用 ET.indent）</h1><p>try:
ET.indent(root, space='  ')
except AttributeError:
pass  # 旧版本跳过

处理更复杂嵌套（如父子 ID 树）

若 CSV 含 id, parent_id, title，需构建树结构：

先遍历所有行，用字典存 {id: element}，同时记录每个节点的子节点列表
再找 parent_id 为空或为 0 的节点作为根
递归或循环将子元素 append 到父元素下

这种场景建议封装一个简单 Node 类或用 defaultdict(list) 存子关系，避免深度递归出错。

用 pandas + xml.etree（适合已有 DataFrame 流程）

如果你已用 pandas 读取 CSV，可直接基于 DataFrame 操作：

import pandas as pd
import xml.etree.ElementTree as ET
<p>df = pd.read_csv('data.csv')
root = ET.Element('root')</p><p>for _, row in df.iterrows():
record = ET.SubElement(root, 'record')
for col in df.columns:
child = ET.SubElement(record, col)
child.text = str(row[col])</p><p>ET.ElementTree(root).write('pandas_output.xml', encoding='utf-8', xml_declaration=True)

注意：这种方式是“行转平级 record”，如需真正嵌套，仍需先 groupby 或 apply 自定义函数构造子结构。

不复杂但容易忽略的是编码和特殊字符——XML 不允许 <, &, " 直接出现，xml.etree 会自动转义，但手动拼接字符串则需用 xml.sax.saxutils.escape()。另外，确保 CSV 用 utf-8 打开，避免中文乱码。

Python xmlschema库验证使用XSD文件校验XML数据

Python xmlschema库安装失败解决pip install构建依赖问题

Python xml.dom.minidom写入文件避免写入多余空行的技巧

XML文件头部BOM头去除 Notepad++无BOM格式保存

XML文件转Csv Python脚本 Pandas一行代码实现XML转CSV

相关标签:

python node go 编码中文乱码 csv ai 标准库 pandas 封装 xml 字符串递归循环 append

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：什么是BPEL业务流程执行语言 BPEL XML语法下一篇：XPath函数库有哪些常用函数 string(), number(), count()

作者最新文章

Java面试——雪花算法生成全局唯一ID

2026-03-11 12:37

PS怎么磨皮美白？大神常用的3种人像精修磨皮方法

2026-03-11 13:39

Rust解析XML库推荐 Rust语言使用quick-xml处理数据

2026-03-11 13:51

C# 文件系统软删除 C#如何实现一个回收站功能而不是立即删除文件

2026-03-11 14:17

XML文件能直接导入MySQL吗使用Load XML Data Infile命令

2026-03-11 14:29

7881王者荣耀账号交易平台皮肤道具商城入口

2026-03-11 14:43

Java DOM修改XML节点值 setTextContent与setNodeValue区别

2026-03-11 14:50

Python xmlschema库验证使用XSD文件校验XML数据

2026-03-11 14:51

XPointer怎么用 XPointer定位XML文档片段

2026-03-11 15:20

哪里可以申请免费域名 5个好用的免费域名申请网站【分享】

2026-03-11 15:22

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1949

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容，可阅读本专题下面的相关文章。

1171

2024.11.28

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

761

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

221

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1569

2023.10.24

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

热门下载

网站特效

网站源码

网站素材

前端模板