0

0

Python如何将XML数据流式写入文件

月夜之吻

月夜之吻

发布时间:2026-01-15 09:14:55

|

370人浏览过

|

来源于php中文网

原创

Python流式写入XML推荐lxml.xmlfile实现真正增量写入,或手动逐行写入(需转义);避免一次性构建整树,禁用ElementTree直接生成大XML;不适合需回溯修改或动态补全属性的场景。

python如何将xml数据流式写入文件

Python中流式写入XML文件,核心是避免一次性构建整个XML树(如用xml.etree.ElementTree生成大Element再写入),而是边生成、边写入,节省内存。推荐使用xml.sax的输出替代方案——更常用且可控的是xml.etree.ElementTree配合iterparse反向思路,或直接用xml.sax.saxutils.XMLGenerator,但最实用、轻量、可读性强的方式是手动按XML语法逐行写入(即“伪流式”),或使用第三方库lxmlxmlfile上下文管理器。

用 lxml.xmlfile 实现真正的流式写入

lxml 提供了专为流式写入设计的 xmlfile,支持嵌套、自动缩进、命名空间,并真正以增量方式写入文件,不缓存整棵树。

  • 需先安装:pip install lxml
  • 写入过程清晰分层,用 with xf.element(...) 自动处理开始/结束标签
  • 适合写入成千上万个子元素(如日志、导出记录)而内存占用恒定

示例:写入一批用户数据

from lxml import etree
from contextlib import contextmanager

with open('users.xml', 'wb') as f: with etree.xmlfile(f, encoding='utf-8') as xf:

写根元素

    with xf.element('users', {'version': '1.0'}):
        # 流式写入多个 user
        for i in range(1, 4):
            with xf.element('user', {'id': str(i)}):
                xf.write(etree.Element('name')).text = f'User {i}'
                xf.write(etree.Element('email')).text = f'user{i}@example.com'

立即学习Python免费学习笔记(深入)”;

通吃客零食网整站 for Shopex
通吃客零食网整站 for Shopex

第一步】:将安装包中所有的文件夹和文件用ftp工具以二进制方式上传至服务器空间;(如果您不知如何设置ftp工具的二进制方式,可以查看:(http://www.shopex.cn/support/qa/setup.help.717.html)【第二步】:在浏览器中输入 http://您的商店域名/install 进行安装界面进行安装即可。【第二步】:登录后台,工具箱里恢复数据管理后台是url/sho

下载

手动逐行写入(纯标准库,零依赖)

若不能引入lxml,可用内置io.TextIOWrapper + 字符串模板,严格按XML规则拼接并写入。适用于结构简单、标签层级固定、无需验证的场景。

  • 注意:需手动转义文本内容(如&&),推荐用xml.sax.saxutils.escape()
  • print(..., file=f)f.write()逐行输出,控制缩进提升可读性
  • 适合快速导出、调试或嵌入到已有脚本中

示例:

import xml.sax.saxutils as saxutils

def write_user(f, uid, name, email, indent=2): ind = ' ' * indent f.write(f'{ind}\n') f.write(f'{ind} {saxutils.escape(name)}\n') f.write(f'{ind} {saxutils.escape(email)}\n') f.write(f'{ind}\n')

with open('users_simple.xml', 'w', encoding='utf-8') as f: f.write('\n') f.write('\n') for i in range(1, 4): write_user(f, str(i), f'User {i}', f'user{i}@example.com') f.write('\n')

避免常见陷阱

流式写入易忽略编码与格式细节,导致文件损坏或解析失败:

  • 始终以二进制模式('wb')打开文件配合lxml.xmlfile;文本模式('w')需显式指定encoding并确保一致
  • 不要混用print()f.write()写入同一文件(换行符行为可能不一致)
  • 非ASCII字符必须通过正确编码写入,避免UnicodeEncodeError
  • 手动写入时,属性值必须用引号包裹,且引号类型需与内容避让(建议统一用双引号,内容内双引号需转义)

什么情况不适合流式写入

流式本质是“单向写入、不可回溯”。以下需求不适合纯流式:

  • 需要在写完所有子节点后,动态补全根节点的count属性(如)——得先缓存计数,或两遍写入
  • 需对已写入内容做条件修改(如根据后续数据决定是否添加某个字段)
  • 要求生成带XSD验证、带注释、带处理指令的复杂XML文档——建议先构建ElementTree再序列化

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

754

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

636

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

618

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

707

2023.08.11

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.7万人学习

Django 教程
Django 教程

共28课时 | 3.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号