Python如何用lxml验证XML是否符合DTD

星降
发布: 2025-12-18 16:08:02
原创
629人浏览过
lxml支持DTD验证,推荐手动加载DTD对象后调用validate()方法;也可通过启用load_dtd=True的XMLParser实现自动验证,但需注意DTD路径、网络访问及解析顺序问题。

python如何用lxml验证xml是否符合dtd

lxml 支持通过 DTD 验证 XML 文档,但需注意:DTD 必须可访问(本地文件或可通过 URL 加载),且 XML 声明中需正确引用 DTD(如 ),否则 lxml 无法自动关联验证。

加载并解析 DTD 显式验证

推荐方式是手动加载 DTD 对象,再调用其 validate() 方法。这样不依赖 XML 内部的 DOCTYPE 声明,更可控。

  • lxml.etree.DTD(file=...) 从本地 .dtd 文件创建 DTD 实例
  • lxml.etree.parse() 解析 XML 得到 ElementTree
  • 调用 dtd.validate(tree) 返回布尔值;失败时可用 dtd.error_log 查看具体报错

通过 XML 内部 DOCTYPE 自动验证

若 XML 文件已包含有效的 ..> 声明(SYSTEM 或 PUBLIC),且 DTD 路径可访问(如与 XML 同目录或配置了自定义解析器),可启用自动验证:

  • 创建 XMLParser(load_dtd=True, no_network=False)no_network=False 允许加载远程 DTD)
  • 用该 parser 解析 XML:parse(xml_file, parser)
  • 调用 parser.dtd 获取 DTD 对象,再执行 validate()

处理常见问题

验证失败往往不是代码问题,而是环境或路径导致:

SONIFY.io
SONIFY.io

设计和开发音频优先的产品和数据驱动的解决方案

SONIFY.io 98
查看详情 SONIFY.io

立即学习Python免费学习笔记(深入)”;

  • DTD 路径为相对路径时,lxml 默认以当前工作目录为基准,不是 XML 文件所在目录 —— 可用 os.path.dirname(xml_path) 构造绝对路径传给 DTD(file=...)
  • XML 中引用的是 PUBLIC DTD(如 "-//W3C//DTD XHTML 1.0 Strict//EN"),需确保网络可达或使用 Resolver 重定向到本地文件
  • 验证前建议先检查 XML 是否能正常解析(无语法错误),否则 parse() 会直接抛出 XMLSyntaxError

简单示例代码

假设 book.xml 引用了同目录下的 book.dtd

from lxml import etree
import os

dtd = etree.DTD(open("book.dtd", "rb"))
tree = etree.parse("book.xml")

if dtd.validate(tree):
    print("✅ XML 符合 DTD")
else:
    print("❌ 验证失败:")
    for error in dtd.error_log:
        print(f"  {error.message.strip()}")
登录后复制

以上就是Python如何用lxml验证XML是否符合DTD的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号