XXE漏洞是什么如何在解析XML时防范它

月夜之吻

发布时间：2026-02-03 10:10:02

314人浏览过

来源于php中文网

原创

XXE漏洞本质是XML解析器无条件加载攻击者控制的外部实体，需禁用DOCTYPE声明及所有外部实体相关特性。Java中须组合设置多个setFeature为false并禁用XInclude；Python lxml需显式设resolve_entities=False和no_network=True；最彻底防御是在解析前过滤或拒绝含DOCTYPE的请求。

xxe漏洞是什么如何在解析xml时防范它

XXE漏洞本质是XML解析器加载了恶意外部实体

XXE（XML External Entity）不是XML语法错误，而是解析器在处理声明时，无条件加载了攻击者控制的SYSTEM或PUBLIC外部实体。典型后果包括读取本地文件（如/etc/passwd）、发起内网SSRF、触发DNS外带、甚至导致拒绝服务。

Java中使用DocumentBuilder时必须禁用外部DTD和实体

默认的DocumentBuilderFactory开启外部实体解析，且setFeature("http://apache.org/xml/features/disallow-doctype-decl", true)在老版本JDK（如JDK 6/7）上不生效。真正有效的组合是：

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setFeature("http://apache.org/xml/features/disallow-doctype-decl", true);
factory.setFeature("http://xml.org/sax/features/external-general-entities", false);
factory.setFeature("http://xml.org/sax/features/external-parameter-entities", false);
factory.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);
factory.setXIncludeAware(false);
factory.setExpandEntityReferences(false);

disallow-doctype-decl应设为true，但仅靠它不够——某些老解析器仍会尝试解析已存在的DOCTYPE
external-general-entities和external-parameter-entities必须显式设为false，否则ENTITY声明仍可被解析
load-external-dtd设为false防止加载外部DTD文件，哪怕DOCTYPE存在

Python中lxml和xml.etree.ElementTree的差异很关键

xml.etree.ElementTree默认不解析外部实体，相对安全；但lxml（尤其搭配etree.XMLParser()）默认启用，并支持resolve_entities=True（默认值）。必须显式关闭：

大同搜索

多语言高质量的AI搜索

下载

from lxml import etree
parser = etree.XMLParser(
    resolve_entities=False,
    no_network=True,
    dtd_validation=False,
    load_dtd=False
)
tree = etree.parse("input.xml", parser)

resolve_entities=False是核心开关，漏掉它就等于没防
no_network=True阻止解析器访问网络资源（如http://attacker.com/evil.dtd）
即使传入remove_comments=True或remove_pis=True，也不影响XXE防护，别混淆关注点
若用etree.fromstring()，必须传入同一parser实例，不能依赖全局默认

所有场景下都该禁用DOCTYPE声明本身

最彻底的防御不是“解析但不加载外部实体”，而是根本不让DOCTYPE进入解析流程。多数现代XML解析器支持“无DOCTYPE模式”或预过滤：

对不可信输入，在解析前用正则粗筛：re.sub(r'', '', xml_str, flags=re.DOTALL) + re.sub(r'^>]*>', '', xml_str)（注意：仅作辅助，不能替代解析器配置）
Spring Framework中，@RequestBody绑定XML时，应配置Jaxb2RootElementHttpMessageConverter并设置setSupportDtd(false)
若业务根本不需要DOCTYPE（如纯数据交换），在API层直接拒绝含/code>的请求体，HTTP 400响应并记录日志

很多团队只关了external-entities，却忘了DOCTYPE本身可能触发解析器初始化逻辑，或暴露内部路径信息。真正安全的起点，是让恶意声明根本进不了解析器。

使用Python BeautifulSoup处理非标准XML

服务器如何自动解压上传的.zip文件并处理其中的XML

Python lxml库的etree和objectify有什么区别

Watchdog库是什么如何用Python监控文件夹变化并上传XML

Python lxml库进行高性能XML映射

相关标签:

python java apache win dns xml解析 spring xml public apache http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：PHP如何将XML转换为PHP数组下一篇：暂无

作者最新文章

电脑连接蓝牙耳机没声音怎么办蓝牙设备连接问题的解决方法【教程】

2026-02-03 09:03

XML数据映射的版本控制策略

2026-02-03 09:03

网页视频打不开显示undefined_解决网页播放器提示undefined的方法

2026-02-03 09:20

如何将XML映射到Protobuf格式以提高性能

2026-02-03 09:26

C# ConditionalWeakTable使用方法 C#如何将数据附加到对象上

2026-02-03 09:28

C# ref readonly返回方法 C#如何返回一个不可修改的引用

2026-02-03 09:37

XML校验器是什么如何在线检查XML文件是否有效

2026-02-03 09:38

C# Swagger UI自定义方法 C#如何为API文档添加说明和示例

2026-02-03 09:45

PS批量旋转和翻转图片，快速校正图片方向

2026-02-03 09:45

怎么在汉典查找近义词反义词近义词反义词查询方法【干货】

2026-02-03 09:48

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

spring框架介绍

本专题整合了spring框架相关内容，想了解更多详细内容，请阅读专题下面的文章。

117

2025.08.06

Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用，涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造（CSRF）防护、会话管理与安全漏洞防范。通过实际项目案例，帮助学习者掌握如何使用 Spring Security 实现高安全性认证与授权机制，提升 Web 应用的安全性与用户数据保护。

2026.01.26

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1907

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2095

2024.08.01

xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容，可阅读本专题下面的相关文章。

1092

2024.11.28

apache是什么意思

Apache是Apache HTTP Server的简称，是一个开源的Web服务器软件。是目前全球使用最广泛的Web服务器软件之一，由Apache软件基金会开发和维护，Apache具有稳定、安全和高性能的特点，得益于其成熟的开发和广泛的应用实践，被广泛用于托管网站、搭建Web应用程序、构建Web服务和代理等场景。本专题为大家提供了Apache相关的各种文章、以及下载和课程，希望对各位有所帮助。

411

2023.08.23