什么是XML实体注入攻击如何防范

星降

发布时间：2025-12-21 13:39:07

580人浏览过

来源于php中文网

原创

XXE攻击是因XML解析器未禁用外部实体导致的漏洞，可读取本地文件、发起内网请求等；防御必须禁用外部实体，辅以输入校验、最小权限和WAF拦截，并加强检测监控。

什么是xml实体注入攻击如何防范

XML实体注入攻击（XXE，XML External Entity Injection）本质是攻击者利用XML解析器对外部实体的不当处理，诱导服务器读取本地文件、发起内网请求、触发拒绝服务，甚至在特定条件下执行命令。它不依赖代码执行漏洞，而是靠解析器“太听话”——只要配置松懈，一个恶意DOCTYPE声明就能让服务器主动打开/etc/passwd或访问192.168.1.100:8080。

XXE是怎么发生的

关键前提是：应用接收并解析用户可控的XML数据，且XML解析器未禁用外部实体功能。典型场景包括SOAP接口、配置文件上传、REST API中接受XML格式Body等。攻击者插入类似这样的内容：

zuojiankuohaophpcn!DOCTYPE foo [ <!ENTITY xxe SYSTEM "file:///etc/passwd"> ]>
<foo>&xxe;</foo>

一旦解析器加载并展开&xxe;，响应体就可能直接返回系统密码文件内容。

最有效的防御手段是禁用外部实体解析

这不是可选项，而是必须项。不同语言有对应的安全配置方式：

Java中使用DocumentBuilderFactory时，务必设置两个关键特性为true：
dbf.setFeature("http://apache.org/xml/features/disallow-doctype-decl", true);
dbf.setFeature("http://xml.org/sax/features/external-general-entities", false);
PHP中避免使用libxml_disable_entity_loader(false)；新版libxml（≥2.9.1）默认禁用，但若调用simplexml_load_string，仍需显式传参LIBXML_NOENT | LIBXML_DTDATTR并确保不开启实体加载
Python推荐直接使用defusedxml替代原生xml.etree.ElementTree，它默认拦截所有危险行为

辅助防护不能只靠过滤关键词

单纯正则匹配<!ENTITY或SYSTEM容易被绕过（比如大小写混淆、注释干扰、编码变形）。真正可靠的做法是：

解析前先做白名单式输入校验：只允许必要标签、属性和字符集，拒绝含DOCTYPE、ENTITY、CDATA等结构的XML
运行XML解析服务的进程采用最小权限原则，禁止以root或SYSTEM身份运行
在Web层（如Nginx、WAF）配置规则，拦截含file://、http://、php://等协议的XML请求体

别忽略检测和监控环节

防御不是一劳永逸。建议：

在测试阶段用经典payload主动探测，例如发送含file:///etc/hostname的XML，观察是否回显
在生产环境记录XML解析异常日志，特别是SAXParseException或EntityResolutionException类错误，它们可能是XXE尝试失败的痕迹
集成OWASP ZAP或Burp Suite插件进行自动化扫描，定期覆盖所有接受XML的端点

XML注入XXE漏洞原理与复现 Web安全渗透测试教程

PHP SimpleXML处理XML映射的实用案例

XML External Entity攻击演示什么是XXE漏洞及其原理

PHP上传XML文件限制修改php.ini配置允许大文件XML上传

PHP libxml_get_errors()是什么如何获取XML解析的全部错误

相关标签:

php python java apache nginx 编码配置文件 rest api xml解析 nginx xml Libxml 接口 apache http 自动化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：PHP怎么处理带有命名空间的XML registerXPathNamespace方法下一篇：Python xml.etree.cElementTree是什么和ElementTree什么区别

作者最新文章

C# UTF-8字符串字面量方法 C#如何使用u8后缀创建UTF-8常量

2026-03-13 11:07

XML文件行数限制编辑器打开几百万行XML卡死的解决

2026-03-13 11:09

Android inset标签用法 XML调整Drawable的内边距

2026-03-13 11:18

C# NTFS交接点(Junction) C#如何创建目录的Junction Point

2026-03-13 11:36

PS蒙版怎么做出渐隐效果？PS图片边缘透明渐变教程

2026-03-13 11:40

XSD如何定义一个非负整数 nonNegativeInteger

2026-03-13 11:53

C# 访问者模式实现方法 C#如何对对象结构中的元素进行操作

2026-03-13 12:14

C#获取文件修改时间 C#如何读取文件的创建和修改日期

2026-03-13 12:17

学习通怎么扫码签到手机远程扫码签到步骤【技巧】

2026-03-13 12:40

CAD看图王怎么转DXF CAD看图王导出DXF格式图纸教程【干货】

2026-03-13 12:57

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

nginx 重启

nginx重启对于网站的运维来说是非常重要的，根据不同的需求，可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容，供大家免费下载体验。

248

2023.07.27

nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件，可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大，允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

522

2023.08.04

nginx配置详解

NGINX与其他服务类似，因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章，大家可以免费学习。

610

2023.08.04

tomcat和nginx有哪些区别

tomcat和nginx的区别：1、应用领域；2、性能；3、功能；4、配置；5、安全性；6、扩展性；7、部署复杂性；8、社区支持；9、成本；10、日志管理。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

244

2024.02.23

nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误，表明服务器无法找到请求资源，可以通过以下步骤解决：1. 检查文件是否存在且路径正确；2. 检查文件权限并更改为 644 或 755；3. 检查 nginx 配置，确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

713

2024.07.09