0

0

如何配置XML解析器禁用外部实体 防止XXE攻击

煙雲

煙雲

发布时间:2026-01-02 11:26:02

|

903人浏览过

|

来源于php中文网

原创

禁用外部实体引用可防止XXE攻击,需在Java(DOM/SAX/StAX)、.NET、Python、PHP及Node.js等各平台解析器中分别配置安全选项,如禁用DOCTYPE、关闭外部实体加载、启用安全处理模式等。

如何配置xml解析器禁用外部实体 防止xxe攻击

如果您在应用程序中使用XML解析器处理不受信任的XML输入,而未禁用外部实体引用,则可能遭受XML外部实体(XXE)攻击。以下是禁用外部实体以防止XXE攻击的多种配置方法:

一、Java DOM解析器配置

Java的DOM解析器默认允许加载外部实体,需显式设置相关属性来禁用该行为。通过DocumentBuilderFactory控制解析器的安全特性可有效阻止XXE。

1、创建DocumentBuilderFactory实例并设置为非验证模式。

2、调用setFeature方法禁用http://apache.org/xml/features/disallow-doctype-decl特性。

3、调用setFeature方法禁用http://xml.org/sax/features/external-general-entitieshttp://xml.org/sax/features/external-parameter-entities特性。

4、设置http://javax.xml.XMLConstants/feature/secure-processing为true以启用安全处理模式。

5、使用configureFactory获得DocumentBuilder并解析XML输入。

二、Java SAX解析器配置

SAX解析器通过XMLReader或SAXParser控制解析行为,必须在解析前关闭外部实体加载能力,否则将暴露于XXE风险。

1、获取SAXParserFactory实例并调用setFeature方法。

2、禁用http://xml.org/sax/features/external-general-entities特性。

3、禁用http://xml.org/sax/features/external-parameter-entities特性。

4、启用http://javax.xml.XMLConstants/feature/secure-processing特性。

5、使用SAXParser解析XML流时确保上述配置已生效。

三、Java StAX解析器配置

StAX解析器(如Woodstox或Sun's default)需通过XMLInputFactory设置安全属性,防止在事件驱动解析过程中加载外部DTD或实体。

1、调用XMLInputFactory.newInstance()获取工厂实例。

2、设置javax.xml.stream.isSupportingExternalEntities属性为false。

3、设置javax.xml.stream.supportDTD属性为false。

4、若使用Woodstox,额外设置com.ctc.wstx.prop.loadExternalDTD为false。

5、使用createXMLStreamReader创建解析器并传入受控输入源。

四、.NET XmlReader配置

.NET平台中的XmlReader默认启用DTD处理,需显式禁用外部实体解析以规避XXE漏洞。通过XmlReaderSettings对象集中管理安全策略。

1、新建XmlReaderSettings实例并设置DtdProcessing属性为DtdProcessing.Prohibit。

2、将XmlResolver属性设为null以阻止任何外部资源解析。

PathFinder
PathFinder

AI驱动的销售漏斗分析工具

下载

3、设置IgnoreComments、IgnoreProcessingInstructions和IgnoreWhitespace为true以减少攻击面。

4、启用MaxCharactersFromEntities限制实体展开深度。

5、使用XmlReader.Create方法配合该Settings实例创建安全解析器。

五、Python xml.etree.ElementTree配置

Python标准库中的ElementTree默认不解析DTD,但若与xmlparser配合使用或启用recover模式,仍可能触发外部实体加载。需强制隔离解析上下文。

1、避免使用xml.etree.ElementTree.parse()直接解析不可信输入。

2、改用xml.etree.ElementTree.XMLParser()并传入target=TreeBuilder()

3、在构造XMLParser时指定resolve_entities=False参数。

4、对输入XML预处理,移除DOCTYPE声明及内部子集中的ENTITY定义。

5、使用defusedxml库替代标准xml模块,其defusedxml.ElementTree.parse()默认禁用全部外部实体。

六、PHP libxml配置

PHP的libxml扩展(如simplexml_load_string、DOMDocument)依赖底层libxml设置。必须在解析前全局或局部禁用外部实体加载功能。

1、调用libxml_disable_entity_loader(true)全局禁用实体加载。

2、若使用DOMDocument,设置$dom->loadXML($xml, LIBXML_NOENT | LIBXML_DTDLOAD)改为仅使用LIBXML_NOENT且不包含LIBXML_DTDLOAD

3、调用libxml_set_external_entity_loader(null)清除自定义加载器。

4、对simplexml_load_string等函数,确保第二个参数未启用LICENSE_XML_DTD标志。

5、升级libxml至2.9.0以上版本,并确认编译时未启用--with-libxml以外的危险选项。

七、Node.js xmldom或xml2js配置

Node.js生态中常用xmldom或xml2js解析XML,二者均存在默认启用外部实体的风险,需通过选项或补丁方式关闭。

1、使用xmldom时,在创建DOMParser实例时传入{ forbidDTD: true, forbidEntity: true }选项。

2、若使用旧版xmldom,手动重写DOMImplementation.prototype.createDocument以拦截实体解析逻辑。

3、对于xml2js,设置options.explicitRoot = false并启用options.ignoreAttrs = true降低攻击可能性。

4、在xml2js中注入自定义attrValueProcessors,过滤含SYSTEMPUBLIC关键字的实体声明。

5、优先选用@rgrove/sanitize-xml等专用防护库对输入进行预清洗,移除DOCTYPE及ENTITY节点。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1089

2024.03.01

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1949

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1171

2024.11.28

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1949

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1171

2024.11.28

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.5万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号