0

0

XML文件解析超时设置 防止恶意XML导致服务挂起

月夜之吻

月夜之吻

发布时间:2026-02-26 10:47:35

|

176人浏览过

|

来源于php中文网

原创

xml解析器默认无超时,恶意外部实体可致线程阻塞;须在http层设超时(如python用requests、java配url连接超时、go用context),禁用xxe,并拆分获取与解析步骤。

xml文件解析超时设置 防止恶意xml导致服务挂起

XML解析器默认不设超时,恶意外部实体会卡死进程

Python的xml.etree.ElementTree、Java的DocumentBuilder、Go的encoding/xml等主流解析器,底层读取输入流时完全不检查耗时。一旦遇到构造的恶意XML(比如递归实体或超大文本节点),服务可能在parse()调用里无限等待,CPU不飙高但线程彻底阻塞。

  • 典型现象:ElementTree.parse()卡住数分钟无返回,strace显示进程停在read()系统调用
  • 真实场景:接收第三方上传的XML配置、SOAP请求、RSS源,且未做预检
  • 根本原因:XML解析是同步阻塞IO,超时必须由上层控制,解析器自身不提供timeout参数

Python中用urllib.requestrequests加超时再喂给ElementTree

不能对ElementTree.parse()本身设超时,得把“获取XML内容”和“解析”拆开,前者加超时,后者只处理已下载的字节流。

  • 错误写法:ElementTree.parse("http://evil.com/malicious.xml") —— URL直接传入,底层用urlopen无超时
  • 正确做法:先用requests.get(url, timeout=5)拉取,再用ElementTree.fromstring(r.content)
  • 注意fromstring()parse()区别:parse()接受文件路径或file-like对象,fromstring()只接受bytes/str;若用parse(),需构造io.BytesIO(r.content)
  • 别忽略requests.exceptions.Timeoutrequests.exceptions.ConnectionError,它们比XML解析异常更早抛出

Java用SAXParserDocumentBuilder前禁用外部实体并设置连接超时

Java的DocumentBuilder默认开启http://xml.org/sax/features/external-parameter-entities,攻击者可利用xxe触发DNS外连或本地文件读取,同时造成阻塞。光关XXE不够,网络层超时也得配。

Descript
Descript

一个多功能的音频和视频编辑引擎

下载
  • 必须关闭外部实体:dbf.setFeature("http://apache.org/xml/features/disallow-doctype-decl", true)
  • 连接超时要设在URL.openStream()之前:URL url = new URL(xmlUrl); url.openConnection().setConnectTimeout(3000);
  • 避免用DocumentBuilder.parse(String uri)这种便利方法,它内部new URL(uri).openStream(),没机会设timeout
  • 如果用SAXParser,同样需提前获取InputStream并确保其底层Socket已设setSoTimeout(5000)

Go的encoding/xml需配合context.WithTimeout控制HTTP请求生命周期

Go标准库encoding/xml本身无超时机制,但它的输入源是io.Reader,所以超时必须落在HTTP客户端层。关键点在于:超时要作用于整个请求过程,包括DNS解析、TLS握手、响应体读取。

  • 错误写法:http.Get(url) —— 无超时,可能永久挂起
  • 正确写法:ctx, cancel := context.WithTimeout(context.Background(), 5*time.Second); resp, err := http.DefaultClient.Do(req.WithContext(ctx))
  • 即使设置了http.Client.Timeout,也要注意它不覆盖DNS和TLS时间,context.WithTimeout才是全链路控制
  • 解析时用xml.NewDecoder(resp.Body).Decode(&v),此时Body已受context保护,读取超时会自动触发context.DeadlineExceeded

真正难处理的是流式XML解析场景——比如解析一个持续推送的XML事件流,这时候超时不能简单设固定值,得结合心跳检测或最大字节数限制。另外,所有语言都要记得关闭响应Body,否则连接池会耗尽。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

850

2023.08.02

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1936

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2111

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1137

2024.11.28

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

721

2023.08.10

apache是什么意思
apache是什么意思

Apache是Apache HTTP Server的简称,是一个开源的Web服务器软件。是目前全球使用最广泛的Web服务器软件之一,由Apache软件基金会开发和维护,Apache具有稳定、安全和高性能的特点,得益于其成熟的开发和广泛的应用实践,被广泛用于托管网站、搭建Web应用程序、构建Web服务和代理等场景。本专题为大家提供了Apache相关的各种文章、以及下载和课程,希望对各位有所帮助。

418

2023.08.23

apache启动失败
apache启动失败

Apache启动失败可能有多种原因。需要检查日志文件、检查配置文件等等。想了解更多apache启动的相关内容,可以阅读本专题下面的文章。

937

2024.01.16

Java 流式处理与 Apache Kafka 实战
Java 流式处理与 Apache Kafka 实战

本专题专注讲解 Java 在流式数据处理与消息队列系统中的应用,系统讲解 Apache Kafka 的基础概念、生产者与消费者模型、Kafka Streams 与 KSQL 流式处理框架、实时数据分析与监控,结合实际业务场景,帮助开发者构建 高吞吐量、低延迟的实时数据流管道,实现高效的数据流转与处理。

119

2026.02.04

Golang 实际项目案例:从需求到上线
Golang 实际项目案例:从需求到上线

《Golang 实际项目案例:从需求到上线》以真实业务场景为主线,完整覆盖需求分析、架构设计、模块拆分、编码实现、性能优化与部署上线全过程,强调工程规范与实践决策,帮助开发者打通从技术实现到系统交付的关键路径,提升独立完成 Go 项目的综合能力。

1

2026.02.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号