0

0

XML文件头部StandAlone属性 对外部DTD依赖的声明

月夜之吻

月夜之吻

发布时间:2026-03-08 02:27:12

|

535人浏览过

|

来源于php中文网

原创

standalone属性仅控制解析器是否加载外部dtd,设为"yes"时若doctype含system/public声明且dtd不可访问则硬性报错;"no"为默认值,解析器会尝试加载外部dtd。

xml文件头部standalone属性 对外部dtd依赖的声明

XML standalone 属性到底影响什么

standalone 属性只影响解析器是否加载外部 DTD,不控制实体解析、命名空间或 Schema 验证。设为 "yes" 时,解析器会直接报错:如果文档声明了外部 DTD(DOCTYPE 中含 SYSTEMPUBLIC),但又没提供本地副本,就抛 org.xml.sax.SAXParseException: Document is not standalone —— 这不是警告,是硬性失败。

常见错误现象:standalone="yes" 却在 DOCTYPE 里写了 SYSTEM "common.dtd",而该文件不在 classpath 或当前目录;或者用 Java 的 DocumentBuilder 解析时没配 setValidating(false),导致它强行尝试读 DTD。

  • standalone="no" 是默认值,解析器会尝试加载外部 DTD(即使你没用到里面的实体或属性定义)
  • standalone="yes" 不代表“完全离线”,只是承诺:文档所有声明都已内联(如 必须出现在内部子集里)
  • 如果 DTD 只用于注释或未被引用的参数实体,standalone="yes" 仍可能失败——解析器不“智能跳过”,它按规范必须检查 DTD 是否可访问

Java SAX/DOM 解析器对 standalone 的实际处理差异

OpenJDK 的 com.sun.org.apache.xerces.internal.parsers.SAXParser 严格遵循 XML 1.0 规范:遇到 standalone="yes" + 外部 DTD 声明,且无法定位 DTD 文件,立刻终止解析。而某些老版本 Android SAX(如 API 28 前)会静默忽略该属性,造成行为不一致。

使用场景:你打包一个 XML 配置文件进 jar,想确保它脱离 DTD 也能加载 —— 不能只改 standalone="yes",还必须移除 DOCTYPE 中的外部引用,或把 DTD 内容合并进内部子集。

  • DOM 解析器(DocumentBuilder)默认开启 DTD 加载,需显式调用 setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false)
  • SAX 解析器(XMLReader)要禁用外部加载,得设 setFeature("http://xml.org/sax/features/external-parameter-entities", false)
  • 哪怕 standalone="yes",只要 DOCTYPE 存在且含外部标识符,Xerces 就会尝试打开网络或文件系统路径 —— 这可能触发安全策略拒绝或超时

standalone 和外部 DTD 的兼容性陷阱

最常踩的坑:以为删掉 DTD 文件、只留 standalone="yes" 就万事大吉。其实只要 DOCTYPE 声明还写着 SYSTEM "foo.dtd",解析器就会去找这个路径 —— 无论你有没有真用到里面定义的任何东西。

MusicAI
MusicAI

AI音乐生成工具

下载

性能影响很小,但兼容性风险高:Node.js 的 libxmljsstandalone="yes" 下遇到外部 DTD 直接 throw;Python 的 xml.etree.ElementTree 则完全无视 standalone 属性(它本来就不支持 DTD 解析)。

  • 真正安全的做法:删除整行 DOCTYPE 声明,或改成内联形式,例如 ]>
  • 如果 DTD 含条件节()或参数实体,standalone="yes" 会直接非法 —— 这些特性只能出现在外部 DTD 中
  • HTTP 服务返回 XML 时若带 standalone="yes",但响应头 Content-Type 没设 charset,某些客户端解析器可能因编码推断失败连带误判 standalone 状态

怎么验证你的 XML 是否真的满足 standalone="yes"

别靠肉眼检查。用命令行工具快速验:Linux/macOS 下跑 xmllint --noout --nonet --standalone yes your.xml。如果报错,说明要么有外部 DTD 引用,要么内部子集用了禁止的语法(比如 %pe; 参数实体引用)。

注意:--nonet 是关键,它阻止 xmllint 访问网络加载 DTD;去掉它,就算 standalone="no",也可能因 DTD 不可达而失败 —— 这和 standalone 本身无关,是网络依赖问题。

  • Java 里可用 SAXParserFactory.newInstance().newSAXParser() 配合 DefaultHandler 捕获 SAXParseException,但必须先关掉外部加载,否则异常来源不明确
  • VS Code 的 XML 插件(如 Red Hat XML)会在编辑时标红 standalone="yes" + 外部 DTD 的组合,但它不校验内部子集合法性
  • 如果你的构建流程生成 XML,别在模板里硬写 standalone="yes" —— 应由生成逻辑判断是否真没引用外部 DTD,再动态写入

最容易被忽略的是:很多工具(比如 XSLT 转换器、Swagger Codegen 输出的 XML 示例)会自动生成 standalone="yes",但保留原始 DTD 引用,结果一上线就崩。这属性不是装饰,它是一份契约,签了就得履约。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1944

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2118

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1160

2024.11.28

mysql标识符无效错误怎么解决
mysql标识符无效错误怎么解决

mysql标识符无效错误的解决办法:1、检查标识符是否被其他表或数据库使用;2、检查标识符是否包含特殊字符;3、使用引号包裹标识符;4、使用反引号包裹标识符;5、检查MySQL的配置文件等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

207

2023.12.04

Python标识符有哪些
Python标识符有哪些

Python标识符有变量标识符、函数标识符、类标识符、模块标识符、下划线开头的标识符、双下划线开头、双下划线结尾的标识符、整型标识符、浮点型标识符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

318

2024.02.23

java标识符合集
java标识符合集

本专题整合了java标识符相关内容,想了解更多详细内容,请阅读下面的文章。

290

2025.06.11

c++标识符介绍
c++标识符介绍

本专题整合了c++标识符相关内容,阅读专题下面的文章了解更多详细内容。

174

2025.08.07

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

530

2023.06.20

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

23

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号