在进行XML转换时,如何保持源文档中的空白和格式?

煙雲
发布: 2025-12-05 16:15:07
原创
892人浏览过
要保持XML转换时的空白字符,需在解析、处理和输出三环节主动配置:首先设置解析器保留空白节点,如DOM中setIgnoringElementContentWhitespace(false);其次在XSLT中使用xsl:preserve-space声明需保留空白的元素,避免xsl:strip-space;最后通过xsl:output设置indent="no"防止输出重排,并用xsl:copy-of或xsl:text精确控制文本节点输出,避免normalize-space等函数破坏原始格式。

在进行xml转换时,如何保持源文档中的空白和格式?

XML转换时默认会忽略大部分空白字符,要保持源文档中的空白和格式,关键在于控制解析器行为和XSLT处理逻辑。

设置解析器保留空白节点

大多数XML解析器(如Java的DOM、SAX,或.NET的XmlDocument)默认会丢弃“无关空白”(即元素间用于缩进和换行的空格、制表符、回车)。需显式启用保留:

  • DOM解析器中调用 setIgnoringElementContentWhitespace(false)(Java)或确保 XmlReaderSettings.IgnoreWhitespace = false(.NET)
  • 使用SAX时,重写 ignorableWhitespace() 方法,而非只处理 characters()
  • 对于Python的lxml,创建解析器时传入 remove_blank_text=False

在XSLT中声明保留空白的元素

XSLT本身不自动保留所有空白,但可通过 xsl:preserve-space 明确指定哪些元素的内容应保留空白:

  • 在样式表顶部添加:(适用于含格式化文本的元素)
  • 避免使用 xsl:strip-space(除非你明确想清除某些元素的空白)
  • 若需全局保留(谨慎使用),可写 ,但会影响性能且可能干扰逻辑处理

输出时控制缩进与换行

即使输入空白被保留,XSLT处理器默认输出仍可能重新格式化。需配置输出方法:

Docky AI
Docky AI

多合一AI浏览器助手,解答问题、绘制图片、阅读文档、强化搜索结果、辅助创作

Docky AI 87
查看详情 Docky AI
  • 在XSLT中添加:(禁用自动缩进)
  • 若需部分缩进但保留原始结构,改用 indent="yes" 并配合 disable-output-escaping="yes" 处理特定文本节点
  • 使用 包裹需要原样输出的换行或空格,例如:

处理文本节点时避免隐式规范化

XSLT中直接用 会合并并截断空白;应改用更精确的方式:

  • 复制原始文本节点(包括空格、换行)
  • 对混合内容(如段落内有标签和文本),用 apply-templates> 配合模板匹配 text() 节点,并关闭 normalize-space()
  • 避免在XPath中无意识使用 normalize-space(@attr)string(.) —— 它们会破坏原始空白

基本上就这些。核心是分清“输入保留”“处理不破坏”“输出不重排”三个环节,每步都需主动配置,不能依赖默认行为。

以上就是在进行XML转换时,如何保持源文档中的空白和格式?的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号