0

0

html5用xpath查询xml_定位深层节点的表达式编写方法【说明】

蓮花仙者

蓮花仙者

发布时间:2026-01-07 19:11:03

|

339人浏览过

|

来源于php中文网

原创

必须先用DOMParser解析XML字符串为XMLDocument,再调用其evaluate()方法执行XPath查询;直接在HTML文档中对XML字符串使用document.evaluate()会因HTML解析规则导致失败。

html5用xpath查询xml_定位深层节点的表达式编写方法【说明】

document.evaluate() 在 HTML5 中查 XML 文档必须先解析为 XMLDocument

直接在 HTML 文档里对 XML 字符串用 document.evaluate() 会失败——浏览器把 XML 当成普通 HTML 解析,标签名被小写化、自闭合标签被补全,//book/title 这类表达式根本找不到节点。必须先用 DOMParser 解析成独立的 XMLDocument 实例。

  • DOMParserparseFromString() 第二个参数必须是 "application/xml""text/xml",用 "text/html" 就白解析了
  • 解析后得到的是 XMLDocument,它的 evaluate() 才支持标准 XPath 功能(比如轴、谓词、命名空间)
  • HTML 文档自身的 documentHTMLDocument,不保证支持 XPath 轴如 ancestor:: 或函数如 local-name()

/// 在深层嵌套 XML 中的行为差异

// 是 descendant-or-self 轴的简写,会递归搜索所有层级;/ 是绝对路径起点,必须从根节点开始严格匹配。写错一个斜杠,结果可能全空。

  • XML 根节点是 <library>,里面有 <section><shelf><book><author>...,想定位所有作者:用 //author 可以,但 /author 一定返回空
  • 如果只要第三层 <book> 下的 <title>,写 /library/section/shelf/book/title//book/title 更快更准,尤其 XML 很大时
  • //book[2]/title 表示“文档中第二个 <book> 元素下的 <title>”,不是“每个 <book> 的第二个子元素”——XPath 的谓词作用于当前轴上的节点集,不是嵌套层级

含命名空间的 XML 必须注册前缀,否则 evaluate() 查不到任何节点

很多实际 XML(如 SVG、Atom、SOAP)带命名空间,例如 <rss xmlns="http://purl.org/rss/1.0/">。此时 //item 会返回空,因为默认命名空间没绑定到任何前缀。

Nanonets
Nanonets

基于AI的自学习OCR文档处理,自动捕获文档数据

下载
  • 必须在调用 evaluate() 时传入命名空间解析函数,不能靠 setAttribute("xmlns", ...) 临时补
  • 解析函数形如 (prefix) => prefix === "rss" ? "http://purl.org/rss/1.0/" : null,返回对应 URI 或 null
  • XPath 表达式里得写 //rss:item,不能省略前缀——即使你只用了一个命名空间

常见错误:用 textContent 取值却忽略空白文本节点

XML 中换行缩进会产生 Text 节点,evaluate() 返回的 NodeIteratorSnapshot 里混着它们。直接取 textContent 会把前后空白、换行全拼进去,看着像数据异常。

立即学习前端免费学习笔记(深入)”;

  • 检查 node.nodeType === Node.ELEMENT_NODE 再取值,跳过 TEXT_NODE
  • 更稳妥的做法是用 node.querySelector("title")?.textContent.trim() 配合 DOM 方法兜底(前提是已解析为 XMLDocument
  • 若 XPath 返回多个节点,别假设 iterateNext() 一定有值——要循环判断 !== null,否则容易报 TypeError
const xmlStr = `<library>
  <section>
    <shelf>
      <book id="1">
        <title>JavaScript Guide</title>
        <author>John Doe</author>
      </book>
    </shelf>
  </section>
</library>`;
const parser = new DOMParser();
const xmlDoc = parser.parseFromString(xmlStr, "application/xml");
const result = xmlDoc.evaluate("//book[@id='1']/title/text()", xmlDoc, null, XPathResult.STRING_TYPE, null);
console.log(result.stringValue); // "JavaScript Guide"
深层嵌套本身不难,难的是 XML 解析上下文、命名空间绑定、节点类型判断这三处——漏掉任意一个,evaluate() 都可能静默失败或返回意外结果。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
html5动画制作有哪些制作方法
html5动画制作有哪些制作方法

html5动画制作方法有使用CSS3动画、使用JavaScript动画库、使用HTML5 Canvas等。想了解更多html5动画制作方法相关内容,可以阅读本专题下面的文章。

550

2023.10.23

HTML与HTML5的区别
HTML与HTML5的区别

HTML与HTML5的区别:1、html5支持矢量图形,html本身不支持;2、html5中可临时存储数据,html不行;3、html5新增了许多控件;4、html本身不支持音频和视频,html5支持;5、html无法处理不准确的语法,html5能够处理等等。想了解更多HTML与HTML5的相关内容,可以阅读本专题下面的文章。

471

2024.03.06

html5从入门到精通汇总
html5从入门到精通汇总

想系统掌握HTML5开发?本合集精选全网优质学习资源,涵盖免费教程、实战项目、视频课程与权威电子书,从基础语法到高级特性(Canvas、本地存储、响应式布局等)一应俱全,适合零基础小白到进阶开发者,助你高效入门并精通HTML5前端开发。

297

2025.12.30

html5新老标签汇总
html5新老标签汇总

HTML5在2026年持续优化网页语义化与交互体验,不仅引入了如<header>、<nav>、<article>、<section>、<aside>、<footer>等结构化标签,还新增了<video>、<audio>、<canvas>、<figure>、<time>、<mark>等增强多媒体与

228

2025.12.30

html5空格代码怎么写
html5空格代码怎么写

在HTML5中,空格不能直接通过键盘空格键实现,需使用特定代码。本合集详解常用空格写法:&nbsp;(不间断空格)、&ensp;(半个中文空格)、&emsp;(一个中文空格)及CSS的white-space属性等方法,帮助开发者精准控制页面排版,避免因空格失效导致布局错乱,适用于新手入门与实战参考。

107

2025.12.30

html5怎么做网站教程
html5怎么做网站教程

想从零开始学做网站?这份《HTML5怎么做网站教程》合集专为新手打造!涵盖HTML5基础语法、页面结构搭建、表单与多媒体嵌入、响应式布局及与CSS3/JavaScript协同开发等核心内容。无需编程基础,手把手教你用纯HTML5创建美观、兼容、移动端友好的现代网页。附实战案例+代码模板,快速上手,轻松迈出Web开发第一步!

165

2025.12.31

HTML5建模教程
HTML5建模教程

想快速掌握HTML5模板搭建?本合集汇集实用HTML5建模教程,从零基础入门到实战开发全覆盖!内容涵盖响应式布局、语义化标签、Canvas绘图、表单验证及移动端适配等核心技能,提供可直接复用的模板结构与代码示例。无需复杂配置,助你高效构建现代网页,轻松上手前端开发!

53

2025.12.31

html5怎么使用
html5怎么使用

想快速上手HTML5开发?本合集为你整理最实用的HTML5使用指南!涵盖HTML5基础语法、主流框架(如Bootstrap、Vue、React)集成方法,以及无需安装、直接在线编辑运行的平台推荐(如CodePen、JSFiddle)。无论你是新手还是进阶开发者,都能轻松掌握HTML5网页制作、响应式布局与交互功能开发,零配置开启高效前端编程之旅!

73

2025.12.31

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.4万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号