XPath是一种用于在XML文档中定位节点的查询语言,通过路径表达式导航元素、属性等。它将XML视为树形结构,支持从根节点(/)或任意位置(//)开始查找,.表示当前节点,..表示父节点,@用于选取属性。使用谓语[ ]可按索引如[1]、[last()]或属性值[@category='fiction']筛选节点。结合轴(如child::、ancestor::、following-sibling::)和函数(如contains()、starts-with()),可实现精确匹配。掌握这些基本结构与函数即可高效定位XML中的任意节点。

XPath 是一门用于在 XML 文档中查找和定位节点的查询语言。它通过路径表达式来导航 XML 文档的各个部分,比如元素、属性、文本内容等,广泛应用于 XML 解析、XSLT 转换以及自动化测试等领域。
XPath 的基本结构
XPath 把 XML 文档看作一棵树形结构,每个标签、属性、文本都被视为一个节点。通过路径表达式,可以精确地选择需要的节点。
常见的路径表达方式包括:
- /:从根节点开始选择。例如 /bookstore/book 表示从根开始,选择 bookstore 下的所有 book 元素。
- //:从文档中任意位置匹配节点。例如 //title 会选择所有名为 title 的元素,无论它们在什么位置。
- .:表示当前节点。
- ..:表示父节点。
- @:用于选取属性。例如 //book/@category 选择所有 book 元素的 category 属性。
使用谓语筛选节点
谓语(用方括号 [] 包裹)用来进一步限定选择条件,常用于根据索引或属性值过滤节点。
- //book[1]:选择第一个 book 元素(注意:XPath 索引从 1 开始)。
- //book[last()]:选择最后一个 book 元素。
- //book[@category='fiction']:选择 category 属性值为 fiction 的 book。
- //title[text()='Harry Potter']:选择文本内容为 "Harry Potter" 的 title 元素。
常用轴和函数辅助定位
XPath 提供了“轴”来定义节点的相对位置关系,结合函数可实现更复杂的定位。
- child:::选择当前节点的子节点。如 //book/child::title。
- ancestor:::选择所有祖先节点。
- following-sibling:::选择之后的同级节点。
- contains():模糊匹配文本或属性。例如 //book[contains(title, 'Potter')]。
- starts-with():判断是否以某字符串开头。
基本上就这些。掌握基础路径、谓语和常用函数,就能高效地在 XML 中定位所需节点。实际使用时结合具体结构灵活调整表达式即可。










