谓词是XPath中用于筛选节点的方括号表达式,根据布尔条件过滤前一步的节点集。常见用法包括:[1]取第一个节点,[last()]取最后一个,[position()

XPath中的谓词(Predicate)是一对方括号 [...],用于对节点集进行条件筛选,只保留满足条件的节点。它不是独立语法,而是紧跟在路径表达式后面,像“过滤器”一样作用于前一步选中的节点集合。
谓词的基本写法和常见用法
谓词内写的是布尔表达式,XPath会为当前节点集里的每个节点单独计算该表达式;结果为 true 的节点才被保留在最终结果中。
- [1]:取第一个节点(注意XPath索引从1开始,不是0)
- [last()]:取最后一个节点
- [position() :取前两个节点
- [@class = "active"]:选取具有 class 属性且值为 "active" 的元素
- [text() = "提交"]:选取文本内容恰好是“提交”的元素
用属性和子节点做条件过滤
谓词常结合属性(@attr)或子表达式(如 child::span 或简写的 span)来精确定位。
- //div[@id="nav"]/a[@href]:先选 id 为 nav 的 div 下所有 a 元素,再过滤出其中带有 href 属性的 a
- //ul/li[a/span]:选取 ul 下所有包含 a 元素、且该 a 内部又含有 span 的 li 节点
- //input[@type="text" and contains(@name, "user")]:同时满足 type 是 text、name 包含 "user" 的 input 元素
嵌套谓词与位置计算细节
谓词可以嵌套使用,但要注意位置函数(如 position()、last())的“上下文”是当前谓词所作用的那层节点集。
- //table/tr[2]/td[1]:先取所有 table 的第二个 tr,再从中取第一个 td(不是每行的第一个 td)
- //tr[td[2]/text() = "已完成"]:选取第二个 td 文本为“已完成”的所有 tr 行
- //div[.//button[@type="submit"]]:选取内部任意位置含有 submit 按钮的 div(. 表示当前节点)
基本上就这些。谓词本质是“按需裁剪”,写的时候想清楚:我上一步得到了什么节点集?现在要保留其中哪些?条件写进方括号里就行,不复杂但容易忽略细节。









