XPath轴是描述从当前节点向特定方向查找其他节点的定位机制,共13个但常用8个:child::、descendant::、parent::(简写..)、ancestor::、following-sibling::、preceding-sibling::、following::、self::,均遵循“轴名::节点测试[谓词]”语法。

XPath轴(Axes)是XPath中用来描述“从当前节点出发,往哪个方向找其他节点”的定位机制。它不是路径本身,而是定义节点间关系的方向指令——比如找爸爸、找儿子、找后面兄弟、找所有爷爷等。掌握轴,才能摆脱死记硬背的绝对路径,写出稳定、可读、抗结构变化的表达式。
8个最常用XPath轴及写法
虽然XPath共定义13个轴,但日常95%以上场景只用以下8个。它们按使用频率和实用性排序,附带等价简写和典型用途:
-
child:::找直接子节点。可省略,
//ul/li等价于//ul/child::li -
descendant:::找所有后代(子孙),等价于
//的完整写法。//div//span=//div/descendant::span -
parent:::找父节点。最常用之一,简写为
..。//span[text()='价格']/..比//span[text()='价格']/parent::div更简洁 -
ancestor:::找所有祖先(父、祖父、曾祖父……)。加谓词可精准锁定,如
//span[@class='price']/ancestor::li[1]找最近一层 li 祖先 -
following-sibling:::找同级中“排在后面”的兄弟节点。
//th[text()='单价']/following-sibling::td[1]定位对应数据列 -
preceding-sibling:::找同级中“排在前面”的兄弟节点。
//li[@aria-current='true']/preceding-sibling::li[1]获取上一个导航项 -
following:::找文档中“当前节点结束标签之后”的任意位置第一个匹配节点,跨层级无压力。
//label[text()='验证码']/following::input[1]极其稳,不依赖是否同层 -
self:::就指当前节点自己,常用于条件判断或强调身份。
//div[self::div[contains(@class,'modal')]]确保选中的就是 div 类型的 modal 容器
轴的语法结构与关键细节
所有轴都遵循统一格式:轴名称::节点测试[谓词]。其中:
-
节点测试可以是具体标签名(如
div)、通配符*、文本节点text()或node() -
谓词(方括号内)用于进一步筛选,支持索引(
[1])、属性([@id])、函数([contains(@class,'btn')])等 - 轴名后必须跟两个冒号
::,不能写成:或漏掉 -
descendant-or-self::和ancestor-or-self::这类带-or-self的轴会把当前节点也纳入结果集,注意和纯descendant::/ancestor::的区别
实战中怎么选对轴?看这4类典型场景
别硬背,按目标反推方向:
-
要向上走:当前节点内容明确,但父容器没 id/class → 用
parent::或ancestor::。例如点击文字“提交”按钮,实际要点的是它外面的button或div -
要向右找同行数据:表格里根据表头文字定位对应单元格 → 用
following-sibling::(同层)或following::(不怕嵌套) -
要向下穿透多层:某个区域 class 固定,但内部结构经常变 → 用
descendant::替代多层/div/div/span,更鲁棒 -
要限定自身特征:需确认节点类型+属性同时成立(如“是个 div 且有 data-role=‘sidebar’”)→ 用
self::div[@data-role='sidebar']
避坑提醒:常见错误和优化习惯
写轴时容易踩的几个坑,直接影响稳定性:
- 滥用
following::却不加索引 →//input/following::div可能命中页面末尾无关 div;应写成//input/following::div[1] - 混淆
following-sibling::和following::→ 前者必须同级,后者无视层级;表格中错用 sibling 会导致找不到跨tr的单元格 - 用
ancestor::*太宽泛 → 改为ancestor::form[1]或加 class 限定,避免误选外层大容器 - 过度依赖下标(如
div[2])→ 结构微调即失效;优先用轴 + 属性/文本组合,而非位置序号








