讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 AI 提示词

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

XPath的following-sibling轴如何选择同级？

幻夢星雲

发布时间：2025-08-15 17:36:01

|

623人浏览过

|

来源于php中文网

原创

following-sibling轴用于选择当前节点之后同父级的所有同级节点，其定位精准且仅限于兄弟节点范围内，不会涉及父级、子级或其他无关部分；与following轴不同，following-sibling仅在同级节点中向后查找，而following轴则全局查找文档中所有后续节点，范围更广；通过结合节点名称、位置、属性、文本内容及谓词条件，可实现对特定后续同级节点的精确筛选；在实际网页抓取中，虽面临结构不稳定、动态加载、同级节点混淆、性能开销及不规范html等挑战，但可通过稳定锚点、等待机制、上下文分析和组合定位等策略有效应对，从而构建可靠高效的xpath定位方案。

XPath的following-sibling轴如何选择同级？

XPath的

following-sibling

轴用于选择当前节点之后，与当前节点共享同一父节点的所有同级节点。它是一个非常实用的定位工具，能够帮助我们精准地找到特定元素后面的兄弟姐妹们，而不会牵扯到父级、子级或文档中其他不相关的部分。

解决方案

following-sibling

轴是XPath中一个非常直接且专一的定位方式。想象一下，你站在一排并肩站立的人群中，

following-sibling

就像是你的目光只向右看，找到你身后的所有兄弟姐妹。它从当前节点的“右侧”开始，沿着文档顺序查找所有与当前节点拥有相同父节点的元素。

其基本语法是：

当前节点/following-sibling::节点测试

。这里的“节点测试”可以是具体的元素名（如

div

、

），也可以是通配符

（表示任何元素）。

举个例子，如果你有一个HTML结构：


  第一个段落
  一个跨度
  第二个段落
  一个区块
  第三个段落

如果你当前定位在

一个跨度

这个节点上，使用

./following-sibling::*

，你将选中

第二个段落

的

、

一个区块

的

和

第三个段落

的

。

这个轴的强大之处在于它的“同级”限定。它不会跳到父节点的其他子节点，也不会深入到任何兄弟节点的内部去寻找后代。这种精确性在处理列表、表格或者任何有明确顺序的同级元素时显得尤为重要。

following-sibling

与

following

轴有何不同？

这确实是一个常让人混淆的点，因为名字听起来很像，但它们的功能范围却大相径庭。简单来说，

following-sibling

是“同级限定”的，而

following

轴则是“全局向后”的。

following-sibling

轴，就像我们刚才说的，它只关心与当前节点有同一个父节点，并且在文档顺序上位于当前节点之后的所有兄弟节点。它不会越过父级的边界，也不会钻进兄弟节点的内部去寻找后代。它非常“守规矩”，只在自己的“兄弟圈子”里找。

而

following

轴就“奔放”多了。它会选择文档中所有在当前节点之后出现的节点，无论这些节点是不是当前节点的兄弟，是不是它的后代，甚至是不是在同一个父级下。它会遍历文档中所有位于当前节点之后的位置，包括其他分支的节点，甚至其他主要部分的节点。

举个例子，假设有这样的HTML片段：

如果你当前定位在

S1

这个节点：

Build AI

Build AI

为您的业务构建自己的AI应用程序。不需要任何技术技能。

下载

使用
```
./following-sibling::*
```
，你只会选中
```
P2
```
。因为它是
```
S1
```
的同级兄弟，且位于
```
S1
```
之后。
使用
```
./following::*
```
，你将选中
```
P2
```
、
、
```
P3
```
、
```
S2
```
。因为它会查找文档中所有在
```
S1
```
之后出现的节点，包括其同级、同级元素的后代（如果存在）、以及文档中后续的任何元素。

所以，当你明确知道目标元素就在当前元素的旁边，且是同级时，

following-sibling

是首选，它更精确，也通常更高效。当你需要查找文档中任何位于当前元素之后，但关系不那么明确的元素时，

following

轴才派上用场。

如何精确选择特定类型的后续同级节点？

仅仅使用

following-sibling::*

可能过于宽泛，很多时候我们需要更精细的控制。XPath的强大之处在于它允许你通过谓词（

[]

）来进一步筛选结果。

按节点名称筛选： 这是最常见的用法。如果你知道你想要的后续同级节点是什么类型的元素，直接指定它的标签名。例如：
```
./following-sibling::p
```
会选择所有后续的
同级节点。
```
./following-sibling::div
```
会选择所有后续的
同级节点。
按位置筛选： 当你需要选择第N个后续同级节点时，可以使用
```
[position()]
```
。例如：
```
./following-sibling::p[1]
```
会选择当前节点之后的第一个
同级节点。
```
./following-sibling::*[last()]
```
会选择所有后续同级节点中的最后一个。
```
./following-sibling::*[position() > 1 and position() < 4]
```
会选择第二个到第三个后续同级节点。
按属性筛选： 如果后续同级节点有特定的属性，你可以用
```
[@attribute='value']
```
来定位。例如：
```
./following-sibling::div[@class='info']
```
会选择所有后续的
同级节点中，
```
class
```
属性值为
```
info
```
的节点。
```
./following-sibling::p[contains(@id, 'summary')]
```
会选择所有后续的
同级节点中，
```
id
```
属性包含
```
summary
```
的节点。
按文本内容筛选： 你也可以根据同级节点的文本内容进行筛选，这在某些场景下非常有用。例如：
```
./following-sibling::span[contains(text(), '重要信息')]
```
会选择所有后续的
同级节点中，包含“重要信息”文本的节点。
```
./following-sibling::h2[normalize-space(.) = '产品详情']
```
会选择后续的
同级节点中，文本内容（去除首尾空白）精确为“产品详情”的节点。
组合筛选条件： 这些条件可以组合使用，以实现更复杂的定位。例如：
```
./following-sibling::p[@class='item' and position() = 2]
```
会选择所有后续的
同级节点中，
```
class
```
为
```
item
```
且是第二个出现的节点。

通过这些谓词的灵活运用，

following-sibling

轴的定位能力得到了极大的增强，能够帮助我们从复杂的HTML结构中精确地提取所需信息。

following-sibling

轴在实际网页抓取中可能遇到哪些挑战？

尽管

following-sibling

轴非常强大且精准，但在实际的网页抓取或自动化过程中，它也并非万无一失，会遇到一些挑战。理解这些挑战有助于我们构建更健壮、更适应变化的抓取策略。

网页结构的不稳定性： 这是最常见的挑战。很多网站，特别是那些频繁更新或由内容管理系统驱动的网站，其HTML结构可能会在不经意间发生变化。一个原本位于特定元素之后的兄弟节点，可能因为新元素的插入、旧元素的移除，或者只是顺序的调整，导致你依赖的
```
following-sibling
```
路径失效。
- 应对思路： 尽量寻找更稳定的定位点（如带有唯一ID或稳定class的父节点），然后从该稳定点出发，结合
```
following-sibling
```
  以及其他轴（如
```
./*
```
  或
```
./div[2]
```
  ）进行相对定位。或者，考虑使用多个备用XPath路径。
动态加载内容： 现代网页大量使用JavaScript进行内容渲染和异步加载。你期望通过
```
following-sibling
```
定位的元素，可能在初始页面加载时并不存在于DOM中，而是通过AJAX请求或用户交互后才动态添加。此时，如果你的抓取器在内容完全加载之前就尝试查找，就会失败。
- 应对思路： 使用Selenium、Playwright等工具，它们能模拟浏览器行为，并提供等待机制（如
```
WebDriverWait
```
  ），等待特定元素出现或特定条件满足后再执行XPath查询。
混淆的同级节点： 有时，一个元素后面可能会跟着很多同类型但语义不同的同级节点，或者这些节点之间没有明显的属性或文本差异来区分。例如，一系列没有独特class或id的
或
。
- 应对思路： 这时候就需要结合上下文，可能需要回溯到它们的共同父节点，然后通过更复杂的谓词（如
```
[contains(., '关键字')]
```
  、
```
[not(@class)]
```
  ）来区分。或者，如果可能，尝试寻找一个更独特的“锚点”元素，从它开始定位。
性能考虑： 在非常庞大和复杂的HTML文档中，如果
```
following-sibling
```
轴的起始点位于文档较靠前的位置，并且后面跟着大量的同级节点，那么解析和遍历这些节点可能会带来一定的性能开销。虽然通常情况下这不是主要瓶颈，但在大规模抓取时也值得注意。
- 应对思路： 尽量缩小搜索范围，从更具体的父节点或祖先节点开始，减少不必要的遍历。例如，如果目标元素在一个特定的
```
div
```
  内部，先定位到那个
```
div
```
  ，再在该
```
div
```
  的上下文中进行
```
following-sibling
```
  查找。
不规范的HTML结构： 某些网站的HTML可能不完全符合标准，或者存在一些结构上的“怪癖”。例如，本应是兄弟关系的元素，由于开发者疏忽，可能被错误地嵌套在另一个不相关的元素内部，导致
```
following-sibling
```
无法找到它们。
- 应对思路： 这时候可能需要更灵活的策略，比如使用
```
following::
```
  轴（如果目标在文档后面任何位置都行），或者回退到CSS选择器，甚至结合正则表达式来处理一些非常规的文本内容匹配。

总的来说，

following-sibling

是一个极其有用的工具，但它并非万能。在实际应用中，我们需要结合对网页结构的理解、对动态内容的感知，以及与其他XPath轴或定位方法的灵活组合，才能构建出稳定且高效的网页数据抓取解决方案。

相关文章

XPath的id()函数怎么快速查找具有特定ID的元素

Python lxml库怎么安装和使用 lxml解析XML教程

如何在网页中嵌入SVG XML代码

Python lxml和libxml2的关系是什么

如何用CSS选择器查询XML文档 querySelector

Windows激活工具

Windows激活工具

Windows激活工具是正版认证的激活工具，永久激活，一键解决windows许可证即将过期。可激活win7系统、win8.1系统、win10系统、win11系统。下载后先看完视频激活教程，再进行操作，100%激活成功。

下载

相关标签:

css 浏览器工具 ai webdriver 异步加载 css选择器相对定位 ajax 正则表达式 class Attribute dom 异步选择器 position 自动化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：XPath的contains()方法怎么用？有哪些应用场景？下一篇：XPath的descendant轴如何选择所有后代？

作者最新文章

CAD看图王怎么批量打印 CAD看图王多图快速打印教程【干货】

2026-01-31 11:50

Java配置环境变量配置 | Windows和macOS系统环境变量配置指南

2026-01-31 12:03

2026杭州中小学寒假放假时间_2026年杭州中小学校历安排通知

2026-01-31 12:04

AI辅助进行社群运营，自动回复和内容生成

2026-01-31 12:09

汉典安卓版下载入口汉典iOS版下载地址入口

2026-01-31 12:10

12123高速违章怎么处理 12123高速扣分罚款标准2026新规

2026-01-31 12:24

手机微信文件过期了怎么找回微信过期文件恢复步骤【干货】

2026-01-31 13:00

蓝海搜书永久有效入口蓝海搜书免费小说搜索引擎

2026-01-31 13:12

谷歌商店App最新版下载_Google Play安卓手机版官方入口

2026-01-31 13:26

Clawdbot抢票会被12306封号吗 Clawdbot安全抢票防封号教程【方法】

2026-01-31 13:33

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

更多

ajax教程

ajax教程

php中文网为大家带来ajax教程合集，Ajax是一种用于创建快速动态网页的技术。通过在后台与服务器进行少量数据交换，Ajax可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下，对网页的某部分进行更新。php中文网还为大家带来ajax的相关下载资源、相关课程以及相关文章等内容，供大家免费下载使用。

160

2023.06.14

ajax中文乱码解决方法

ajax中文乱码解决方法

ajax中文乱码解决方法有设置请求头部的字符编码、在服务器端设置响应头部的字符编码和使用encodeURIComponent对中文进行编码。本专题为大家提供ajax中文乱码相关的文章、下载、课程内容，供大家免费下载体验。

160

2023.08.31

ajax传递中文乱码怎么办

ajax传递中文乱码怎么办

ajax传递中文乱码的解决办法：1、设置统一的编码方式；2、服务器端编码；3、客户端解码；4、设置HTTP响应头；5、使用JSON格式。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

117

2023.11.15

ajax网站有哪些

ajax网站有哪些

使用ajax的网站有谷歌、维基百科、脸书、纽约时报、亚马逊、stackoverflow、twitter、hacker news、shopify和basecamp等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

235

2024.09.24

js正则表达式

js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法，还有更多js正则表达式的相关文章、相关下载、相关课程，供大家免费下载体验。

515

2023.06.20

正则表达式不包含

正则表达式不包含

正则表达式，又称规则表达式,，是一种文本模式，包括普通字符和特殊字符，是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串，通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章，希望对大家能有所帮助。

251

2023.07.05

java正则表达式语法

java正则表达式语法

java正则表达式语法是一种模式匹配工具，它非常有用，可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题，供大家免费下载体验。

749

2023.07.05

java正则表达式匹配字符串

java正则表达式匹配字符串

在Java中，我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容，帮助大家解决问题。

215

2023.08.11

2026赚钱平台入口大全

2026赚钱平台入口大全

2026年最新赚钱平台入口汇总，涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道，助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

33

2026.01.31

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

Sass 教程

Sass 教程

共14课时 | 0.8万人学习

Bootstrap 5教程

Bootstrap 5教程

共46课时 | 3.1万人学习

CSS教程

CSS教程

共754课时 | 25.6万人学习

最新文章

更多

如何用Puppeteer或Playwright提取动态网页生成的XML

EDI X12标准与XML之间的映射怎么做？

ARM模板/Bicep如何部署一个带XML上传功能的Azure App Service

Final Cut Pro的XML文件怎么用 FCPXML详解

Python lxml库的etree和objectify有什么区别

Watchdog库是什么如何用Python监控文件夹变化并上传XML

如何用AI或机器学习自动推荐XML映射规则

Qt C++如何实现XML文件上传 QNetworkAccessManager

SvelteKit如何处理XML文件上传 Form Actions和API路由

ASP.NET Core如何使用XmlSchemaSet验证上传的XML

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部