0

0

XPath语法怎么学 XPath路径表达式入门教程

畫卷琴夢

畫卷琴夢

发布时间:2026-02-05 08:20:03

|

432人浏览过

|

来源于php中文网

原创

XPath学习核心是建立“文档树+定位逻辑”直觉,掌握//(全文搜索)、/(根路径)、@(属性选取)三类符号及谓词筛选、父子/兄弟关系定位技巧。

xpath语法怎么学 xpath路径表达式入门教程

学XPath路径表达式,核心不是背规则,而是建立“文档树+定位逻辑”的直觉。它不难,关键在理解节点关系和常用表达式的实际作用。

从三个最常用的路径符号开始

刚上手时,只记牢这三类写法,就能覆盖80%的使用场景:

  • //:全文搜索——不管元素在哪一层,只要名字对就抓出来。
    例如 //a 找所有超链接,//div[@class="content"] 找所有 class 是 content 的 div。
  • /:从根往下走——适合结构清晰、层级固定的文档(如 XML 配置文件)。
    例如 /bookstore/book/title 表示“根下的 bookstore → 其下的 book → 再其下的 title”。
  • @:专门用来取属性——写在方括号里配合元素名使用。
    例如 //img[@src] 找所有带 src 属性的图片,//button[@type="submit"] 精准定位提交按钮。

用谓词(方括号里的条件)做精准筛选

光找元素不够,经常要“找第几个”“找含某文字的”“找属性值匹配的”。这些都靠谓词实现:

塔猫ChatPPT
塔猫ChatPPT

塔猫官网提供AI一键生成 PPT的智能工具,帮助您快速制作出专业的PPT。塔猫ChatPPT让您的PPT制作更加简单高效。

下载
  • //li[1]:第一个 li(注意 XPath 序号从 1 开始,不是 0)
  • //li[last()]:最后一个 li
  • //a[contains(@href, "github")]:href 里包含 github 的链接
  • //p[starts-with(text(), "温馨提示")]:段落开头是“温馨提示”的文本
  • //div[@data-id and @data-id!=""]:有 data-id 属性且非空的 div

掌握两个实用关系定位技巧

真实网页中,目标元素往往没有稳定 class 或 id,但周围有固定参照物。这时用相对关系更可靠:

  • 父节点//span[text()="价格"]/../span[2] —— 先找到写着“价格”的 span,再往上到父级,再找它下面第二个 span(常用于表格或标签对)
  • 兄弟节点//label[text()="邮箱"]/following-sibling::input[1] —— 找到“邮箱”label,取它后面紧挨着的第一个 input(适合表单定位)
  • 当前节点//ul/li 选中所有 li 后,再用 ./a./span[@class="name"] 在每个 li 内部继续提取,避免重复写长路径

边学边练的小建议

别光看,动手试才记得住:

  • 打开 Chrome 浏览器,按 F12 进入开发者工具,在 Console 里输入 $x("//title"),立刻看到匹配的 title 元素
  • 用 Python + lxml 或 parsel 库写两行代码:
    from parsel import Selector
    sel = Selector(text=html_str); print(sel.xpath('//div/text()').getall())
  • 遇到复杂页面,先用浏览器右键“检查”,观察 HTML 结构,再对着结构写 XPath,比凭空猜快得多

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
chrome什么意思
chrome什么意思

chrome是浏览器的意思,由Google开发的网络浏览器,它在2008年首次发布,并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容,供大家免费下载体验。

889

2023.08.11

chrome无法加载插件怎么办
chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

765

2023.11.06

python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

187

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

4

2026.02.03

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1914

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2096

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1099

2024.11.28

class在c语言中的意思
class在c语言中的意思

在C语言中,"class" 是一个关键字,用于定义一个类。想了解更多class的相关内容,可以阅读本专题下面的文章。

534

2024.01.03

java连接字符串方法汇总
java连接字符串方法汇总

本专题整合了java连接字符串教程合集,阅读专题下面的文章了解更多详细操作。

7

2026.02.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.9万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号