XPath是用于在XML文档中查找和定位节点的语言,通过路径表达式导航节点树。它支持基本路径如/bookstore/book选取子元素,//title选取所有同名元素,/bookstore/book[1]选取首个book,/bookstore/book[last()]选取末个book;可用谓语过滤如/bookstore/book[price>30]选价格超30的book,/bookstore/book[title='Harry Potter']选标题匹配的book;能获取属性@category如//book/@category,或文本内容//book/title/text(),还可结合程序语言如Python的lxml库解析XML并执行XPath提取数据,掌握路径与条件筛选即可高效操作XML结构。

XPath 是一门专门用于在 XML 文档中查找和定位节点的语言。它通过路径表达式来导航 XML 的节点树,广泛应用于 XML 解析、数据提取和转换场景中。
选择节点:基本路径表达式
XPath 使用类似文件系统路径的语法来选取 XML 中的元素、属性或其他节点类型。
- /bookstore/book:从根节点开始,选取 bookstore 下的所有 book 子元素。
- //title:从任意位置选取所有名为 title 的元素,不论其在文档中的层级。
- /bookstore/book[1]:选取第一个 book 子元素(索引从 1 开始)。
- /bookstore/book[last()]:选取最后一个 book 元素。
使用谓语过滤节点
谓语用于对节点进行条件筛选,写在方括号 [] 内。
- /bookstore/book[price > 30]:选取价格大于 30 的 book 元素。
- /bookstore/book[title='Harry Potter']:选取标题为 'Harry Potter' 的 book。
- /bookstore/book[1]/title:选取第一个 book 的 title 子元素。
选取属性和文本
XPath 能直接访问属性值和文本内容。
本站介绍了很多 jQuery 幻灯片插件,它们都很优秀,且功能强大,应用在中大型页面上很合适。但如果你的页面很简单,只想要一个简单纯粹的幻灯片效果,这些插件可能略显臃肿。今天我们不用任何插件,写一个简单的响应式幻灯片。
- @category:选取属性节点。例如 //book/@category 获取所有 book 的 category 属性。
- //book/title/text():获取所有 title 元素的文本内容。
- //book[@category='fiction']:选取 category 属性值为 fiction 的 book 元素。
在程序中使用 XPath
大多数编程语言支持 XPath 解析。例如在 Python 中使用 lxml:
from lxml import etreetree = etree.parse("books.xml")
titles = tree.xpath("//title/text()")
print(titles) # 输出所有标题文本
Java 中可使用 JAXP 或 DOM 结合 XPathFactory 实现类似功能。
基本上就这些。掌握常用表达式和谓语,就能高效提取 XML 数据。关键在于理解节点结构和路径逻辑。









