XPath通过count()函数可精确筛选子元素数量为N的节点,如//div[count()=2];需避免使用count(text())或count(node())以防误统计文本或注释节点。

XPath 本身不直接支持“子节点数量等于 N”的语法,但可以通过 count() 函数配合谓词([])实现。关键是要区分“子元素节点”和“所有子节点”(含文本、注释等),通常你想要的是**子元素节点数量**。
使用 count(*) = N —— * 只匹配元素节点,忽略文本、换行、注释等:
//div[count(*) = 2]:选所有恰好包含 2 个子元素的 <div>
<li>
<code>//ul[count(./li) = 3]:选所有恰好包含 3 个 <li> 子元素的 <ul></ul>
<li>
//table[count(./tbody/tr) >= 5]:选 <tbody> 中至少有 5 行的 <code><table>
<h3>注意:别误用 text() 或 <a style="color:#f60; text-decoration:underline;" title="node" href="https://www.php.cn/zt/15853.html" target="_blank">node</a>()</h3>
<p><code>count(text()) 统计的是文本节点个数(比如换行、空格、实际文字都算一个节点),容易出错;count(node()) 包含所有类型子节点(元素、文本、注释、处理指令),一般不实用。
例如:<div>\n <span>A</span>\n <em>B</em>\n</div> 中:
count(*) → 2(<span></span> 和 <em></em>)
<li>
count(text()) → 3(前后两个换行 + 中间换行,即使看不见也存在)
<li>
count(node()) → 5(3 个文本节点 + 2 个元素节点)
结合比较运算符更灵活:
//section[count(*) > 0]:有至少一个子元素的 <section></section>
<li>
//td[count(*) = 0]:完全不含子元素(即纯文本或空)的
<li>
//form[count(./input | ./select | ./textarea) >= 3]:含至少 3 个表单控件的 <form></form>
兼容性提示
count() 在 XPath 1.0 就已支持,所有主流浏览器、Selenium、lxml 等都可用。但 XPath 2.0+ 的 count() 支持更复杂序列,日常使用 XPath 1.0 表达式已足够。
基本上就这些 —— 记住用 count(*),不是 count(node()),就能准确按子元素数量筛选。
以上就是XPath怎么选择具有特定数量子节点的元素的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号