count()统计节点数量,不能直接作布尔判断;应使用boolean()或节点集本身;contains()仅接受字符串参数,需用string()转换节点集,且区分大小写。

count() 函数用来统计节点数量,不是判断存在与否
很多人误以为 count() 能直接当布尔条件用,比如写成 count(//div[@class="item"]) > 0 来“检查有没有 item”,这在语法上合法,但效率低且易出错。XPath 1.0 不支持布尔比较运算符直接作用于函数结果(某些解析器会隐式转换,但行为不统一)。
真正该用的写法是:boolean(//div[@class="item"]) 或更简洁的 //div[@class="item"] 本身——只要至少匹配一个节点,整个表达式就为 true(在 if/condition 场景下)。
-
count(//li)返回数字,比如3;它不能直接放进if判断里(除非解析器自动转布尔) - 想筛选「有至少两个子段落的 article」,得写:
//article[count(p) >= 2] - 注意:
count()的参数必须是节点集(node-set),传字符串或空值会报错,例如count("abc")在标准 XPath 1.0 中非法
contains() 判断子字符串,只接受两个字符串参数
contains() 是纯字符串函数,第一个参数必须是字符串,第二个是待查找的子串。常见错误是直接往里塞节点集,比如 contains(//h1, "登录") —— 这在多数 XPath 引擎中会失败,因为 //h1 是节点集,不是字符串。
正确做法是先取文本内容:contains(//h1/text(), "登录"),或者更稳妥地用 string() 显式转换:contains(string(//h1), "登录")。
- 如果
//h1匹配多个元素,string(//h1)只返回第一个的文本(XPath 1.0 规则),所以需确认是否真要这样 -
contains()区分大小写,contains(., "API")不会匹配 “api” 或 “Api” - 不能用于正则匹配,要模糊匹配开头/结尾,请组合使用
starts-with()或ends-with()(后者 XPath 2.0+ 才支持)
在 Selenium 或 lxml 中调用时,括号和引号容易写错
实际代码里,XPath 表达式是字符串,嵌套引号和括号极易混乱。比如 Python + lxml 中写:
//div[contains(@class, "btn-primary")]是对的,但下面这些常见写法会出错:
- 漏掉外层引号:
tree.xpath(//div[contains(@class, "btn")])→ 缺少字符串引号,Python 直接报语法错误 - 引号嵌套冲突:
tree.xpath("//div[contains(@title, "Edit")]")→ 内外都是双引号,Python 解析失败 - 正确写法之一:
tree.xpath('//div[contains(@title, "Edit")]')(外单内双) - 或者用转义:
tree.xpath("//div[contains(@title, \"Edit\")]")
另外注意:Selenium 的 find_element(By.XPATH, ...) 对 XPath 版本支持有限,默认按 XPath 1.0 解析,别指望 ends-with() 或正则函数能用。
组合使用 count() 和 contains() 容易忽略求值顺序
像 //ul[count(li[contains(., "error")]) > 0] 这种嵌套,表面看是“找包含 error 的 li 所在的 ul”,但实际逻辑是:对每个 //ul,计算其内部所有 li 中文本含 "error" 的个数,再判断是否大于 0。
关键点在于:XPath 是从左到右、由外向内求值的,li[contains(., "error")] 先过滤出符合条件的 li,count() 再统计它们的数量——不是先 count(li) 再判断内容。
- 错误理解:
count(li[contains(., "error")]) > 0≡ “li 总数 > 0 且其中某个含 error” → 不对,它等价于 “含 error 的 li 数量 > 0” - 如果某
ul有 5 个li,但只有 1 个含 "error",这个表达式仍为 true - 性能提示:深层嵌套的
contains()+count()在大文档中可能变慢,可考虑先用boolean()粗筛
复杂嵌套的真实难点不在语法,而在你是否清楚当前上下文节点是什么、函数作用域落在哪一层——多打几个 count(*) 或 name() 调试一下,比硬猜靠谱。










