XPath 的 id() 函数不推荐用于查找 ID 元素,因其依赖 DTD 中声明的 ID 类型属性,而 HTML 通常无此声明;应使用 //*[id='header'] 或 CSS 选择器 #header。

XPath 的 id() 函数**并不推荐用于快速查找 ID 元素**,而且在大多数实际场景中它根本不起作用——不是因为写法错,而是因为它的行为和大家直觉想的完全不一样。
id() 函数的真实用途
id() 是 XPath 1.0 定义的函数,但它**不按元素的 id 属性值去搜索**,而是依据 XML 文档的 DTD(文档类型定义)中声明的 ID 类型属性来定位。也就是说:
- HTML 文件通常没有 DTD 声明,或即使有也不声明
id属性为ID类型; - 现代浏览器解析 HTML 时忽略 DTD,
id()在绝大多数网页中返回空结果; - 它只对严格符合 XML + DTD 规范、且
id被显式声明为ID类型的文档才有效(比如某些老派 XML 应用)。
真正快速查 ID 元素的写法
要找 id="header" 的元素,直接用属性匹配即可,简洁又可靠:
//*[@id='header'] 或更精准的 //div[@id='header']
- 支持所有 XPath 引擎(Selenium、lxml、浏览器控制台等);
- 性能好:现代解析器对
@id有优化,尤其在 HTML 中id值通常唯一; - 语义清晰,无需依赖 DTD,开箱即用。
为什么有人误以为 id() 很快?
早期 XPath 规范文档提到 id() “可能被实现为哈希查找”,暗示它理论上可以很快。但这是针对符合 DTD 要求的 XML 场景,且实际引擎(如 libxml2)也极少为此做专门优化。现实中,//*[@id='xxx'] 的执行速度和可读性都更优。
补充:CSS 选择器更简单
如果工具支持(如 Selenium 4+、Playwright、浏览器 DevTools),直接用 CSS 选择器更快更自然:
#header —— 等价于 //*[@id='header'],但更短、更通用、解析更快。
不需要记函数名,也不用担心 DTD,一行搞定。
基本上就这些。别被 id() 的名字骗了——查 ID,认准 @id= 或 #id 就行。









