XPath中选择注释节点使用comment()节点测试,它匹配XML/HTML中的注释;comment()是节点类型测试而非函数,不接受参数,可用谓词过滤如comment()[contains(.,'TODO')],注意HTML解析器常丢弃注释需用支持工具验证。

XPath 中选择注释节点用 comment() 节点测试(node test),它匹配 XML 或 HTML 文档中的注释节点(即 部分)。
基本语法:用 comment() 选中注释节点
直接写 comment() 就表示“当前上下文下的注释节点”。例如:
-
//comment()—— 选取文档中所有注释节点 -
/html/body/comment()—— 选取 body 元素直接子节点中的注释(注意:注释是节点,可能出现在元素之间) -
comment()[1]—— 选取当前上下文中的第一个注释节点 -
comment()[contains(., 'TODO')]—— 选取内容包含 "TODO" 的注释(.表示注释文本内容)
注意:comment() 不是函数调用,是节点类型测试
comment() 看起来像函数,但其实是 XPath 的“节点测试”,和 text()、node()、* 同类。它不接受参数(除了可选的谓词 [...]),也不能写成 comment('xxx') —— 那样会报错。
常见误区与验证技巧
- HTML 解析器通常会丢弃注释节点(尤其在 innerHTML 或 DOM 渲染后),所以
//comment()在某些环境下返回空 —— 建议用原始 XML 字符串或支持注释的解析器(如 lxml、Saxon)测试 - 注释节点没有标签名,不能用
name(comment())获取名称;它的节点类型是comment,可通过node-name()(XPath 2.0+)或local-name()辅助判断 - 想提取注释里的文字?用
string(comment())或直接comment()/text()(不过注释节点本身没有子 text 节点,推荐用string()包裹)
基本上就这些。用对 comment() 就能精准定位那些藏在代码里的说明性注释了。










