用lxml解析带命名空间的XML需显式声明namespace map字典,键为查询前缀、值为URI;xpath/find等方法须传入该映射且查询路径带对应前缀,否则返回空结果。

用 lxml 解析带命名空间的 XML,关键在于正确声明和使用命名空间映射(namespace map),否则 xpath 或 find 类方法会找不到元素。
命名空间必须显式声明才能被识别
lxml 不会自动解析或“理解” XML 中的 xmlns 声明,所有带前缀的查询都依赖你传入的命名空间字典。比如 XML 中有:
你就得手动构造映射:ns_map = {"ns": "http://example.com/ns"}
然后在 xpath() 或 find() 中使用该前缀。
用字典定义命名空间映射
命名空间映射是一个普通 Python 字典,键是查询时用的前缀(如 "ns"),值是对应的实际 URI(如 "http://example.com/ns")。它不需与 XML 中的前缀一致,但要保持内部统一。
- 可以省略默认命名空间(
xmlns="..."),但若要查它,需用任意前缀(如"d")映射到该 URI - 多个命名空间就往字典里加多个键值对,例如:
{"a": "http://A", "b": "http://B"} - 字典可复用,建议定义为常量或函数外变量,避免重复创建
xpath 查询必须带前缀,且前缀需在命名空间字典中存在
写 xpath 时,所有带命名空间的标签都必须加上你在字典里定义的前缀,例如://ns:item、/root/ns:item/text()。如果漏了前缀,或前缀没在字典里注册,就查不到结果,也不会报错,只会返回空列表或 None。
本文档主要讲述的是Python之模块学习;python是由一系列的模块组成的,每个模块就是一个py为后缀的文件,同时模块也是一个命名空间,从而避免了变量名称冲突的问题。模块我们就可以理解为lib库,如果需要使用某个模块中的函数或对象,则要导入这个模块才可以使用,除了系统默认的模块(内置函数)不需要导入外。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看
立即学习“Python免费学习笔记(深入)”;
- 正确示例:
root.xpath("//ns:item/text()", namespaces=ns_map) - 错误示例:
root.xpath("//item/text()")(忽略命名空间)或root.xpath("//ns:item", namespaces={"other": "..."})(前缀不匹配) - 查默认命名空间时,先给它起个前缀:
ns_map = {"d": "http://example.com/default"},再用//d:item
find / findall 也支持 namespaces 参数(lxml 4.0+)
除了 xpath(),find()、findall()、iterfind() 等方法从 lxml 4.0 开始也支持 namespaces 参数,用法和 xpath 一致:
root.find("ns:item", namespaces=ns_map)root.findall(".//ns:item", namespaces=ns_map)- 注意:点号路径(如
".//")在 find 系列中有效,但不支持完整 xpath 表达式(如函数调用),此时仍要用xpath()









