DataWeave处理XML映射的关键是显式声明命名空间、用[*]处理重复节点、用mapObject+filterObject处理动态字段;必须区分@属性、$.text()文本和子元素,解析前先用write验证结构。

DataWeave 处理复杂 XML 映射的关键不在“能不能”,而在于你是否提前拆解了 XML 的嵌套结构、命名空间和重复节点行为——多数失败都卡在 namespace 声明缺失或 mapObject 误用上。
XML 命名空间必须显式声明,否则字段全为空
DataWeave 默认不自动识别 XML 中的 xmlns,即使输入 XML 有 xmlns="http://example.com/ns",不声明就查不到任何子元素。
- 在脚本顶部用
%namespace ns "http://example.com/ns"绑定前缀(前缀名任意,但需与后续路径一致) - 访问元素时必须带前缀:
payload.ns#Order.ns#Item,不能写payload.Order.Item - 如果 XML 有多个命名空间(如
ns1、ns2),每个都要单独声明,且不能省略前缀 - 默认命名空间(无前缀)要用空字符串声明:
%namespace "" "http://example.com/default"
重复节点(如多个 )必须用 [] 显式接收
XML 中的同名重复节点在 DataWeave 中不会自动转成数组;若你用 payload.ns#Order.ns#Item 访问,只取第一个——除非你明确告诉它“这是个列表”。
- 用
payload.ns#Order.ns#Item map ((item, index) -> {...})迭代处理每个Item - 若源 XML 中
Item可能单个或多个,统一用payload.ns#Order.*ns#Item(*表示“零个或多个”,强制返回数组) - 避免直接写
payload.ns#Order.ns#Item[0]—— 当只有一个Item时会报错,因为非数组类型不支持下标
深层嵌套 + 条件过滤要用 mapObject + filterObject 组合,别硬写路径
当 XML 里有一堆动态 key(比如 ),靠固定路径根本没法映射,得转成键值对再筛选。
- 先用
payload.ns#Order.ns#Fields.*ns#Field mapObject { ($.@name): $.text() }转成对象:{"email": "john@ex.com", "phone": "123"} - 再用
filterObject留下需要的字段:... filterObject $ != null and $ != "" - 注意
.@name是取属性,$.text()是取文本内容(不是$直接取值) - 如果字段名含特殊字符(如连字符),用括号包裹:
{ ($.@'field-name'): $.text() }
%dw 2.0
output application/json
%namespace ns "http://example.com/order"
---
{
orderId: payload.ns#Order.@id,
items: payload.ns#Order.*ns#Item map ((item, index) -> {
sku: item.ns#Product.@sku,
qty: item.ns#Quantity as Number,
price: item.ns#Price as Number
}),
metadata: payload.ns#Order.ns#Fields.*ns#Field
mapObject { ($.@name): $.text() }
filterObject $ != null and $ != ""
}最常被忽略的是:XML 解析后,属性(@id)、文本($.text())、子元素(.ns#Child)三者类型不同,混用会静默失败或返回 null。动手前先用 write(payload, "application/xml") 看一眼解析结果,比猜快十倍。










