
本文深入探讨了如何利用groovy的强大集合方法,特别是`groupby`和`collect`,将一个扁平的map列表高效地转换为具有父子层级结构的嵌套列表。通过一个具体的示例,文章详细演示了如何根据共同的键(如`coveragetype`)对数据进行分组,并进一步重构每个分组,生成包含父级标识和子级详细信息的新结构,从而实现复杂的数据重塑需求。
引言:数据重塑的挑战
在数据处理和转换中,我们经常会遇到将扁平化的数据结构重塑为更具组织性和层次感的需求。例如,一个包含多个独立记录的列表,我们可能需要根据某个共同的属性将这些记录分组,并将其组织成一个父子(或主从)结构。传统的迭代和条件判断方法可能导致代码冗长且效率低下。Groovy作为一种动态语言,提供了丰富的集合操作方法,能够以简洁、声明式的方式解决这类数据重塑问题。
假设我们有一个fakeList,其中包含多个保险覆盖类型的记录:
def fakeList = [
[coverageType: 'health', amount: 9, expireDate: 2020],
[coverageType: 'insurance', amount: 10, expireDate: 2020],
[coverageType: 'health', amount: 9, expireDate: 2021],
] 我们的目标是将这个列表转换为以下结构:
[
[parent: 'health',
childs: [
[coverage: 'health', amount: '9', expireDate: '2020'],
[coverage: 'health', amount: '9', expireDate: '2021'],
]
],
[parent: 'insurance',
childs: [
[coverage: 'insurance', amount: '10', expireDate: '2020']
]
]
]这种结构将所有coverageType相同的记录归入同一个parent下,并作为其childs列表的元素。
Groovy解决方案核心:groupBy与collect
Groovy的groupBy和collect是实现这种数据重塑的关键工具。groupBy用于将集合中的元素根据某个属性进行分组,而collect则用于对集合中的每个元素进行转换,生成一个新的集合。
第一步:基于共同属性进行分组
首先,我们使用groupBy方法将fakeList中的元素根据coverageType属性进行分组。groupBy方法会返回一个Map,其中键是分组的依据(coverageType的值),值是符合该键的所有原始元素的列表。
def groupList = fakeList.groupBy { it.coverageType }执行上述代码后,groupList的结构将大致如下:
// groupList 的中间结果
[
'health': [
[coverageType: 'health', amount: 9, expireDate: 2020],
[coverageType: 'health', amount: 9, expireDate: 2021]
],
'insurance': [
[coverageType: 'insurance', amount: 10, expireDate: 2020]
]
]第二步:重构分组后的数据为父子结构
接下来,我们对groupList这个Map进行迭代,并使用collect方法将其转换为我们期望的父子结构列表。collect方法接受一个闭包,该闭包对Map的每个条目(键值对)进行处理,并返回一个新的元素。
构建父级元素
在collect的闭包中,我们可以访问到每个分组的coverageType(作为coverageType参数)和对应的原始项目列表(作为items参数)。我们可以创建一个新的Map来表示父级结构,其中parent键对应coverageType。
// ... 承接上文的 groupList
.collect { coverageType, items ->
def map = [:]
map.'parent' = coverageType
// ... 接下来构建 childs
}构建子级元素
对于每个父级结构,其childs键的值应该是一个列表,包含所有属于该coverageType的原始项目。我们需要再次使用collect方法,遍历items列表,将每个原始Map转换为我们期望的子级Map格式。
// ... 承接上文的 map.'parent' = coverageType
map.'childs' = items.collect { item ->
def childMap = [:]
childMap.'coverage' = coverageType // 或者 item.coverageType
childMap.'amount' = item.amount as String // 注意类型转换
childMap.'expireDate' = item.expireDate as String // 注意类型转换
childMap
}
map // 返回完整的父子结构Map
}这里需要注意的是,我们对amount和expireDate进行了as String的类型转换,以确保输出格式与预期一致。
完整示例代码
将上述步骤整合起来,完整的Groovy代码如下:
def fakeList = [
[coverageType: 'health', amount: 9, expireDate: 2020],
[coverageType: 'insurance', amount: 10, expireDate: 2020],
[coverageType: 'health', amount: 9, expireDate: 2021],
]
def groupList = fakeList.groupBy { it.coverageType }
.collect { coverageType, items ->
def map = [:]
map.'parent' = coverageType
map.'childs' = items.collect { item ->
def childMap = [:]
childMap.'coverage' = coverageType // 保持与父级一致,或使用 item.coverageType
childMap.'amount' = item.amount as String // 将数字转换为字符串
childMap.'expireDate' = item.expireDate as String // 将数字转换为字符串
childMap
}
map
}
println groupList输出结果解析
运行上述代码,将得到以下结果:
[
[parent:health, childs:[[coverage:health, amount:9, expireDate:2020], [coverage:health, amount:9, expireDate:2021]]],
[parent:insurance, childs:[[coverage:insurance, amount:10, expireDate:2020]]]
]这个结果精确地匹配了我们预期的父子层级结构,每个coverageType都成为了一个parent,其下方的childs列表包含了所有相关的原始记录,并按照指定的格式进行了转换。
注意事项与最佳实践
- 类型转换: 在构建子级元素时,如果原始数据类型与目标类型不符(例如,原始是Integer,目标是String),请务必进行显式转换,如item.amount as String。
- 键名选择: parent和childs(或children)的键名可以根据实际需求自由定义。
-
子元素结构: 子元素内部的键值对也可以根据需要进行调整。如果希望子元素不带键(例如,['health', '9', '2020']),则可以将childMap的构建逻辑改为直接返回一个列表:
map.'childs' = items.collect { item -> [item.coverageType, item.amount as String, item.expireDate as String] } - Groovy集合方法的链式调用: Groovy的集合方法支持链式调用,使得代码更加紧凑和易读。groupBy之后直接跟collect是其典型应用。
- 闭包的强大: Groovy的闭包是其核心特性之一,它们使得集合操作变得极其灵活和富有表现力。
总结
通过结合使用Groovy的groupBy和collect方法,我们可以优雅且高效地解决复杂的数据重塑问题。这种声明式的编程风格不仅使代码更简洁,也提高了其可读性和可维护性。掌握这些强大的集合操作,是成为一名高效Groovy开发者的关键一步。在处理类似将扁平数据转换为层次结构的需求时,优先考虑利用Groovy提供的这些内置功能,将大大提升开发效率和代码质量。










