
本文详细介绍了如何利用java stream api,结合`collectors.groupingby`和`collectors.mapping`,对jpa实体数据进行高效的分组操作,并实现对分组结果值的自定义转换。通过这种方式,可以将实体列表按指定属性(如城市)分组,并将每个分组中的实体对象映射为另一个指定属性(如姓名)的列表,从而获得简洁且高度定制化的数据结构,显著提升代码的优雅性和处理效率。
在数据处理中,经常需要对集合中的对象进行分组,并对每个分组内的元素进行进一步的转换。例如,从数据库中检索出一组用户记录,我们可能希望按城市对用户进行分组,但最终结果不是每个城市对应一个用户实体列表,而是每个城市对应一个用户姓名的列表。这种需求在传统命令式编程中可能需要多步操作,而在Java Stream API的帮助下,可以以更声明式、更简洁的方式实现。
场景描述与传统实现
假设我们有一个RegistryEntity实体类,其结构如下:
public class RegistryEntity {
private Long id;
private String name;
private String city;
// 构造函数
public RegistryEntity(Long id, String name, String city) {
this.id = id;
this.name = name;
this.city = city;
}
// Getter方法
public Long getId() { return id; }
public String getName() { return name; }
public String getCity() { return city; }
// Setter方法 (根据需要添加)
public void setId(Long id) { this.id = id; }
public void setName(String name) { this.name = name; }
public void setCity(String city) { this.city = city; }
@Override
public String toString() {
return "RegistryEntity{" +
"id=" + id +
", name='" + name + '\'' +
", city='" + city + '\'' +
'}';
}
}我们从JPA仓库中获取到一个RegistryEntity列表,例如:
| Id | Name | City |
|---|---|---|
| 1 | John | New York |
| 2 | Paul | Atlanta |
| 3 | Mark | Los Angeles |
| 4 | Susan | Los Angeles |
| 5 | Josh | New York |
| 6 | Charles | Atlanta |
我们的目标是将其转换为Map
立即学习“Java免费学习笔记(深入)”;
{"New York":["John","Josh"],"Atlanta":["Paul", "Charles"],"Los Angeles":["Mark","Susan"]}一个常见的传统(命令式)实现方式可能如下:
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
public class DataProcessor {
public Map> findAllUsersGroupedByCity(List items) {
Map> itemsGrouped = new HashMap<>();
for (RegistryEntity s : items) {
String city = s.getCity();
String name = s.getName();
// 如果城市已存在于Map中,则将姓名添加到对应的列表中
if (itemsGrouped.containsKey(city)) {
itemsGrouped.get(city).add(name);
} else {
// 如果城市不存在,则创建一个新的列表并放入Map
List namesForCity = new ArrayList<>();
namesForCity.add(name);
itemsGrouped.put(city, namesForCity);
}
}
return itemsGrouped;
}
public static void main(String[] args) {
List entities = new ArrayList<>();
entities.add(new RegistryEntity(1L, "John", "New York"));
entities.add(new RegistryEntity(2L, "Paul", "Atlanta"));
entities.add(new RegistryEntity(3L, "Mark", "Los Angeles"));
entities.add(new RegistryEntity(4L, "Susan", "Los Angeles"));
entities.add(new RegistryEntity(5L, "Josh", "New York"));
entities.add(new RegistryEntity(6L, "Charles", "Atlanta"));
DataProcessor processor = new DataProcessor();
Map> result = processor.findAllUsersGroupedByCity(entities);
System.out.println(result);
// 预期输出: {New York=[John, Josh], Atlanta=[Paul, Charles], Los Angeles=[Mark, Susan]}
}
} 上述代码虽然功能正确,但其可读性和简洁性有待提高。在处理更复杂的分组和转换逻辑时,这种命令式循环会变得更加冗长。
使用Java Stream API进行优化
Java 8引入的Stream API提供了一种更函数式、更声明式的方式来处理集合数据。结合Collectors.groupingBy和Collectors.mapping,我们可以优雅地实现上述需求。
Collectors.groupingBy()用于根据某个属性对流中的元素进行分组,其基本形式会返回Map
以下是使用Stream API实现的代码:
import java.util.List;
import java.util.Map;
import java.util.stream.Collectors;
import java.util.ArrayList; // 仅用于示例数据
public class StreamDataProcessor {
public Map> findAllUsersGroupedByCityStream(List items) {
return items.stream()
.collect(Collectors.groupingBy(
RegistryEntity::getCity, // 分组键:根据城市分组
Collectors.mapping(
RegistryEntity::getName, // 对每个分组内的实体,提取其姓名
Collectors.toList() // 将提取出的姓名收集成一个列表
)
));
}
public static void main(String[] args) {
List entities = new ArrayList<>();
entities.add(new RegistryEntity(1L, "John", "New York"));
entities.add(new RegistryEntity(2L, "Paul", "Atlanta"));
entities.add(new RegistryEntity(3L, "Mark", "Los Angeles"));
entities.add(new RegistryEntity(4L, "Susan", "Los Angeles"));
entities.add(new RegistryEntity(5L, "Josh", "New York"));
entities.add(new RegistryEntity(6L, "Charles", "Atlanta"));
StreamDataProcessor processor = new StreamDataProcessor();
Map> result = processor.findAllUsersGroupedByCityStream(entities);
System.out.println(result);
// 预期输出: {New York=[John, Josh], Atlanta=[Paul, Charles], Los Angeles=[Mark, Susan]}
}
} 代码解析
- items.stream(): 将RegistryEntity列表转换为一个Stream,这是所有Stream操作的起点。
- .collect(...): 这是一个终端操作,用于将Stream中的元素收集到一个结果容器中。
- Collectors.groupingBy(...): 这是核心的收集器,它接收两个参数:
- RegistryEntity::getCity: 这是一个方法引用,指定了用于分组的键。Stream中的每个RegistryEntity对象都会调用getCity()方法,其返回值将作为Map的键。
- Collectors.mapping(RegistryEntity::getName, Collectors.toList()): 这是groupingBy的第二个参数,它是一个下游收集器(downstream collector)。它的作用是,在每个分组内部,对属于该分组的RegistryEntity对象执行进一步的转换和收集。
- RegistryEntity::getName: 作为mapping的第一个参数,它是一个映射函数,将每个RegistryEntity对象映射为其name属性(String类型)。
- Collectors.toList(): 作为mapping的第二个参数,它是一个最终的收集器,将所有被映射的name字符串收集到一个List
中。
通过这种组合,groupingBy首先按城市创建分组,然后mapping在每个城市分组内部,将每个RegistryEntity转换成其姓名,最后toList将这些姓名收集成一个列表,作为该城市键对应的值。
优势与注意事项
优势:
- 简洁性与可读性: Stream API以声明式风格编写,代码更加紧凑,意图表达更清晰,减少了样板代码。
- 效率: Stream API在内部进行了优化,尤其是在处理大量数据时,可能比手动循环更高效。它也支持并行流(parallelStream()),可以利用多核处理器进行并行计算。
- 函数式编程范式: 遵循函数式编程思想,避免了可变状态,使代码更易于测试和维护。
注意事项:
- Null值处理: 如果RegistryEntity::getCity或RegistryEntity::getName可能返回null,需要根据业务需求进行额外的null检查或使用Optional进行处理,以避免NullPointerException。例如,可以使用filter操作在mapping之前过滤掉null值,或者在mapping中使用Optional.ofNullable。
- 性能考量: 对于非常小的数据集,Stream API的开销可能略高于简单的for循环。但在大数据集上,其优势会更加明显。
- 可变性: Collectors.toList()返回的List通常是可变的ArrayList。如果需要不可变列表,可以使用Collectors.toUnmodifiableList()(Java 10+)。
总结
Java Stream API为集合数据的处理提供了强大而灵活的工具。通过巧妙结合Collectors.groupingBy和Collectors.mapping,我们可以高效地实现复杂的分组和转换逻辑,将原始实体数据转换为高度定制化的目标数据结构,极大地提升了代码的质量和开发效率。掌握这种模式是现代Java开发中处理数据集合的关键技能之一。










