0

0

如何使用 Java Stream 按指定字段去重并保留每组首个元素

心靈之曲

心靈之曲

发布时间:2026-03-05 11:47:11

|

660人浏览过

|

来源于php中文网

原创

如何使用 Java Stream 按指定字段去重并保留每组首个元素

本文详解如何利用 java 8+ stream api 实现按对象某一属性(如城市)分组后,从每组中选取首个对象构成新列表,涵盖标准写法、自定义工具方法及关键注意事项。

本文详解如何利用 java 8+ stream api 实现按对象某一属性(如城市)分组后,从每组中选取首个对象构成新列表,涵盖标准写法、自定义工具方法及关键注意事项。

在实际开发中,常需对集合进行“按某字段分组 + 每组取一”的操作,例如:从一批 Person 对象中,为每个 city 仅保留一人(如第一个出现的)。Java Stream 本身不提供直接的 distinctByKey 原生支持,但可通过组合 Collectors.groupingBy 与后续映射高效实现。

✅ 推荐方案:groupingBy + entrySet().stream() 提取首元素

最清晰、可读性强且符合函数式风格的做法是先按目标字段分组为 Map>,再遍历 Entry 并取每组 List 的首个元素:

import java.util.*;
import java.util.stream.Collectors;

List<Person> people = Arrays.asList(
    new Person("New York", "foo", "bar"),
    new Person("New York", "bar", "foo"),
    new Person("New Jersey", "foo", "bar"),
    new Person("New Jersey", "bar", "foo")
);

List<Person> firstByCity = people.stream()
    .collect(Collectors.groupingBy(Person::getCity))
    .values().stream()
    .map(list -> list.get(0)) // 取每组第一个 Person
    .collect(Collectors.toList());

System.out.println(firstByCity);
// 输出: [{ city: New York, firstName: foo, lastName: bar }, 
//        { city: New Jersey, firstName: foo, lastName: bar }]

? 说明:Collectors.groupingBy(Person::getCity) 返回 Map>,其 values() 是所有分组列表的集合;后续流对每个 List 调用 get(0) 即得各城市的首个代表。

? 进阶封装:通用分组工具方法(支持自定义值映射)

若需复用或支持更灵活的值提取(如只取姓名、转换为 DTO),可封装泛型工具方法:

Veo
Veo

Google 最新发布的 AI 视频生成模型

下载

立即学习Java免费学习笔记(深入)”;

public static <E, K, V> Map<K, List<V>> groupBy(
        Collection<E> collection,
        Function<E, K> keyFn,
        Function<E, V> valueFn) {
    return collection.stream()
            .map(item -> new AbstractMap.SimpleEntry<>(
                    keyFn.apply(item), valueFn.apply(item)))
            .collect(Collectors.groupingBy(
                    Map.Entry::getKey,
                    Collectors.mapping(Map.Entry::getValue, Collectors.toList())));
}

public static <E, K> Map<K, List<E>> groupBy(
        Collection<E> collection,
        Function<E, K> keyFn) {
    return groupBy(collection, keyFn, Function.identity());
}

调用示例(等价于上例,但更具扩展性):

List<Person> firstByCity = groupBy(people, Person::getCity)
        .values().stream()
        .map(list -> list.get(0))
        .collect(Collectors.toList());

⚠️ 注意事项与最佳实践

  • 空安全:确保 list.get(0) 不会触发 IndexOutOfBoundsException。若源数据可能含空分组,建议改用 list.stream().findFirst().orElse(null);
  • 稳定性:groupingBy 默认不保证分组内顺序 —— 但因输入 List 有序且 Collectors.toList() 保持插入顺序,故 list.get(0) 确实返回首次出现的元素
  • 性能考量:该方案需完整遍历并构建中间 Map 和 List,时间复杂度 O(n),空间复杂度 O(n)。对超大数据集,可考虑 TreeSet 自定义 Comparator 或第三方库(如 Eclipse Collections)优化;
  • 替代简洁写法(无中间 Map):使用 Collectors.toMap 配合 BinaryOperator 也能实现,但语义稍弱:
    List<Person> firstByCity = new ArrayList<>(people.stream()
        .collect(Collectors.toMap(
            Person::getCity,
            Function.identity(),
            (existing, replacement) -> existing // 保留第一个
        )).values());

✅ 总结

按属性获取每组首个对象的核心在于「分组 → 提取首项」两步流水线。推荐优先采用 groupingBy + values().stream().map(...get(0)) 组合,逻辑直观、易于维护;必要时再通过泛型工具方法提升复用性。始终关注空值与顺序保障,即可稳健应对各类业务去重场景。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
eclipse教程
eclipse教程

php中文网为大家带来eclipse教程合集,eclipse是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。php中文网还为大家带来eclipse的相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

193

2023.06.14

eclipse怎么设置中文
eclipse怎么设置中文

eclipse设置中文的方法:除了设置界面为中文外,你还可以为Eclipse添加中文插件,以便更好地支持中文编程。例如,你可以安装EBNF插件来支持中文变量名,或安装Chinese Helper来提供中文帮助文档。本专题为大家提供eclipse设置中文相关的各种文章、以及下载和课程。

804

2023.07.24

c语言编程软件有哪些
c语言编程软件有哪些

c语言编程软件有GCC、Clang、Microsoft Visual Studio、Eclipse、NetBeans、Dev-C++、Code::Blocks、KDevelop、Sublime Text和Atom。更多关于c语言编程软件的问题详情请看本专题的文章。php中文网欢迎大家前来学习。

620

2023.11.02

Eclipse版本号有哪些区别
Eclipse版本号有哪些区别

区别:1、Eclipse 3.x系列:Eclipse的早期版本,包括3.0、3.1、3.2等;2、Eclipse 4.x系列:Eclipse的最新版本,包括4.0、4.1、4.2等;3、Eclipse IDE for Java Developers等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

179

2024.02.23

eclipse和idea有什么区别
eclipse和idea有什么区别

eclipse和idea的区别:1、平台支持;2、内存占用;3、插件系统;4、智能代码提示;5、界面设计;6、调试功能;7、学习曲线。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

149

2024.02.23

eclipse设置中文全教程
eclipse设置中文全教程

本专题整合了eclipse设置中文相关教程,阅读专题下面的文章了解更多详细操作。

113

2025.10.10

eclipse字体放大教程
eclipse字体放大教程

本专题整合了eclipse字体放大教程,阅读专题下面的文章了解更多详细内容。

153

2025.10.10

eclipse左边栏不见了解决方法
eclipse左边栏不见了解决方法

本专题整合了eclipse左边栏相关教程,阅读专题下面的文章了解更多详细内容。

120

2025.10.15

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

2

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.1万人学习

C# 教程
C# 教程

共94课时 | 10.7万人学习

Java 教程
Java 教程

共578课时 | 77万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号