0

0

Java Stream:高效分组、计数与多级排序实践

聖光之護

聖光之護

发布时间:2025-11-17 20:07:01

|

881人浏览过

|

来源于php中文网

原创

java stream:高效分组、计数与多级排序实践

本文深入探讨如何利用Java 11 Stream API对自定义对象流进行高效处理。核心在于解决一次性消费流的限制,通过将对象按指定属性(如`category`)进行分组计数,然后根据计数结果和属性值本身进行多级排序,最终生成一个有序的属性列表。文章提供了详细的代码示例和实现解析,旨在帮助开发者掌握复杂的Stream数据转换技巧。

引言:Stream数据转换的挑战

在Java应用开发中,我们经常需要对数据集合进行复杂的转换和聚合操作。Java Stream API自Java 8引入以来,极大地简化了这些任务。然而,当面临特定挑战时,例如在一个只能被消费一次的Stream上执行多阶段的数据处理,就需要精心设计Stream管道。本文将聚焦于一个常见场景:给定一个包含category属性的自定义对象流,我们需要生成一个按以下规则排序的类别列表:首先根据每个类别的出现频率进行排序(频率高的在前),如果频率相同,则按类别名称的字母顺序排序。

核心问题与解决方案

我们的目标是,在不重复消费原始Stream的前提下,实现一个既能统计类别频率,又能进行多级排序的解决方案。

问题定义:

立即学习Java免费学习笔记(深入)”;

假设我们有一个MyType类的对象流,其中MyType定义如下:

public class MyType {
    private String category;

    public MyType(String category) {
        this.category = category;
    }

    public String getCategory() {
        return category;
    }

    // 其他属性、构造函数、getter/setter等...
}

给定一个Stream<MyType>,我们需要返回一个List<String>,其中包含所有唯一的类别,并按照以下规则排序:

  1. 主排序规则: 类别出现的次数(频率)降序排列
  2. 次排序规则: 如果两个类别的出现次数相同,则按类别名称的字母顺序升序排列。

解决方案概述:

解决此问题的关键在于分两步走:

  1. 分组与计数: 首先,利用Collectors.groupingBy和Collectors.counting将原始Stream转换为一个Map<String, Long>,其中键是类别名称,值是该类别出现的次数。这一步仅需一次Stream消费。
  2. 排序与提取: 接着,我们将这个Map的entrySet()转换为一个新的Stream,并对这个Stream进行排序。排序时,我们利用Map.Entry.comparingByValue()进行主排序(按计数),然后使用thenComparing(Map.Entry.comparingByKey())进行次排序(按类别名称)。最后,通过map操作提取排序后的类别名称,并收集到列表中。

实现细节与代码示例

下面是具体的Java 11实现代码:

import java.util.List;
import java.util.Map;
import java.util.stream.Collectors;
import java.util.stream.Stream;

public class CategorySorter {

    // 假设MyType类已定义如上
    public static class MyType {
        private String category;

        public MyType(String category) {
            this.category = category;
        }

        public String getCategory() {
            return category;
        }

        @Override
        public String toString() {
            return "MyType{category='" + category + "'}";
        }
    }

    /**
     * 根据类别出现频率和类别名称对Stream中的类别进行排序。
     *
     * @param stream 包含MyType对象的Stream,只能消费一次。
     * @return 排序后的类别名称列表。
     */
    public static List<String> getSortedCategories(Stream<MyType> stream) {
        // 1. 分组并计数:将Stream<MyType>转换为Map<String, Long>
        //    键是类别名称,值是该类别的出现次数。
        Map<String, Long> categoryCounts = stream.collect(
            Collectors.groupingBy(
                MyType::getCategory, // 按MyType对象的category属性分组
                Collectors.counting() // 统计每个分组中的元素数量
            )
        );

        // 2. 对Map的Entry进行排序并提取类别名称
        return categoryCounts.entrySet().stream() // 将Map的Entry集合转换为Stream
            .sorted(
                // 主排序:按值(计数)降序排列
                // 注意:comparingByValue()默认是升序,这里需要反转
                Map.Entry.<String, Long>comparingByValue().reversed()
                // 次排序:如果值(计数)相同,则按键(类别名称)升序排列
                .thenComparing(Map.Entry.comparingByKey())
            )
            .map(Map.Entry::getKey) // 提取排序后的Entry的键(即类别名称)
            .toList(); // 将结果收集到List中 (Java 16+ 或使用Collectors.toList() for Java 11)
    }

    public static void main(String[] args) {
        // 示例输入
        List<MyType> inputData = List.of(
            new MyType("category1"),
            new MyType("categoryB"),
            new MyType("categoryA"),
            new MyType("category1"),
            new MyType("categoryB"),
            new MyType("category1"),
            new MyType("categoryA")
        );

        // 创建一个Stream,注意Stream只能消费一次
        Stream<MyType> myTypeStream = inputData.stream();

        // 调用方法获取排序后的类别列表
        List<String> sortedCategories = getSortedCategories(myTypeStream);

        // 打印结果
        System.out.println("原始数据类别列表 (未排序):");
        inputData.stream().map(MyType::getCategory).forEach(System.out::println);
        System.out.println("\n排序后的类别列表:");
        System.out.println(sortedCategories); // 预期输出: [category1, categoryA, categoryB]
    }
}

代码解析:

  1. stream.collect(Collectors.groupingBy(MyType::getCategory, Collectors.counting()))

    绘蛙
    绘蛙

    电商场景的AI创作平台,无需高薪聘请商拍和文案团队,使用绘蛙即可低成本、批量创作优质的商拍图、种草文案

    下载
    • 这是整个解决方案的第一步,也是最关键的一步。它将原始Stream<MyType>转换成一个Map<String, Long>。
    • Collectors.groupingBy(MyType::getCategory):这是一个下游收集器,它根据MyType对象的category属性对元素进行分组。所有具有相同category值的对象会被分到同一个组。
    • Collectors.counting():这是groupingBy的第二个参数,作为每个分组的“下游”收集器。它会统计每个分组中的元素数量,即每个类别的出现频率。
    • 这一步完成后,我们得到了一个包含每个类别及其出现次数的映射,例如{category1=3, categoryB=2, categoryA=2}。
  2. categoryCounts.entrySet().stream()

    • 我们现在需要对上一步生成的Map的键值对(Map.Entry)进行排序。entrySet()方法返回Map中所有键值对的Set视图,我们可以将其转换为一个Stream<Map.Entry<String, Long>>。
  3. .sorted(Map.Entry.<String, Long>comparingByValue().reversed().thenComparing(Map.Entry.comparingByKey()))

    • 这是实现多级排序的核心。
    • Map.Entry.<String, Long>comparingByValue():这是一个静态方法,返回一个Comparator,用于按Map.Entry的值(即类别计数Long)进行自然顺序(升序)比较。
    • .reversed():因为我们需要按计数降序排列(频率高的在前),所以我们调用reversed()来反转比较器的顺序。
    • .thenComparing(Map.Entry.comparingByKey()):这是一个链式比较器。当主比较器(按计数)认为两个Entry相等时(即它们的计数相同),thenComparing会使用提供的次比较器(按键,即类别名称String)进行比较。comparingByKey()默认是按键的自然顺序(字母顺序)升序排列,这正是我们所需要的。
  4. .map(Map.Entry::getKey)

    • 排序完成后,我们不再需要Map.Entry的整个结构,只需要其中的键(类别名称)。map操作将每个Map.Entry转换为其对应的String类型的键。
  5. .toList()

    • 这是Java 16及更高版本中Stream接口的一个便捷方法,用于将Stream中的所有元素收集到一个新的List中。如果使用Java 11,需要替换为Collectors.toList()。

运行示例与结果

对于以下输入数据:

{
    object1 :{category:"category1"},
    object2 :{category:"categoryB"},
    object3 :{category:"categoryA"},
    object4 :{category:"category1"},
    object5 :{category:"categoryB"},
    object6 :{category:"category1"},
    object7 :{category:"categoryA"}
}

各类别出现频率如下:

  • category1: 3次
  • categoryA: 2次
  • categoryB: 2次

根据排序规则:

  1. category1频率最高(3次),排第一。
  2. categoryA和categoryB频率相同(2次)。
  3. 根据字母顺序,categoryA (A < B) 排在categoryB之前。

因此,最终输出的列表将是:

List = {category1, categoryA, categoryB}

这与我们的代码运行结果一致。

注意事项与总结

  • Stream的一次性消费: 始终牢记Stream是单次消费的。一旦调用了终端操作(如collect、forEach、toList等),该Stream就不能再被使用。本教程中的方法通过将原始Stream首先转换为一个中间数据结构(Map),然后对这个中间结构进行Stream操作,巧妙地规避了这一限制。
  • Java版本兼容性: 示例中使用了Stream.toList(),这是Java 16引入的。对于Java 11等早期版本,应使用collect(Collectors.toList())。
  • 性能考量: 这种方法在处理大量数据时是高效的。groupingBy和counting操作通常在O(N)时间复杂度内完成(N为Stream中的元素数量),而对Map Entry的排序则取决于Map中唯一类别的数量M,通常为O(M log M)。
  • 可读性与维护性: Java Stream API提供了一种声明式编程风格,使得代码意图清晰,易于理解和维护。通过链式调用,可以将复杂的数据转换逻辑表达得简洁而富有表现力。

通过本文的学习,您应该能够熟练运用Java Stream API进行复杂的数据聚合、多级排序等操作,从而更高效地处理各种数据转换需求。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1030

2023.08.02

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

267

2025.12.04

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

549

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

30

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

44

2026.01.06

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1926

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

656

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2397

2025.12.29

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.4万人学习

C# 教程
C# 教程

共94课时 | 11.2万人学习

Java 教程
Java 教程

共578课时 | 81.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号