0

0

如何使用Java Stream API过滤嵌套列表并聚合数据

花韻仙語

花韻仙語

发布时间:2025-10-27 12:11:40

|

554人浏览过

|

来源于php中文网

原创

如何使用java stream api过滤嵌套列表并聚合数据

本教程详细阐述了如何利用Java Stream API处理嵌套数据结构,特别是从包含多类型图片的商品列表中,筛选出特定格式(如JPG)的图片URL,并将其聚合成一个逗号分隔的字符串。通过分解步骤、提供代码示例和关键概念解释,帮助开发者高效地进行数据转换和聚合。

在现代Java应用开发中,处理复杂的数据结构是常见任务。当数据以嵌套列表的形式存在时,例如一个商品对象包含一个图片列表,而每张图片又包含一个类型列表,我们需要一种高效且声明式的方式来过滤和转换这些数据。Java Stream API正是解决这类问题的强大工具。本文将指导您如何利用Stream API从这样的嵌套结构中提取特定信息。

场景描述

假设我们有一个Product对象,其中包含一个images列表。images列表中的每个Image对象又有一个types列表,表示该图片的多种格式(例如JPG、PNG、MP4)。我们的目标是:从某个Product的所有图片中,找出所有type为jpg的图片的url,并将这些url以逗号分隔的形式返回。

以下是数据结构的JSON表示示例:

立即学习Java免费学习笔记(深入)”;

Midjourney
Midjourney

当前最火的AI绘图生成工具,可以根据文本提示生成华丽的视觉图片。

下载
{
  "name": "product A",
  "images": [
    {
      "imgId": "img1",
      "url": "url1",
      "types": [
        { "format": "jpg" },
        { "format": "png" }
      ]
    },
    {
      "imgId": "img2",
      "url": "url2",
      "types": [
        { "format": "mp4" },
        { "format": "png" }
      ]
    },
    {
      "imgId": "img3",
      "url": "url3",
      "types": [
        { "format": "jpg" },
        { "format": "mp4" }
      ]
    }
  ]
}

Java数据模型构建

为了在Java中处理上述JSON结构,我们首先需要定义相应的Java类。

import java.util.List;
import java.util.Objects;
import java.util.Arrays;
import java.util.Collection;
import java.util.function.BinaryOperator;
import java.util.function.Predicate;
import java.util.stream.Collectors;

// 表示图片格式的类,例如 { "format": "jpg" }
class ImageType {
    private String format;

    public ImageType(String format) {
        this.format = format;
    }

    public String getFormat() {
        return format;
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        ImageType imageType = (ImageType) o;
        return Objects.equals(format, imageType.format);
    }

    @Override
    public int hashCode() {
        return Objects.hash(format);
    }
}

// 表示一个图片对象
class Image {
    private String imgId;
    private String url;
    private List<ImageType> types;

    public Image(String imgId, String url, List<ImageType> types) {
        this.imgId = imgId;
        this.url = url;
        this.types = types;
    }

    public String getUrl() {
        return url;
    }

    public List<ImageType> getTypes() {
        return types;
    }
}

// 表示一个产品对象,包含图片列表
class Product {
    private String name;
    private List<Image> images;

    public Product(String name, List<Image> images) {
        this.name = name;
        this.images = images;
    }

    public List<Image> getImages() {
        return images;
    }
}

使用Java Stream API进行过滤和聚合

我们将通过以下步骤实现目标:

  1. 获取图片流: 从Product对象中获取images列表,并将其转换为一个Stream。
  2. 过滤图片: 筛选出那些包含jpg格式的Image对象。这涉及到对每个Image内部的types列表进行二次过滤。
  3. 映射URL: 将过滤后的Image对象映射为其url字符串。
  4. 聚合结果: 将所有url字符串聚合成一个逗号分隔的字符串。

下面是实现上述逻辑的Java代码:

public class StreamNestedListFilter {

    // 定义一个Predicate,用于判断一个Image对象是否包含JPG格式
    private static final Predicate<Image> hasJpgType = image ->
            image.getTypes().stream() // 获取当前图片的类型列表的Stream
                 .anyMatch(type -> "jpg".equalsIgnoreCase(type.getFormat())); // 检查是否有任何类型是"jpg"

    // 定义一个BinaryOperator,用于将两个字符串通过逗号连接起来
    private static final BinaryOperator<String> commaReducer = (s1, s2) -> s1 + "," + s2;

    /**
     * 从图片集合中提取所有JPG格式图片的URL,并以逗号分隔返回。
     *
     * @param images 待处理的图片集合。
     * @return 逗号分隔的JPG图片URL字符串,如果未找到则返回"No Match!"。
     */
    public static String getJpgImageUrls(final Collection<Image> images) {
        // 处理输入集合为空或null的情况
        if (images == null || images.isEmpty()) {
            return "No Match!";
        }

        return images.stream()
                .filter(hasJpgType)           // 步骤1: 过滤出包含JPG格式的图片
                .map(Image::getUrl)           // 步骤2: 将过滤后的Image对象映射为其URL字符串
                .reduce(commaReducer)         // 步骤3: 使用自定义的BinaryOperator将所有URL聚合成一个逗号分隔的字符串
                .orElse("No Match!");         // 步骤4: 如果Stream为空(没有匹配的图片),则返回默认值"No Match!"
    }

    public static void main(String[] args) {
        // 构造示例数据
        ImageType jpg = new ImageType("jpg");
        ImageType png = new ImageType("png");
        ImageType mp4 = new ImageType("mp4");

        Image img1 = new Image("img1", "url1", Arrays.asList(jpg, png));
        Image img2 = new Image("img2", "url2", Arrays.asList(mp4, png));
        Image img3 = new Image("img3", "url3", Arrays.asList(jpg, mp4));

        List<Image> productAImages = Arrays.asList(img1, img2, img3);
        Product productA = new Product("product A", productAImages);

        // 调用方法获取JPG图片的URL
        String jpgUrls = getJpgImageUrls(productA.getImages());
        System.out.println("JPG Image URLs: " + jpgUrls); // 预期输出: url1,url3

        // 测试没有JPG图片的场景
        Image img4 = new Image("img4", "url4", Arrays.asList(mp4, png));
        List<Image> noJpgImages = Arrays.asList(img2, img4);
        String noMatchUrls = getJpgImageUrls(noJpgImages);
        System.out.println("No JPG Image URLs: " + noMatchUrls); // 预期输出: No Match!

        // 测试空列表
        String emptyListUrls = getJpgImageUrls(Arrays.asList());
        System.out.println("Empty list URLs: " + emptyListUrls); // 预期输出: No Match!

        // 测试null列表
        String nullListUrls = getJpgImageUrls(null);
        System.out.println("Null list URLs: " + nullListUrls); // 预期输出: No Match!
    }
}

关键概念解释

  • Stream: Java 8引入的Stream API提供了一种处理数据序列的声明式方式。它允许您对集合进行链式操作,如过滤、映射、排序等,而无需显式管理迭代器。
  • filter(Predicate super T> predicate): 这是一个中间操作,用于根据提供的Predicate(一个返回布尔值的函数)筛选流中的元素。在本例中,hasJpgType是一个Predicate,它检查图片是否包含JPG类型。
  • anyMatch(Predicate super T> predicate): 这是一个终端操作,用于判断流中是否存在任何元素满足给定的Predicate。在hasJpgType内部,它用于检查Image的types列表中是否存在"jpg"格式。
  • map(Function super T, ? extends R> mapper): 这是一个中间操作,用于将流中的每个元素转换(映射)为另一种类型。Image::getUrl是一个方法引用,它将每个Image对象映射为其url字符串。
  • reduce(BinaryOperator accumulator): 这是一个终端操作,用于将流中的所有元素通过一个二元操作符(BinaryOperator)聚合成一个单一结果。commaReducer将多个URL字符串通过逗号连接起来。
  • orElse(T other): 这是Optional类的一个方法,当reduce操作的结果为空(即流中没有元素)时,它提供一个默认值。这避免了在没有匹配项时抛出NoSuchElementException。
  • Predicate 和 BinaryOperator 接口:
    • Predicate: 代表一个参数的谓词(布尔值函数)。
    • BinaryOperator: 代表对两个T类型操作数执行操作,并返回T类型结果的函数。它们都是函数式接口,常用于Stream操作。

注意事项与最佳实践

  1. 可读性与复用性: 将Predicate和BinaryOperator定义为单独的静态字段(如hasJpgType和commaReducer)可以提高代码的可读性和复用性。
  2. 空值处理: 在处理集合时,始终考虑输入集合为null或空的情况。在getJpgImageUrls方法中,我们显式地检查了images集合是否为空,并在reduce操作后使用了orElse来提供默认值。
  3. 性能: 对于大型数据集,Stream API通常能提供良好的性能,因为它支持并行流(parallelStream())。然而,对于本例中的简单聚合,通常不需要并行流。
  4. 错误处理: 如果ImageType的format字段可能为null,在equalsIgnoreCase之前应进行null检查,或者使用Optional。
  5. 泛化: 如果需要过滤不同格式(例如png或mp4),可以将getJpgImageUrls方法进行泛化,接受一个格式参数或一个通用的Predicate

总结

通过本教程,您应该已经掌握了如何使用Java Stream API高效地处理嵌套列表数据。Stream API提供了一种强大、灵活且声明式的方式来执行复杂的过滤、映射和聚合操作,极大地简化了代码并提高了可读性。理解并熟练运用filter、map、anyMatch和reduce等核心操作,将使您能够更优雅地解决各种数据处理挑战。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

454

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

546

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

331

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

253

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1069

2024.03.01

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

887

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

459

2024.06.27

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

59

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.3万人学习

C# 教程
C# 教程

共94课时 | 11万人学习

Java 教程
Java 教程

共578课时 | 79.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号