0

0

深入理解Java Stream的filter操作与函数式参数应用

DDD

DDD

发布时间:2025-10-29 16:25:19

|

915人浏览过

|

来源于php中文网

原创

深入理解Java Stream的filter操作与函数式参数应用

本文深入探讨java stream中`filter`方法如何结合函数式参数实现基于特定键的元素去重。通过分析一个自定义的`checkmethod`,文章详细阐述了`predicate`的生成机制、`filter`操作的实际执行流程,以及`predicate`内部如何利用`function`提取键并借助`set`的`add`方法判断元素唯一性,从而高效地过滤掉重复项。

Java Stream API提供了一种强大且声明式的方式来处理集合数据。其中,filter方法是其核心操作之一,用于根据指定条件筛选流中的元素。filter方法接收一个Predicate函数式接口作为参数,该接口定义了一个test方法,返回一个布尔值来指示元素是否应被保留。然而,当filter的参数本身是一个方法调用,并且该方法返回一个Predicate时,其内部工作机制可能需要更深入的理解。

Java Stream filter与Predicate基础

在Java Stream中,filter(Predicate super T> predicate)方法的作用是保留那些使给定predicate返回true的元素,并丢弃那些返回false的元素。Predicate是一个函数式接口,其抽象方法签名为boolean test(T t)。这意味着我们可以使用Lambda表达式或方法引用来提供一个Predicate实例。

函数式参数生成Predicate的机制

考虑以下代码片段,它展示了如何利用一个自定义方法来为filter生成Predicate:

import java.util.List;
import java.util.Objects;
import java.util.Set;
import java.util.concurrent.ConcurrentHashMap;
import java.util.function.Function;
import java.util.function.Predicate;

public class StreamFilterExample {

  public static void main(String[] args) {
    Person p1 = new Person("test1");
    Person p2 = new Person("test2");
    Person p3 = new Person("test1"); // 添加一个重复项以演示去重效果

    List l = List.of(p1, p2, p3);
    // 统计唯一名称的Person对象数量
    var count = l.stream().filter(checkMethod(Person::getName)).count();
    System.out.println("Unique names count: " + count); // 预期输出: 2 (test1, test2)
  }

  /**
   * 生成一个Predicate,用于根据指定键提取器判断元素是否首次出现。
   *
   * @param keyExtractor 用于从元素中提取唯一键的Function。
   * @param  流中元素的类型。
   * @return 一个Predicate,当元素对应的键首次出现时返回true,否则返回false。
   */
  public static final  Predicate checkMethod(Function keyExtractor) {
    Objects.requireNonNull(keyExtractor);
    // 使用ConcurrentHashMap.newKeySet()创建一个线程安全的Set来存储已见的键。
    final var seen = ConcurrentHashMap.newKeySet();
    // 返回一个Lambda表达式作为Predicate实例
    return t -> seen.add(keyExtractor.apply(t));
  }
}

class Person {
  private String name;

  Person(String name) {
    this.name = name;
  }

  public String getName() {
    return name;
  }

  public void setName(String name) {
    this.name = name;
  }

  @Override
  public String toString() {
    return "Person{" + "name='" + name + '\'' + '}';
  }
}

在上述代码中,checkMethod是一个泛型方法,它接收一个Function super T, ?> keyExtractor作为参数。这个keyExtractor的作用是从流中的每个元素T中提取一个用于判断唯一性的“键”。例如,Person::getName就是一个方法引用,它充当keyExtractor,从Person对象中提取其name属性作为键。

立即学习Java免费学习笔记(深入)”;

checkMethod的核心在于它创建了一个线程安全的Set (ConcurrentHashMap.newKeySet())来存储所有已经“见过”的键。然后,它返回一个Predicate实例,这个Predicate的test方法实现为t -> seen.add(keyExtractor.apply(t))。

这里的关键是Set.add()方法的行为:

  • 如果元素(即keyExtractor.apply(t)提取出的键)是首次被添加到Set中,add()方法会返回true。
  • 如果元素已经存在于Set中,add()方法会返回false,并且不会重复添加。

因此,这个返回的Predicate会根据键是否首次出现来决定返回true或false。

filter方法的执行流程解析

现在我们来详细分析l.stream().filter(checkMethod(Person::getName)).count();这行代码的执行流程:

  1. checkMethod(Person::getName)的执行(一次性) 在整个Stream操作链开始之前,filter方法需要一个Predicate实例。因此,Java运行时会首先调用checkMethod(Person::getName)。

    • Person::getName作为keyExtractor参数传递给checkMethod。
    • checkMethod内部会初始化一个空的ConcurrentHashMap.newKeySet()实例,例如命名为seen。
    • checkMethod最终返回一个Predicate的实例。这个实例内部“捕获”了seen这个Set变量,其test方法实现为 person -> seen.add(person.getName())。 重要提示: checkMethod只会被调用一次,它负责创建并返回那个用于过滤的Predicate对象。
  2. filter方法的应用(逐元素执行) 一旦filter方法接收到由checkMethod返回的Predicate实例,它便开始对Stream中的每个元素进行处理。

    • 对于第一个元素 (p1: "test1"):
      • filter调用Predicate的test方法,即执行seen.add(p1.getName())。
      • p1.getName()返回"test1"。
      • seen.add("test1"):由于"test1"是首次添加到seen集合,add方法返回true。
      • filter接收到true,因此p1被保留。
    • 对于第二个元素 (p2: "test2"):
      • filter调用Predicate的test方法,即执行seen.add(p2.getName())。
      • p2.getName()返回"test2"。
      • seen.add("test2"):由于"test2"是首次添加到seen集合,add方法返回true。
      • filter接收到true,因此p2被保留。
    • 对于第三个元素 (p3: "test1"):
      • filter调用Predicate的test方法,即执行seen.add(p3.getName())。
      • p3.getName()返回"test1"。
      • seen.add("test1"):由于"test1"已经存在于seen集合中,add方法返回false。
      • filter接收到false,因此p3被丢弃。
  3. count()方法的执行 经过filter操作后,Stream中只剩下p1和p2。最终,count()方法会统计这些被保留的元素数量,即2。

注意事项与总结

  • 执行时机: 务必理解checkMethod是在Stream操作链开始前执行一次,用于生成Predicate。而Predicate的test方法则是在Stream处理过程中,对每个元素逐一执行。
  • 状态管理: checkMethod内部创建的seen集合是Predicate实例的私有状态。这种模式允许Predicate在处理流元素时维护上下文信息(即哪些键已经见过)。
  • 线程安全: 使用ConcurrentHashMap.newKeySet()是关键,它确保了在并行Stream操作中,seen集合的add操作是线程安全的,避免了数据竞争问题。
  • 通用性: 这种模式非常灵活,可以用于根据任何可提取的键对对象流进行去重。只需提供不同的keyExtractor即可。

通过这种方式,我们不仅理解了Java Stream filter方法如何与函数式参数协同工作,还掌握了一种高效且线程安全的基于特定键的元素去重策略。这种模式在处理复杂数据流时,能够显著提高代码的简洁性和可维护性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java中boolean的用法
java中boolean的用法

在Java中,boolean是一种基本数据类型,它只有两个可能的值:true和false。boolean类型经常用于条件测试,比如进行比较或者检查某个条件是否满足。想了解更多java中boolean的相关内容,可以阅读本专题下面的文章。

350

2023.11.13

java boolean类型
java boolean类型

本专题整合了java中boolean类型相关教程,阅读专题下面的文章了解更多详细内容。

29

2025.11.30

counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

198

2023.11.20

lambda表达式
lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式,它可以在需要函数作为参数的地方使用,并提供了一种更简洁、更灵活的编码方式,其语法为“lambda 参数列表: 表达式”,参数列表是函数的参数,可以包含一个或多个参数,用逗号分隔,表达式是函数的执行体,用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容,供大家免费下载体验。

207

2023.09.15

python lambda函数
python lambda函数

本专题整合了python lambda函数用法详解,阅读专题下面的文章了解更多详细内容。

191

2025.11.08

Python lambda详解
Python lambda详解

本专题整合了Python lambda函数相关教程,阅读下面的文章了解更多详细内容。

53

2026.01.05

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1100

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

189

2025.10.17

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

22

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.9万人学习

C# 教程
C# 教程

共94课时 | 7.8万人学习

Java 教程
Java 教程

共578课时 | 52.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号