0

0

使用Java 8 Stream API高效筛选每日期货最新时间戳数据

碧海醫心

碧海醫心

发布时间:2025-09-30 12:29:02

|

498人浏览过

|

来源于php中文网

原创

使用Java 8 Stream API高效筛选每日期货最新时间戳数据

本文详细介绍了如何利用Java 8 Stream API处理列表数据,以实现按货名称和日期分组,并从中筛选出每个分组内具有最新时间戳的记录。文章通过具体的代码示例,展示了groupingBy、collectingAndThen和maxBy等核心Stream操作的组合运用,同时探讨了如何对结果进行排序,并提供了原生SQL查询作为数据库层面的替代方案,旨在帮助开发者高效地解决此类数据聚合与筛选问题。

1. 问题描述与数据模型

在实际应用中,我们经常需要从一系列时间序列数据中,根据某些条件(如货币类型、日期)筛选出具有特定时间戳(最新或最早)的记录。例如,给定一个包含货币交易信息的列表,我们希望获取每种货币在每天的最新交易记录。

假设我们有如下的Currency数据模型:

import java.time.LocalDateTime;
import java.time.LocalDate; // 需要导入LocalDate

class Currency {
   private Integer id;
   private String name; // 货币名称,如 "USD", "BUSD"
   private LocalDateTime lastReceived; // 最后接收时间戳

   // 构造函数
   public Currency(Integer id, String name, LocalDateTime lastReceived) {
       this.id = id;
       this.name = name;
       this.lastReceived = lastReceived;
   }

   // Getter方法
   public Integer getId() { return id; }
   public String getName() { return name; }
   public LocalDateTime getLastReceived() { return lastReceived; }

   // 为了方便打印,重写toString方法
   @Override
   public String toString() {
       return "Currency{" +
              "id=" + id +
              ", name='" + name + '\'' +
              ", lastReceived=" + lastReceived +
              '}';
   }
}

我们的目标是,对于给定的Currency列表,例如:

ID NAME LAST_RECEIVED
1 USD 2022-05-18 09:04:01.545
2 USD 2022-05-18 08:04:01.545
3 USD 2022-05-19 08:04:01.545
4 USD 2022-05-20 08:04:01.545
5 USD 2022-05-20 11:04:01.545
6 BUSD 2022-05-18 08:04:01.545

我们期望得到的结果是每种货币在每天的最新(最大)时间戳记录:

ID NAME LAST_RECEIVED
1 USD 2022-05-18 09:04:01.545
3 USD 2022-05-19 08:04:01.545
5 USD 2022-05-20 11:04:01.545
6 BUSD 2022-05-18 08:04:01.545

请注意,问题描述中提到了“least timestamp”,但根据提供的预期输出,实际需求是获取“latest timestamp”(即最大时间戳)。本教程将以获取“最新时间戳”为目标进行讲解。如果实际需求是“最早时间戳”,只需将maxBy替换为minBy。

立即学习Java免费学习笔记(深入)”;

2. 使用Java 8 Stream API解决

Java 8的Stream API提供了强大的数据处理能力,结合Collectors.groupingBy和Collectors.collectingAndThen,我们可以优雅地解决这个问题。

2.1 获取所有货币在每天的最新记录

为了实现“按货币名称和日期分组,并获取最新时间戳”的需求,我们需要一个复合键来分组。这个复合键应该包含货币名称和lastReceived字段的日期部分。

import java.time.LocalDateTime;
import java.time.LocalDate;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Comparator;
import java.util.List;
import java.util.Map;
import java.util.Optional;
import java.util.stream.Collectors;

public class CurrencyProcessor {

    public static void main(String[] args) {
        List data = Arrays.asList(
            new Currency(1, "USD", LocalDateTime.parse("2022-05-18T09:04:01.545")),
            new Currency(2, "USD", LocalDateTime.parse("2022-05-18T08:04:01.545")),
            new Currency(3, "USD", LocalDateTime.parse("2022-05-19T08:04:01.545")),
            new Currency(4, "USD", LocalDateTime.parse("2022-05-20T08:04:01.545")),
            new Currency(5, "USD", LocalDateTime.parse("2022-05-20T11:04:01.545")),
            new Currency(6, "BUSD", LocalDateTime.parse("2022-05-18T08:04:01.545"))
        );

        // 1. 分组并获取每日期货的最新记录
        List latestByDateAndCurrency = new ArrayList<>(data
                .stream()
                .collect(Collectors.groupingBy(
                    // 复合键:货币名称 + 日期
                    curr -> Arrays.asList(curr.getName(), curr.getLastReceived().toLocalDate()),
                    // 收集器:先找到最大值,然后从Optional中取出
                    Collectors.collectingAndThen(
                        Collectors.maxBy(Comparator.comparing(Currency::getLastReceived)),
                        Optional::get // 确保Optional有值,否则抛出NoSuchElementException
                    )
                ))
                .values()); // 获取Map中的所有值,即筛选出的Currency对象

        System.out.println("所有货币在每天的最新记录 (未排序):");
        latestByDateAndCurrency.forEach(System.out::println);

        // 2. 对结果进行排序(如果需要)
        // 可以直接对上述列表进行排序
        latestByDateAndCurrency.sort(
            Comparator.comparing(Currency::getName) // 先按货币名称排序
                      .thenComparing(Currency::getLastReceived) // 再按时间戳排序
        );

        System.out.println("\n所有货币在每天的最新记录 (排序后):");
        latestByDateAndCurrency.forEach(System.out::println);
    }
}

代码解析:

  1. data.stream(): 创建一个Currency对象的Stream。
  2. Collectors.groupingBy(...): 这是核心操作。它根据提供的分类函数将Stream中的元素分组到一个Map中。
    • 分类函数 curr -> Arrays.asList(curr.getName(), curr.getLastReceived().toLocalDate()): 这里我们创建了一个List作为复合键。它包含了货币名称(curr.getName())和lastReceived字段的日期部分(curr.getLastReceived().toLocalDate())。这样可以确保同一货币在同一天的记录被分到同一个组。
    • 下游收集器 Collectors.collectingAndThen(Collectors.maxBy(Comparator.comparing(Currency::getLastReceived)), Optional::get):
      • Collectors.maxBy(Comparator.comparing(Currency::getLastReceived)): 这是groupingBy的二级收集器,它会在每个分组内部找到lastReceived时间戳最大的Currency对象。maxBy返回一个Optional
      • Optional::get: collectingAndThen的作用是在前一个收集器(maxBy)的结果上执行一个转换函数。在这里,我们使用Optional::get从Optional中取出实际的Currency对象。注意:使用Optional::get时需谨慎,如果分组为空(通常不会发生在这种场景下),它会抛出NoSuchElementException。在生产代码中,更安全的做法是使用orElse或orElseThrow。
  3. .values(): groupingBy操作返回一个Map, Currency>。我们通过.values()方法获取Map中所有的值(即我们筛选出的Currency对象),这些值就是我们需要的最新记录。
  4. new ArrayList(...): 将Map的values()集合转换为ArrayList。
  5. 排序: 如果需要对最终结果进行排序,可以直接对latestByDateAndCurrency列表使用sort方法,结合Comparator.comparing和thenComparing进行多字段排序。

2.2 获取特定货币在每天的最新记录

如果只需要获取特定货币(例如"USD")的最新记录,可以在Stream操作开始时添加一个filter步骤。

Pixso AI
Pixso AI

Pixso AI是一款智能生成设计稿工具,通过AI一键实现文本输入到设计稿生成。

下载
import java.util.stream.Collectors;
import java.util.Comparator;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.Optional;
import java.time.LocalDateTime;

public class SpecificCurrencyProcessor {

    public static void main(String[] args) {
        List data = Arrays.asList(
            new Currency(1, "USD", LocalDateTime.parse("2022-05-18T09:04:01.545")),
            new Currency(2, "USD", LocalDateTime.parse("2022-05-18T08:04:01.545")),
            new Currency(3, "USD", LocalDateTime.parse("2022-05-19T08:04:01.545")),
            new Currency(4, "USD", LocalDateTime.parse("2022-05-20T08:04:01.545")),
            new Currency(5, "USD", LocalDateTime.parse("2022-05-20T11:04:01.545")),
            new Currency(6, "BUSD", LocalDateTime.parse("2022-05-18T08:04:01.545"))
        );

        String targetCurrency = "USD";
        List lastUSDByDate = new ArrayList<>(data
            .stream()
            .filter(curr -> targetCurrency.equalsIgnoreCase(curr.getName())) // 筛选特定货币
            .collect(Collectors.groupingBy(
                curr -> curr.getLastReceived().toLocalDate(), // 此时分组键只需日期
                Collectors.collectingAndThen(
                    Collectors.maxBy(Comparator.comparing(Currency::getLastReceived)),
                    Optional::get
                )
            ))
            .values()
        );

        // 对结果进行排序
        lastUSDByDate.sort(Comparator.comparing(Currency::getLastReceived));

        System.out.println(targetCurrency + " 在每天的最新记录:");
        lastUSDByDate.forEach(System.out::println);
    }
}

代码解析:

  1. .filter(curr -> targetCurrency.equalsIgnoreCase(curr.getName())): 在分组之前,先过滤出我们感兴趣的特定货币(例如"USD")的记录。
  2. groupingBy(curr -> curr.getLastReceived().toLocalDate(), ...): 由于已经筛选了特定货币,分组键就不需要再包含货币名称,只需按日期分组即可。

3. 原生SQL查询替代方案(适用于数据库层面)

如果数据量庞大,并且数据存储在关系型数据库中,使用Java Stream API在内存中处理可能效率不高。此时,利用数据库的强大查询能力,特别是窗口函数,是更优的选择。

以下是一个使用PostgreSQL的SQL查询示例,通过窗口函数实现相同的功能:

SELECT id, name, last_received
FROM (
    SELECT c.*,
    ROW_NUMBER() OVER (
        PARTITION BY name, to_char(last_received, 'yyyy-MM-dd')
        ORDER BY last_received DESC
    ) AS rn -- 或者使用ROW_NUMBER(), RANK(), DENSE_RANK()
    FROM Currency c
    WHERE c.name = :currName -- 如果需要筛选特定货币
) tbl
WHERE rn = 1
ORDER BY last_received;

SQL查询解析:

  1. *内层查询 `SELECT c., ROW_NUMBER() OVER (...) AS rn FROM Currency c WHERE c.name = :currName`**:
    • ROW_NUMBER() OVER (PARTITION BY name, to_char(last_received, 'yyyy-MM-dd') ORDER BY last_received DESC): 这是核心的窗口函数。
      • PARTITION BY name, to_char(last_received, 'yyyy-MM-dd'): 这指定了分组的依据。它会根据货币名称和last_received字段的日期部分进行分区。在每个分区内部,行号会独立计算。
      • ORDER BY last_received DESC: 在每个分区内部,行会根据last_received时间戳降序排列(最新时间戳排在最前面)。
      • AS rn: 为计算出的行号指定别名rn。
  2. 外层查询 SELECT id, name, last_received FROM (...) tbl WHERE rn = 1 ORDER BY last_received:
    • WHERE rn = 1: 从内层查询的结果中,我们只选择每个分区中rn为1的记录,这正是每个分组中last_received最新的那条记录。
    • ORDER BY last_received: 对最终结果按时间戳进行排序。

JPA集成:

如果使用JPA,可以将上述原生SQL查询集成到你的Repository接口中,例如:

import org.springframework.data.jpa.repository.JpaRepository;
import org.springframework.data.jpa.repository.Query;
import org.springframework.data.repository.query.Param;
import java.util.List;

public interface CurrencyRepository extends JpaRepository {

    @Query(nativeQuery = true, value = """
        SELECT id, name, last_received
        FROM (
            SELECT c.*,
            ROW_NUMBER() OVER (
                PARTITION BY name, to_char(last_received, 'yyyy-MM-dd')
                ORDER BY last_received DESC
            ) AS rn
            FROM Currency c
            WHERE c.name = :currName
        ) tbl
        WHERE rn = 1
        ORDER BY last_received
    """)
    List findLastByDateByCurrencyName(@Param("currName") String currName);
}

4. 注意事项与总结

  • “最新”与“最早”: 本文示例是获取“最新”时间戳(maxBy)。如果需要获取“最早”时间戳,只需将Collectors.maxBy替换为Collectors.minBy。
  • Optional::get的风险: 在Collectors.collectingAndThen中使用Optional::get时,如果分组为空,会抛出NoSuchElementException。在大多数实际场景中,groupingBy通常不会产生空分组,但为了健壮性,可以考虑使用Optional.orElse(null)或Optional.orElseThrow(() -> new MyCustomException("No element found in group"))。
  • 性能考量:
    • 对于小到中等规模的数据集,Java 8 Stream API在内存中处理是高效且简洁的。
    • 对于大规模数据集,尤其是在数据库中,原生SQL查询(特别是利用窗口函数)通常能提供更好的性能,因为它利用了数据库的索引和优化能力,避免了将大量数据加载到应用内存中进行处理。
  • 日期处理: LocalDateTime.toLocalDate()方法是关键,它确保我们只比较日期部分,忽略时间,从而实现“每天”的聚合。
  • 可读性: Java 8 Stream API提供了声明式编程风格,使得代码意图清晰,易于理解和维护。

通过本文的讲解,你应该能够熟练运用Java 8 Stream API解决按日期和特定字段分组并筛选最新/最早记录的问题,并了解在数据库层面如何使用原生SQL实现相同功能。根据你的数据量和系统架构,选择最适合的解决方案。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

749

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

328

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

350

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1283

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

361

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

861

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

581

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

423

2024.04.29

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3万人学习

C# 教程
C# 教程

共94课时 | 8万人学习

Java 教程
Java 教程

共578课时 | 53.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号