0

0

Java并行流中状态操作的陷阱:理解竞态条件与并发控制

霞舞

霞舞

发布时间:2025-10-30 21:56:02

|

809人浏览过

|

来源于php中文网

原创

Java并行流中状态操作的陷阱:理解竞态条件与并发控制

java并行流中对共享可变状态(如外部列表)进行操作时,由于多线程并发访问,可能导致不可预测的行为,例如`list.size()`的非预期变化。本文将深入探讨并行流中状态操作引发的竞态条件,并提供使用并发锁等机制进行有效控制的方法,以确保数据一致性和程序正确性。

理解Java并行流与状态操作

Java 8引入的Stream API极大地简化了集合操作。并行流(Parallel Stream)是Stream API的一个强大特性,它允许我们将流操作并行化,从而利用多核处理器的优势来提高处理速度。然而,并行流的强大能力也伴随着对并发编程的挑战。

当流操作是“无状态的”(stateless)时,即每个元素的操作独立于其他元素,并且不修改任何外部共享状态时,并行流能很好地工作。但如果流操作是“有状态的”(stateful),例如在lambda表达式中访问或修改一个外部变量(如一个List),那么就可能引入并发问题。

考虑以下示例代码,它尝试在一个并行流中根据条件向一个外部List添加元素:

import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

public class ParallelStreamStatefulExample {

    static void statefulParallelLambdaSetProblem() {
        Set s = new HashSet<>(
            Arrays.asList(1, 2, 3, 4, 5, 6)
        );

        List list = new ArrayList<>();
        int sum = s.parallelStream().mapToInt(e -> {
            // 问题:list.size() 在管道操作执行期间可能发生变化
            // mapToInt 的 lambda 表达式依赖于此值,因此它是“有状态的”
            if (list.size() <= 3) {
                list.add(e);
                return e;
            } else {
                return 0;
            }
        }).sum();

        System.out.println("计算结果 sum: " + sum);
        System.out.println("最终 list: " + list);
        System.out.println("最终 list size: " + list.size());
    }

    public static void main(String[] args) {
        statefulParallelLambdaSetProblem();
    }
}

在上述代码中,list.size()和list.add(e)都在并行流的lambda表达式中被访问和修改。由于并行流会使用多个线程同时处理数据,这些对共享list的操作会交错执行,导致不可预测的结果。

立即学习Java免费学习笔记(深入)”;

竞态条件:list.size()变化之谜

当多个线程同时访问和修改同一个共享资源,并且至少有一个操作是写入操作时,如果这些操作的最终结果取决于线程执行的时序,就称之为发生了“竞态条件”(Race Condition)。在上述示例中,list.size()的非预期变化正是竞态条件的一个典型表现。

具体来说,当一个线程执行if (list.size()

这种线程执行顺序的不确定性,加上对非线程安全的ArrayList的并发修改,使得list.size()的值在不同的执行时刻和不同的线程看来可能不同,最终导致:

Soundful
Soundful

Soundful Ai音乐生成器,只需一个按钮即可生成免版税曲目

下载
  1. list.size()
  2. list中实际添加的元素可能超过3个,甚至可能因为ArrayList的非线程安全特性而抛出ConcurrentModificationException或导致内部数据结构损坏。
  3. 每次运行程序,sum的值和list中的内容都可能不同。

规避竞态条件:并发控制机制

为了解决并行流中状态操作引发的竞态条件,我们需要引入并发控制机制,确保对共享资源的访问是同步的(Synchronized)和原子性的(Atomic)。Java提供了多种并发工具,其中最常用的是synchronized关键字和java.util.concurrent.locks包下的锁。

使用 synchronized 关键字

synchronized关键字可以用于方法或代码块,确保在任何给定时刻只有一个线程可以执行被同步的代码。

import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

public class ParallelStreamStatefulExampleSynchronized {

    static void statefulParallelLambdaSetSynchronized() {
        Set s = new HashSet<>(
            Arrays.asList(1, 2, 3, 4, 5, 6)
        );

        List list = new ArrayList<>();
        // 使用一个专门的锁对象,或者直接同步在list对象上(如果list本身不是线程安全的,需要谨慎)
        // 这里为了清晰,使用一个独立的锁对象
        final Object lock = new Object(); 

        int sum = s.parallelStream().mapToInt(e -> {
            int result = 0;
            synchronized (lock) { // 同步访问 list.size() 和 list.add()
                if (list.size() <= 3) {
                    list.add(e);
                    result = e;
                }
            }
            return result;
        }).sum();

        System.out.println("同步后的 sum: " + sum);
        System.out.println("同步后的 list: " + list);
        System.out.println("同步后的 list size: " + list.size());
    }

    public static void main(String[] args) {
        statefulParallelLambdaSetSynchronized();
    }
}

通过将if (list.size()

使用 java.util.concurrent.locks.ReentrantLock

ReentrantLock提供了比synchronized更灵活的锁定机制,例如可以尝试获取锁、定时获取锁等。

import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashSet;
import java.util.List;
import java.util.Set;
import java.util.concurrent.locks.Lock;
import java.util.concurrent.locks.ReentrantLock;

public class ParallelStreamStatefulExampleReentrantLock {

    static void statefulParallelLambdaSetReentrantLock() {
        Set s = new HashSet<>(
            Arrays.asList(1, 2, 3, 4, 5, 6)
        );

        List list = new ArrayList<>();
        final Lock listLock = new ReentrantLock(); // 创建一个可重入锁

        int sum = s.parallelStream().mapToInt(e -> {
            int result = 0;
            listLock.lock(); // 获取锁
            try {
                if (list.size() <= 3) {
                    list.add(e);
                    result = e;
                }
            } finally {
                listLock.unlock(); // 确保在finally块中释放锁
            }
            return result;
        }).sum();

        System.out.println("ReentrantLock 同步后的 sum: " + sum);
        System.out.println("ReentrantLock 同步后的 list: " + list);
        System.out.println("ReentrantLock 同步后的 list size: " + list.size());
    }

    public static void main(String[] args) {
        statefulParallelLambdaSetReentrantLock();
    }
}

使用ReentrantLock时,需要手动调用lock()获取锁和unlock()释放锁,并且通常建议将unlock()放在finally块中,以确保在发生异常时也能正确释放锁。

注意事项与最佳实践

  1. 避免状态操作: 最好的解决方案是尽可能避免在并行流中执行有状态的操作。如果需要收集结果,考虑使用Collectors提供的并发收集器,如Collectors.toConcurrentMap()、Collectors.groupingByConcurrent()等,它们内部已经处理了并发问题。
  2. 性能开销: 引入锁机制会带来额外的性能开销,因为它会序列化对共享资源的访问,这可能抵消并行流带来的部分性能优势。如果同步块非常大或者竞争激烈,并行流的性能甚至可能低于串行流。
  3. 线程安全集合: 如果需要向集合中添加元素,可以考虑使用线程安全的集合类,如java.util.concurrent.CopyOnWriteArrayList或java.util.concurrent.ConcurrentLinkedQueue,但它们有各自的适用场景和性能特点。
  4. 原子操作: 对于简单的计数器或布尔标志,可以使用java.util.concurrent.atomic包下的原子类(如AtomicInteger、AtomicLong)来避免使用锁,它们提供了无锁的原子操作,性能通常更好。
  5. 串行流的确定性: 即使是串行流,如果源数据(如HashSet)的迭代顺序不确定,那么每次运行得到的最终结果(例如sum和list的内容)也可能不同,但这与并行流中的竞态条件是不同的概念。串行流不会有list.size()在单次操作中“意外”变化的竞态问题。

总结

Java并行流是提高程序性能的强大工具,但它要求开发者对并发编程有深入的理解。在并行流中使用有状态操作,特别是对共享可变状态进行读写时,极易引发竞态条件,导致程序行为不可预测。通过理解竞态条件的本质,并合理运用synchronized关键字或java.util.concurrent.locks包下的锁机制,我们可以有效地控制并发访问,确保数据的一致性和程序的正确性。然而,最好的实践是尽量设计无状态的流操作,或利用Java并发API提供的线程安全结构,以最小化锁的开销,充分发挥并行流的优势。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

844

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

742

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

740

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

400

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

431

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16926

2023.08.03

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

8

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.8万人学习

C# 教程
C# 教程

共94课时 | 7.4万人学习

Java 教程
Java 教程

共578课时 | 49.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号