如何在Java中利用双端队列(Deque)实现工作窃取模式的自定义框架_出队与入队的无锁设计

P粉602998670

发布时间：2026-03-14 01:27:32

752人浏览过

来源于php中文网

原创

工作窃取队列需无锁双端结构，本地用LIFO（pop）、窃取用FIFO（pollFirst），核心是原子维护top/base索引与2的幂数组，任务须不可变并加内存屏障，满时应分层缓冲而非加锁。

如何在java中利用双端队列(deque)实现工作窃取模式的自定义框架_出队与入队的无锁设计

Deque 的 `pollFirst()` 和 `offerLast()` 为什么不能直接用于工作窃取

因为标准 ArrayDeque 和 LinkedBlockingDeque 都不是线程安全的（前者完全无锁但非并发安全，后者加锁粒度大），而工作窃取要求「本地线程高频 push/pop，其他线程低频 steal」——必须分离读写路径，避免伪共享和 CAS 冲突。

常见错误现象：ConcurrentModificationException 或无限重试循环，尤其在高竞争下 pollFirst() 返回 null 却实际有任务，本质是缺乏内存可见性与原子状态判断。

本地执行用 pop()（LIFO）提升缓存局部性，窃取端必须用 pollFirst()（FIFO）防饥饿，二者语义不能混用
ArrayDeque 的扩容机制在多线程下会破坏数组连续性假设，导致 cas 失败后无法回退
别试图用 ConcurrentLinkedDeque：JDK 未提供该类，ConcurrentLinkedQueue 是单端，不支持双端原子操作

用 `AtomicReferenceArray` 手写无锁双端栈的核心结构

工作窃取队列本质是「本地线程独占的栈 + 其他线程只读首尾的队列」，所以只需保证两个位置原子更新：栈顶索引（top）和底端索引（base）。所有操作围绕这两个 AtomicInteger 展开，数组本身只做存储容器。

关键设计点：本地 push/pop 操作只改 top；窃取线程尝试 CAS base，且仅当 top > base + 1 时才允许取走 base 位置的任务（留至少一个防竞争丢失）。

立即学习“Java免费学习笔记（深入）”；

数组长度必须是 2 的幂，用位运算替代取模：index & (array.length - 1)
push 时先 CAS top，成功后再写数组；pop 时先读 top，再 CAS 递减，最后读数组 —— 顺序不能反，否则出现 ABA 问题
窃取失败不自旋，立即放弃：工作窃取本就是尽力而为，频繁失败说明负载已均衡

int t = top.get();
int b = base.get();
if (t > b + 1) {
    if (base.compareAndSet(b, b + 1)) {
        return array[b & mask];
    }
}

为什么 `StealTask` 必须是不可变对象 + 显式内存屏障

任务对象一旦入队，就可能被多个线程读取（本地执行、其他线程窃取），若任务含可变字段（如 status 字段），不同线程看到的值可能不一致，导致重复执行或漏执行。

PaperFake

AI写论文

下载

常见错误场景：任务里调用 System.currentTimeMillis() 记录开始时间，结果窃取线程看到的是 0 —— 因为写操作没对其他 CPU 核心可见。

所有任务字段声明为 final，构造即完成初始化
若需运行时状态，改用 AtomicIntegerFieldUpdater 控制特定字段，避免整个对象加锁
在 push() 最后插入 Unsafe.storeFence()（或 JDK9+ 的 VarHandle.releaseFence()），确保数组写入对其他线程可见

本地队列满时的 fallback 策略比锁更关键

无锁结构无法动态扩容，数组大小必须预设。填满后若强行拒绝任务，会导致提交线程阻塞或丢任务；若退化为加锁队列，又破坏无锁设计初衷。

真实生产中更有效的做法是分层缓冲：本地无锁栈 → 线程组共享的 TransferQueue → 全局阻塞队列。只有前两层都满才触发第三层。

本地栈大小建议设为 4096（兼顾 L1 缓存行与空间利用率），超过后转交 ForkJoinPool.commonPool() 的 submit()
避免用 synchronized 包裹整个 offer()，哪怕只有一行 —— 锁会把无锁队列变成串行瓶颈
监控指标重点看 stealCount 和 localQueueOverflow，前者持续为 0 说明负载不均，后者突增说明预估容量过小

真正难的不是写对那几个 CAS，而是让本地线程足够“懒”——只在必要时才检查其他队列是否可窃取，其余时间专注自己的栈。这点容易被忽略，但决定整体吞吐上限。

如何在 Java 中高效找出 15 行数据行和的最大值及其对应行号

Java中实现两个独立Wizard实例的对战逻辑：从对象传递到战斗方法设计

如何在Java中实现两个独立创建的Wizard对象之间的对战逻辑

Java 中方法引用绑定功能接口时的默认方法覆盖规则详解

Java中方法引用绑定功能接口时的默认方法覆盖行为解析

相关标签:

java Array NULL 循环栈 Length 线程多线程并发对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Java中的异常栈太长怎么过滤_快速定位业务代码所在行的技巧下一篇：如何利用Java集合实现简单的优先级任务调度_堆结构应用

作者最新文章

悟空浏览器怎么关闭启动时的加载动画闪屏_悟空浏览器秒开优化

2026-03-13 17:04

如何在Golang中通过反射创建并操作切片 Go语言reflect.MakeSlice实战

2026-03-13 17:05

如何避免PL/SQL中的SQL注入_绑定变量Bind Variables的最佳实践

2026-03-13 17:05

Safari浏览器如何关闭网页的安全证书警告_Safari浏览器继续访问

2026-03-13 17:06

宝塔面板下如何安装Node.js的特定版本镜像源？

2026-03-13 17:09

如何在Golang中实现优雅的请求超时控制 Go语言http.TimeoutHandler使用

2026-03-13 17:09

如何在Golang中利用Trace工具分析延迟 Go语言执行链路可视化追踪

2026-03-13 17:09

如何在Golang中利用SQLite进行本地存储 Go语言嵌入式数据库应用

2026-03-13 17:11

如何在Golang中利用Finalizer清理非内存资源 Go语言runtime.SetFinalizer使用

2026-03-13 17:11

如何为Oracle配置多监听器_不同端口的并发监听机制实现

2026-03-13 17:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1089

2024.03.01

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

447

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度，以便在查询和处理字符串数据时进行操作和判断。需要注意的是length函数计算的是字符串的字符数，而不是字节数。对于多字节字符集，一个字符可能由多个字节组成。因此，length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法，大家可以阅读本专题下面的文章。

954

2023.09.19