0

0

如何使用c++的std::atomic实现一个自旋锁(spinlock)? (低延迟同步)

尼克

尼克

发布时间:2026-01-12 01:57:08

|

374人浏览过

|

来源于php中文网

原创

std::atomic 是最简自旋锁的底层支撑,可直接实现基础自旋锁,核心是利用 exchange(true, memory_order_acquire) 的原子性;它不依赖系统调度、避免上下文切换,适合短临界区和极短等待场景。

如何使用c++的std::atomic实现一个自旋锁(spinlock)? (低延迟同步)

std::atomic 是最简自旋锁的底层支撑

直接用 std::atomic 实现基础自旋锁是可行且常见的,核心在于利用其 test_and_set()(即 exchange(true, std::memory_order_acquire))的原子性。它不依赖操作系统调度,避免上下文切换开销,适合短临界区、高争用但等待时间极短的场景。

注意:不能用 std::atomic_flag 以外的类型做“无锁”保证——std::atomic 在所有主流平台(x86-64、ARM64)上都映射为单条 lock xchgldaxr/stlxr 指令,满足自旋锁对原子写+读-修改-写的最低要求。

常见错误是误用 load() + store() 组合替代原子交换:

bool expected = false;
while (!flag.compare_exchange_weak(expected, true, std::memory_order_acquire)) {
    expected = false; // 必须重置,否则 compare_exchange_weak 可能因 ABA 失败后卡住
    _mm_pause();      // 推荐:x86 上提示 CPU 当前在忙等,降低功耗和总线争用
}

memory_order 选错会导致数据竞争或性能反模式

自旋锁的内存序不是“越强越好”。关键点在于:

立即学习C++免费学习笔记(深入)”;

  • 加锁用 std::memory_order_acquire:确保后续临界区读写不会被重排到锁获取之前
  • 解锁用 std::memory_order_release:确保临界区内的写操作对其他线程可见
  • 绝对不要在加锁时用 relaxed —— 会导致临界区指令重排进锁外,破坏同步语义
  • 也不要用 seq_cst —— 在 ARM/PowerPC 上会插入昂贵的全局内存屏障,x86 虽便宜但仍是冗余

典型错误现象:临界区内更新的 int counter 值在其他线程中“偶尔看不到”,其实是编译器或 CPU 将该写操作重排到了 unlock() 之后。

std::atomic_flag 是更轻量、更标准的起点

std::atomic_flag 是 C++ 标准唯一保证“无锁”(lock-free)的原子类型,初始化必须用 ATOMIC_FLAG_INIT(C++17 起可直接用默认构造,但需调用 .clear(std::memory_order_relaxed) 初始化)。

百度智能云·曦灵
百度智能云·曦灵

百度旗下的AI数字人平台

下载

它只提供 test_and_set()clear(),语义清晰、体积最小(通常 1 字节),比 std::atomic 更贴近硬件原语:

struct spinlock {
    std::atomic_flag flag = ATOMIC_FLAG_INIT;

    void lock() {
        while (flag.test_and_set(std::memory_order_acquire)) {
            _mm_pause();
        }
    }

    void unlock() {
        flag.clear(std::memory_order_release);
    }
};

使用 std::atomic_flag 的另一个好处是:编译器能更好识别这是自旋行为,某些优化(如循环展开)会被抑制,避免生成低效代码。

真实低延迟场景下必须考虑退避与公平性缺失

纯自旋锁在高争用下会持续占用 CPU 核心,导致:其他线程饿死、温度升高、Turbo Boost 频率下降、实际延迟反而升高。这不是理论风险,而是高频交易或实时音频处理中反复验证的问题。

简单改进是加入指数退避(exponential backoff):

  • 首次失败后 _mm_pause() 1 次
  • 第二次失败后 _mm_pause() 2 次
  • 最多叠加到 64 次后,改用 std::this_thread::yield() 让出时间片

但要注意:yield() 会引入调度延迟(微秒级),破坏“低延迟”前提;而完全不退避又可能让锁持有者无法及时被调度(尤其在负载饱和时)。这个权衡没有银弹,取决于你的临界区平均耗时和系统负载特征。

最后提醒:自旋锁不提供排队机制,线程获得锁的顺序不确定。如果你需要 FIFO 公平性,得上 std::mutex 或基于队列的 ticket lock —— 但那就不再是纯自旋了。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

315

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

537

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

52

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

197

2025.08.29

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

480

2023.08.10

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

34

2026.01.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

14

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

33

2026.01.13

MySQL数据库报错常见问题及解决方法大全
MySQL数据库报错常见问题及解决方法大全

本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

18

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Rust 教程
Rust 教程

共28课时 | 4.4万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.1万人学习

Git 教程
Git 教程

共21课时 | 2.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号