内存顺序(memory_order)是C++11用于控制原子操作周边非原子访问重排序的机制,通过六种枚举值(relaxed、consume、acquire、release、acq_rel、seq_cst)约束编译器和CPU的指令重排,确保多线程下数据同步正确性与性能平衡。

内存顺序(memory_order)是 C++11 引入的用于精确控制原子操作周边非原子内存访问重排序行为的机制。它不改变原子操作本身的可见性或原子性,而是告诉编译器和 CPU:哪些读写可以被重排、哪些必须严格按序执行——这是写出正确、高效无锁并发代码的关键。
为什么需要 memory_order?
现代 CPU 和编译器为提升性能,会主动对指令做重排序(reordering),只要单线程语义不变。但多线程下,这种“合法”的重排可能破坏逻辑。比如:
线程 A:
flag = true; // 非原子写
data = 42; // 非原子写
线程 B:
if (flag) { use(data); }若编译器或 CPU 把
data = 42 提前到 flag = true 前,而 B 看到 flag == true 却读到未初始化的 data,就出错了。
memory_order 就是用来插入“内存栅栏”(memory fence),约束这类跨线程的重排边界。
六种 memory_order 的含义与典型用途
memory_order_relaxed
只保证原子操作本身是原子的,不施加任何顺序约束。适用于计数器、句柄生成等无需同步其他内存的场景。
- 允许编译器/CPU 对其前后非原子访问任意重排
- 不能用于构建同步关系(如 release-acquire)
memory_order_consume
已基本被弃用(C++20 起不鼓励使用)。曾意图实现“数据依赖顺序”,但因实现复杂且易出错,主流编译器实际当作 acquire 处理。
memory_order_acquire
用于读操作(load)。保证该读之后的所有读写(包括非原子)不会被重排到该读之前。
- 常与
memory_order_release配对,实现线程间同步 - 典型场景:读取一个标志位后,安全访问其保护的数据
memory_order_release
用于写操作(store)。保证该写之前的所有读写(包括非原子)不会被重排到该写之后。
- 与 acquire 构成“synchronizes-with”关系,建立 happens-before
- 典型场景:先更新数据,再设置完成标志
memory_order_acq_rel
用于读-修改-写操作(如 fetch_add, exchange)。兼具 acquire 和 release 语义:操作前禁止重排入,操作后禁止重排出。
- 适合实现自旋锁、引用计数增减等需双向同步的操作
- 不是 acquire + release 的简单叠加,而是一次原子操作的完整屏障
memory_order_seq_cst
默认顺序,最严格。所有带此标记的操作构成单一全序(total order),就像所有线程在共享时钟下排队执行一样。
- 提供最强一致性,也带来最高开销(尤其在弱一致性架构如 ARM/Power 上)
- 适合初学者、逻辑复杂难分析的场景,或需要全局顺序保证(如互斥锁模拟)
如何选择合适的 memory_order?
核心原则:用能满足需求的最弱顺序。
立即学习“C++免费学习笔记(深入)”;
- 仅需原子性(如计数器累加),选
relaxed - 需线程间发布/消费数据(如生产者-消费者标志),用
release+acquire - 需读改写且同步双向(如锁的获取/释放),用
acq_rel - 不确定或要求绝对安全,用
seq_cst(但别滥用)
错误选择后果严重:过强 → 性能下降;过弱 → 数据竞争、未定义行为(UB),且极难复现调试。
常见误区与注意事项
memory_order 不保证非原子变量的可见性
即使用了 acquire,若读的是非原子变量,仍可能看到陈旧值。必须确保被保护的变量本身也通过原子操作或同步机制访问。
acquire-release 只对同个原子变量有效
A 写 flag.store(true, release),B 读 flag.load(acquire) 才构成同步;若 B 读另一个原子变量,则无效。
不要混合 relaxed 和 acquire/release 构建同步链
relaxed 操作无法参与 happens-before 关系。例如:A 写 flag(relaxed),B 读 flag(acquire),再 C 读 flag(relaxed) —— C 无法从 B 的 acquire 推出对 A 的同步。
基本上就这些。理解 memory_order 不是死记硬背,而是建立“同步点→happens-before→可见性”的思维链条。写无锁代码前,务必画出线程间数据流与同步依赖图。










