C++如何实现高并发计数器？（分片原子计数优化）

尼克

发布时间：2026-02-23 14:26:03

687人浏览过

来源于php中文网

原创

std::atomic在高并发下因缓存行抖动和总线争用成为瓶颈，分片通过独立对齐的原子变量+哈希索引+relaxed内存序提升吞吐至200M+ ops/sec。

c++如何实现高并发计数器？（分片原子计数优化）

为什么 std::atomic 在高并发下会成为瓶颈

因为所有线程都争抢同一块缓存行，频繁触发 cache line bouncing。即使 std::atomic<int></int> 本身是无锁的，底层仍依赖 LOCK XADD 或 cmpxchg 指令，导致 CPU 核心间总线争用加剧。实测在 32 核机器上，纯 std::atomic<int></int> 计数吞吐常卡在 20M–50M ops/sec，而分片后可达 200M+。

如何用分片（sharding）绕过 false sharing

核心是让每个线程尽量操作独立缓存行，避免多个原子变量落在同一 cache line（通常 64 字节）。关键点：

分片数建议设为 2 的幂（如 64、128），方便用位运算取模，避免除法开销
每个分片用独立的 std::atomic<int64_t></int64_t>，且用 alignas(64) 强制对齐，防止相邻分片被挤进同一 cache line
线程本地选择分片时，别用 thread_id % shard_count——线程 ID 可能重复或分布不均；改用 std::hash<:thread::id>{}(std::this_thread::get_id()) & (shard_count - 1)</:thread::id>
读取总数时需遍历所有分片累加，这是唯一需要同步的聚合点，但只在必要时做（比如每秒统计一次）

示例结构体：

struct ShardedCounter {
    static constexpr size_t kShards = 64;
    alignas(64) std::atomic<int64_t> shards_[kShards];
<pre class="brush:php;toolbar:false;">ShardedCounter() { for (auto& s : shards_) s.store(0, std::memory_order_relaxed); }

void increment() {
    size_t idx = std::hash<std::thread::id>{}(std::this_thread::get_id()) & (kShards - 1);
    shards_[idx].fetch_add(1, std::memory_order_relaxed);
}

int64_t load() const {
    int64_t total = 0;
    for (const auto& s : shards_) {
        total += s.load(std::memory_order_relaxed);
    }
    return total;
}

};

立即学习“C++免费学习笔记（深入）”；

std::memory_order_relaxed 能否安全用于分片计数

可以，前提是仅用于计数器本身，不参与其他依赖逻辑。因为各分片之间无顺序要求，总数只是近似值；且 fetch_add 的原子性由硬件保证，relaxed 仅放弃编译器/CPU 重排约束，不影响单个操作的完整性。

EasySite

零代码AI网站开发工具

下载

但注意两个坑：

如果后续逻辑依赖“计数值达到 N 后触发某行为”，就不能只靠 relaxed——得用 acquire/release 配合 flag 变量，或直接改用带条件的 compare_exchange
某些平台（如 ARM）对 relaxed 的实现开销未必比 acquire 小太多，实际应以 perf 测为准，别盲目迷信“relaxed 更快”

分片数太少或太多分别会出什么问题

分片太少（如 4 个）：仍存在明显 cache line bouncing，尤其在核数多、线程密集的场景，性能提升有限；分片太多（如 1024 个）：增加 load() 时的遍历开销，且可能因 padding 导致 L1 cache footprint 暴涨，反而引发 cache miss。

经验法则：

常规服务进程（16–64 线程）：选 64 分片足够
超大规模批处理（数百线程）：可试 128，但务必用 perf stat -e cache-misses 对比验证
嵌入式或小内存环境：慎用分片，有时 std::atomic + 批量缓冲（如每 100 次再提交）更省空间

最易被忽略的是：分片数组必须连续分配在堆上（或静态存储），千万别用 std::vector<:atomic>></:atomic>——默认 allocator 不保证 64 字节对齐，alignas 会失效。

C++怎么实现快速排序_C++经典算法教程【高效】

C++怎么实现滑动窗口最大值_C++单调队列教程【算法】

C++中namespace命名空间怎么用_C++解决标识符冲突方法【结构】

C++如何使用std::index_sequence展开参数包？（元组遍历技巧）

C++如何实现依赖注入？（轻量级IoC容器设计）

相关标签:

c++ 结构体堆线程并发 padding

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C++怎么实现逆波兰表达式_C++栈求值后缀表达式【计算】下一篇：暂无

作者最新文章

Sublime当前行下划线_Sublime highlight_line设置【高亮】

2026-02-22 14:04

智联招聘官网入口智联招聘网页版首页

2026-02-22 14:12

Sublime如何配置SaltStack SLS文件语法高亮？（配置管理）

2026-02-22 14:14

赶集网本地服务官网赶集网网页版

2026-02-22 14:40

夸克浏览器网盘怎么下载文件_夸克云盘文件保存到手机教程【存储】

2026-02-22 14:49

UC浏览器如何开启网页预读_UC浏览器加载提速教程【秒开】

2026-02-22 14:53

MAC怎么查看硬盘使用详情_MAC存储管理分析【清晰】

2026-02-22 14:54

Composer怎么生成类映射_Composer classmap自动加载配置【映射】

2026-02-22 14:59

学信网怎么查不到学历信息_学信网学历查不到的几种常见原因及解决【必看】

2026-02-22 15:13

Sublime检查语法错误_Sublime SublimeLinter配置【查错】

2026-02-22 15:19

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

365

2025.06.09

golang结构体方法

本专题整合了golang结构体相关内容，请阅读专题下面的文章了解更多。

200

2025.07.04

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

422

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

595

2023.08.10

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

715

2023.08.10

css中的padding属性作用

在CSS中，padding属性用于设置元素的内边距。想了解更多padding的相关内容，可以阅读本专题下面的文章。

154

2023.12.07

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式，涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明，帮助用户高效找到pixiv官方网站，实现便捷、安全的网页端浏览与账号登录体验。

1044

2026.02.13

微博网页版主页入口与登录指南_官方网页端快速访问方法

本专题系统整理微博网页版官方入口及网页端登录方式，涵盖首页直达地址、账号登录流程与常见访问问题说明，帮助用户快速找到微博官网主页，实现便捷、安全的网页端登录与内容浏览体验。

334

2026.02.13

Flutter跨平台开发与状态管理实战

本专题围绕Flutter框架展开，系统讲解跨平台UI构建原理与状态管理方案。内容涵盖Widget生命周期、路由管理、Provider与Bloc状态管理模式、网络请求封装及性能优化技巧。通过实战项目演示，帮助开发者构建流畅、可维护的跨平台移动应用。

213

2026.02.13

热门下载

网站特效

网站源码

网站素材

前端模板