0

0

如何在Golang中实现并发安全的BitMap Go语言海量数据去重并发版

P粉602998670

P粉602998670

发布时间:2026-03-11 15:05:09

|

803人浏览过

|

来源于php中文网

原创

原生 map[uint64]bool 不能并发写入,因 go map 非并发安全,多 goroutine 同时写必 panic;正确解法是分块位图:用 []uint64 存桶,每桶管 64 bit,配独立 mutex,按 n>>6 定桶、n&63 定偏移,实现无冲突并发位操作。

如何在golang中实现并发安全的bitmap go语言海量数据去重并发版

为什么原生 map[uint64]bool 不能直接并发写入

Go 的 map 不是并发安全的,只要两个 goroutine 同时对同一个 map 做写操作(哪怕只是设 true),运行时大概率 panic 报 fatal error: concurrent map writes。这不是概率问题,是确定性崩溃 —— 只要触发条件满足,必崩。

常见错误写法:

var seen = make(map[uint64]bool)<br>go func() { seen[123] = true }()<br>go func() { seen[456] = true }()

别指望加个 sync.Once 或只读不写就能绕过:只要存在任何写操作,就必须保护。

  • sync.Map?不行 —— 它适合「读多写少 + key 类型不确定」场景,但位图本质是密集整数索引,sync.Map 的哈希+分段锁开销大,且不支持原子位操作
  • sync.RWMutex 包裹普通 map?可以但低效 —— 每次 set/check 都要锁整个结构,吞吐上不去
  • 真正解法是分治:把大位图切块,每块配独立锁,写操作只锁对应块

sync.Pool + 分块 []uint64 实现高并发位图

核心思路:把 64 位整数当一个“桶”,每个桶管理 64 个 bit;用数组 []uint64 存所有桶,再用 sync.Mutex 数组按桶索引分锁。这样两个 goroutine 写不同桶(比如 bit 123 和 bit 456)完全不冲突。

关键计算:
- bit 位置 n 对应桶索引:n / 64(即 n >> 6
- 在桶内偏移:n % 64(即 n & 63
- 设置位:bits[idx] |= (1

  • 桶数组长度建议预估:比如去重 10 亿 ID,最大 ID 是 1e9,需要 (1e9 + 63) / 64 ≈ 15.6Muint64,约 125MB 内存
  • 锁数组大小建议和桶数一致,或取其平方根(如 1024 锁管 1M 桶),避免锁竞争又不过度分配
  • 不要用 sync.Pool 复用整个位图 —— 它适合短期对象,位图生命周期通常贯穿业务流程,复用反而导致状态残留

atomic 能否替代锁?看场景

如果只做「设置位」(set)且不关心返回旧值,可以用 atomic.Or64 直接操作单个 uint64 桶,完全免锁。但注意:
- atomic.Or64(&bits[idx], 1 是安全的<br> - 但 <code>Get() 判断是否已存在,需读取后与掩码做 & 运算:(atomic.LoadUint64(&bits[idx]) & (1

  • 优势:零锁,超高吞吐,适合「只写不查」或「查之前已确保写过」的场景(如日志去重)
  • 坑点:Go 1.19+ 才支持 atomic.Or64;低于此版本只能手写汇编或退回到 mutex 分块
  • 不适用场景:需要 CAS(如「如果未存在则设」)、需要统计当前位数、或需要清零某 bit —— 这些必须用锁保原子性

内存布局和扩容怎么不拖慢性能

位图一旦初始化,就应尽量避免动态扩容。每次 append 底层数组都会触发 realloc + copy,而并发中 copy 过程若被其他 goroutine 访问,极易读到中间态(部分旧数据、部分新数据)。

IBM Watson
IBM Watson

IBM Watson文字转语音

下载
  • 初始化时就按最大可能 bit 位申请:用 make([]uint64, size),不是 make([]uint64, 0, size) —— 后者仍会触发首次写入扩容
  • 如果 ID 范围不可预估(如 hash 后的 uint64),用布隆过滤器预筛 + 小位图分片组合,别硬扛全量
  • 测试时重点压测「高位 bit 写入」:比如总长 1M 桶,专写第 999999 个桶,确认锁和内存访问没越界

最易被忽略的是 cache line 伪共享:多个高频访问的桶如果落在同一 cache line(通常是 64 字节 = 10 个 uint64),会导致 CPU 核心间频繁同步该 line。解决方案是桶之间填充 padding,或让锁粒度略大于单桶(如每 8 桶共用一把锁)。

立即学习go语言免费学习笔记(深入)”;

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

210

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

247

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

356

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

214

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

409

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

490

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

200

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

1438

2025.06.17

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 6.1万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号