0

0

dict.setdefault() 在并发场景下的线程安全问题

舞姬之光

舞姬之光

发布时间:2026-01-27 18:11:03

|

670人浏览过

|

来源于php中文网

原创

dict.setdefault()非原子操作,执行分检查键、插入默认值、返回值三步,多线程下易致重复初始化与竞态丢失;GIL不保障其线程安全,应使用Lock或专用并发结构。

dict.setdefault() 在并发场景下的线程安全问题

dict.setdefault() 本身不是原子操作

dict.setdefault() 看似简单,但它的执行分三步:检查键是否存在 → 若不存在则插入默认值 → 返回对应值。这三步在 CPython 中**不构成原子操作**,中间可能被其他线程打断。一旦多个线程同时对同一个 key 调用 setdefault(),就可能出现重复计算默认值、覆盖写入,甚至逻辑错误。

典型并发问题:重复初始化与竞态丢失

常见于缓存初始化场景,比如用字典做单例对象池:

cache = {}
def get_worker(name):
    return cache.setdefault(name, Worker(name))  # ❌ 并发下可能创建多个 Worker

当两个线程同时发现 name 不存在,都会执行 Worker(name) 构造函数,然后各自写入——后写的会覆盖先写的,但构造开销已浪费,还可能引发资源泄漏(如重复建连接)。

  • 现象:Worker.__init__() 被调用多次,但 cache[name] 只保留最后一次结果
  • 根本原因:读-判-写(read-check-write)非原子,且默认值表达式(Worker(name))在锁外求值
  • 注意:dict 的底层哈希表扩容也可能在并发写入时触发未定义行为(虽不常崩,但标准不保证安全)

安全替代方案:threading.Lock 或 collections.defaultdict(仅限无副作用默认值)

若默认值构造有副作用(如 IO、实例化、状态变更),必须加锁;若只是常量或无状态工厂,可考虑 defaultdict,但它仍不能解决“首次赋值竞态”——因为 defaultdict__missing__ 也是在查不到时动态调用,同样非原子。

PatentPal专利申请写作
PatentPal专利申请写作

AI软件来为专利申请自动生成内容

下载
  • ✅ 推荐:用 threading.Lock 包裹整个 check-and-set 逻辑
  • ✅ 更优:改用 concurrent.futures.ThreadPoolExecutor + functools.lru_cache(需可哈希参数)或 weakref.WeakValueDictionary 配合显式同步
  • ⚠️ 注意:dict.setdefault(key, lock.acquire() or value or lock.release()) 这类写法是错的——acquire() 返回 True/False,且锁没释放

CPython GIL 不能帮你绕过这个问题

GIL 只保证单个字节码指令的原子性,而 setdefault() 对应多条字节码(LOAD_METHOD + CALL_METHOD),GIL 会在调用过程中释放(尤其在默认值含 IO 或 sleep 时)。所以即使纯 Python 场景,也不能依赖 GIL 实现线程安全。

真正需要并发安全字典行为时,别试图给 dict 打补丁——直接换用 threading.local()(线程隔离)、concurrent.futures.as_completed()(任务级协调),或引入 redis/memcached 做外部协调。本地 dict 的并发读写,从来就不是它的设计目标。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

766

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

377

2025.12.24

java多线程相关教程合集
java多线程相关教程合集

本专题整合了java多线程相关教程,阅读专题下面的文章了解更多详细内容。

32

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

30

2026.01.21

C# 多线程与异步编程
C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧,包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目,帮助开发者掌握 如何在 C# 中构建高并发、低延迟的异步系统,提升应用性能和响应速度。

104

2026.02.06

常用的数据库软件
常用的数据库软件

常用的数据库软件有MySQL、Oracle、SQL Server、PostgreSQL、MongoDB、Redis、Cassandra、Hadoop、Spark和Amazon DynamoDB。更多关于数据库软件的内容详情请看本专题下面的文章。php中文网欢迎大家前来学习。

1007

2023.11.02

内存数据库有哪些
内存数据库有哪些

内存数据库有Redis、Memcached、Apache Ignite、VoltDB、TimesTen、H2 Database、Aerospike、Oracle TimesTen In-Memory Database、SAP HANA和ache Cassandra。更多关于内存数据库相关问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

673

2023.11.14

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号