Python set 底层结构实现原理

舞夢輝影

发布时间：2026-02-26 19:04:02

967人浏览过

来源于php中文网

原创

python set 底层结构实现原理

Python 的 set 底层基于哈希表（hash table）实现，和 dict 高度相似，但只存储键（key），不存值（value）。它的核心目标是支持平均 O(1) 时间复杂度的成员检查、插入和删除操作。

哈希表结构：数组 + 桶链（开放寻址法）

CPython 中的 set 使用**开放寻址法（open addressing）**，而非拉链法（chaining）。这意味着：

底层是一块连续的内存数组（称为 table），每个槽位（slot）存储一个 hash 值和一个指向元素对象的指针；
当发生哈希冲突时，不是在槽位后挂链表，而是按固定探测序列（如线性探测或二次探测变种）寻找下一个空闲槽；
CPython 实际使用的是“伪随机探测”（基于 hash 值扰动的线性探测改进版），兼顾局部性和冲突分散性。

关键字段与内存布局

每个 set 对象内部维护一个 PySetObject 结构体，主要包含：

table 指针：指向哈希表数组起始地址；
used：当前已存储的唯一元素个数；
fill：已占用（含已删除标记）的槽位总数（用于触发扩容）；
mask：哈希表长度减一（table size 总是 2 的幂），用于快速取模：index = hash & mask；
deleted slots：被删除元素留下的“哑元”（dummy）槽位（值为 NULL 或特殊标记），避免探测链断裂。

哈希计算与冲突处理细节

插入一个元素 x 时，流程如下：

造次

Liblib打造的AI原创IP视频创作社区

下载

立即学习“Python免费学习笔记（深入）”；

调用 hash(x) 得到哈希值（要求对象可哈希且 hash 稳定）；
用 hash & mask 定位初始索引；
若该槽为空或为 dummy，直接插入；
若槽中已有元素，比较其 hash 值是否相等 → 不等则探测下一个位置；
若 hash 相等，再调用 == 判断是否真正重复（解决哈希碰撞）。

注意：set 的去重依赖 hash() 和 __eq__() 两个方法协同工作——hash 不同一定不等，hash 相同才需进一步比较。

动态扩容与收缩机制

当 fill / size > 2/3（约 66.7% 负载率）时触发扩容，新 size 为原 size 的 4 倍（最小为 8）；删除大量元素后，若 fill / size 且 size > 50000，则可能缩容。扩容过程会重新哈希所有现存元素，重建 table。

这种策略在空间和时间间做了权衡：避免频繁重哈希，同时控制探测长度增长（负载率越低，平均查找步数越少）。

Python 闭包原理及常见面试题解析

Python IndentationError 原因与解决

如何在 Python 中安全使用类型注解作为元数据而不干扰静态类型检查

Python 单元测试调试方法

Python 自定义异常类设计方法

相关标签:

python NULL 结构体指针对象 table

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 3.12 中用于元数据标注而不干扰静态类型检查的推荐方案下一篇：Python sort 与 sorted 区别深度解析

作者最新文章

苹果手机id是什么苹果手机怎么注册id帐号

2026-02-26 04:11

个人所得税专项附加扣除_2025个人所得税专项附加扣除项目及标准

2026-02-26 05:57

苹果手机删除照片彻底吗苹果手机删除照片是否永久解析

2026-02-26 06:19

商标注册流程图_商标注册流程图最新版高清下载及解读

2026-02-26 07:03

苹果手机id怎么注销

2026-02-26 07:31

cs全能扫描全能王电脑版官网_扫描全能王网页版电脑端入口

2026-02-26 08:16

苹果手机怎么录屏 iOS屏幕录制操作步骤

2026-02-26 08:20

Linux Prometheus 部署与指标采集

2026-02-26 08:45

GitHub 文件链接怎么用？GitHub 文件分享与访问方法

2026-02-26 09:32

腾讯会议视频怎么导出

2026-02-26 10:41

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

248

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

906

2024.03.01

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

385

2025.06.09

golang结构体方法

本专题整合了golang结构体相关内容，请阅读专题下面的文章了解更多。

200

2025.07.04

Golang 实际项目案例：从需求到上线

《Golang 实际项目案例：从需求到上线》以真实业务场景为主线，完整覆盖需求分析、架构设计、模块拆分、编码实现、性能优化与部署上线全过程，强调工程规范与实践决策，帮助开发者打通从技术实现到系统交付的关键路径，提升独立完成 Go 项目的综合能力。

2026.02.26

Golang Web 开发路线：构建高效后端服务

《Golang Web 开发路线：构建高效后端服务》围绕 Go 在后端领域的工程实践，系统讲解 Web 框架选型、路由设计、中间件机制、数据库访问与接口规范，结合高并发与可维护性思维，逐步构建稳定、高性能、易扩展的后端服务体系，帮助开发者形成完整的 Go Web 架构能力。

2026.02.26

Golang 并发编程专题：掌握多核时代的核心技能

《Golang 并发编程专题：掌握多核时代的核心技能》系统讲解 Go 在并发领域的设计哲学与实践方法，深入剖析 goroutine、channel、调度模型与并发安全机制，结合真实场景与性能思维，帮助开发者构建高吞吐、低延迟、可扩展的并发程序，全面提升多核时代的工程能力。

2026.02.26

batoto漫画官网入口与网页版访问指南

本专题系统整理batoto漫画官方网站最新可用入口，涵盖最新官网地址、网页版登录页面及防走失访问方式说明，帮助用户快速找到batoto漫画官方平台，稳定在线阅读各类漫画内容。

353

2026.02.25

Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法

本专题系统整理Steam官网最新可用入口，涵盖网页版登录地址、新用户注册流程、账号登录方法及官方游戏商店访问说明，帮助新手玩家快速进入Steam平台，完成注册登录并管理个人游戏库。

2026.02.25

热门下载

网站特效

网站源码

网站素材

前端模板