0

0

Java中的HashSet在添加元素时如何处理哈希碰撞_链表与树化流程

P粉602998670

P粉602998670

发布时间:2026-02-27 13:50:02

|

201人浏览过

|

来源于php中文网

原创

hashset添加元素触发树化的条件是:桶中链表长度≥8且数组长度≥64,否则仅扩容;树化发生在putval()末尾的treeifybin()调用处,且需满足table.length>=64。

java中的hashset在添加元素时如何处理哈希碰撞_链表与树化流程

HashSet添加元素时哈希冲突怎么触发树化

Java 8+ 的 HashSet 底层是 HashMap,真正处理碰撞的是其桶(bucket)里的 Node 结构。当同一个桶里链表长度 ≥ 8 当前数组长度 ≥ 64,才会转成红黑树;否则只扩容。

常见错误现象:手动往小容量 HashSet(比如 new HashSet(4))里塞 8 个同 hash 值对象,发现还是链表——不是不树化,是没满足数组长度 ≥ 64 这个硬条件。

  • 树化前提是 table.length >= 64,这个值在构造时不会预设,而是随 put 触发 resize 才增长
  • 同 hash 值的元素必须落到同一个桶,取决于 hash & (table.length - 1) 计算结果,不是单纯看 hashCode() 是否相等
  • 如果 key 类型没重写 equals()hashCode(),默认用 Object 实现,那几乎不可能出现哈希碰撞(除非是同一个对象)

为什么链表长度阈值是 8 而不是 7 或 9

这个数字来自泊松分布的概率推导:当哈希函数均匀、负载因子为 0.75 时,单个桶内元素数 ≥ 8 的概率已低于百万分之一。选 8 是在“避免过早树化开销”和“防止链表过长拖慢查找”之间权衡的结果。

实际影响很直接:如果你的自定义 key 的 hashCode() 写得差(比如永远返回 1),哪怕只放 10 个元素,也会让某个桶迅速堆积,此时查找时间从 O(1) 退化到 O(n),而树化能拉回 O(log n)。

立即学习Java免费学习笔记(深入)”;

PicWish
PicWish

推荐!专业的AI抠图修图,支持格式转化

下载
  • 树化后节点类型从 Node 变成 TreeNode,内存占用翻倍以上
  • 小数据量下树化反而更慢,所以 JDK 宁可先扩容两次(16→32→64)再考虑树化
  • 只要数组没扩容到 64,就算链表到了 100,也不会树化——这点容易被忽略

Treeify 的具体触发点在 putVal() 里的哪一行

关键逻辑在 HashMap.putVal() 方法末尾的 treeifyBin() 调用处。它不直接树化,而是先检查 tab.length (即 64),满足则触发 resize();不满足才调用 <code>treeify() 真正转树。

你可以用反射或调试器断点在 HashMap.java:789(JDK 8u291 行号)附近观察——但别在线上环境这么干。

  • treeifyBin() 是 package-private 方法,外部不可调用
  • 即使你手动调用 resize() 把数组撑到 64,也得再触发一次 put 才可能走树化路径
  • 如果当前桶里有 null 或非 Node 类型节点(比如正在扩容中的 ForwardingNode),树化会跳过

自定义类做 HashSet 元素时怎么避免意外碰撞

根本问题不在 HashSet,而在你的 hashCode() 实现是否合理。例如用 String 拼接字段但忘了 null 安全,或者用浮点数做 hash 源,都会导致本不该相等的对象被判定为相同桶位。

一个典型翻车场景:把 BigDecimal 当 key,却用 doubleValue() 生成 hash——精度丢失后多个不同值映射到同一 hash,链表就起来了。

  • 优先用 Objects.hash(field1, field2),它自动处理 null
  • 避免在 hashCode() 里调用可能抛异常或耗时的方法(如 DB 查询、IO)
  • 如果字段含浮点数,用 Double.doubleToLongBits() 而不是直接 (int)value
  • 重写 hashCode() 后必须同步重写 equals(),否则 HashSet 查找失效

树化不是兜底方案,是补救措施。真正要盯住的,是你自己写的 hashCode() 有没有让本该分散的数据挤进同一个桶。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

870

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

248

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

927

2024.03.01

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

870

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

592

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

294

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

210

2025.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

294

2025.08.29

Golang 并发编程模型与工程实践:从语言特性到系统性能
Golang 并发编程模型与工程实践:从语言特性到系统性能

本专题系统讲解 Golang 并发编程模型,从语言级特性出发,深入理解 goroutine、channel 与调度机制。结合工程实践,分析并发设计模式、性能瓶颈与资源控制策略,帮助将并发能力有效转化为稳定、可扩展的系统性能优势。

2

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3.9万人学习

C# 教程
C# 教程

共94课时 | 10.3万人学习

Java 教程
Java 教程

共578课时 | 73.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号