0

0

Java面试——HashMap底层源码分析

星降

星降

发布时间:2026-01-26 10:01:12

|

257人浏览过

|

来源于php中文网

原创

java面试——hashmap底层源码分析

HashMap 在 JDK 8 中已不是简单的数组+链表结构,而是「数组 + 链表/红黑树」的混合实现,且扩容、哈希计算、树化等逻辑都围绕性能与并发安全的权衡展开。直接读 HashMap 源码容易被细节绕晕,关键要抓住三个动作:put() 怎么定位桶、resize() 怎么搬数据、treeifyBin() 什么条件下转红黑树。

哈希值怎么算?为什么(h = key.hashCode()) ^ (h >>> 16)

Java 的 hashCode() 返回的是 32 位 int,但 HashMap 的数组长度总是 2 的幂(如 16、32、64),取索引用的是 tab[(n - 1) & hash],即低位掩码。如果只用原始 hashCode(),高位变化对索引几乎没影响,容易导致哈希冲突集中——尤其当 key 是连续整数或字符串前缀相同时。

所以 JDK 8 引入了这行扰动:

int h = key.hashCode();
h ^= (h >>> 16);
它把高 16 位异或到低 16 位,让高位信息也参与索引计算,显著改善低位分布。这不是加密,是低成本的哈希扩散。

  • 不要自己重写 hashCode() 却忽略这一点:若返回值集中在低位(比如只用 id % 100),再好的扰动也救不了
  • StringhashCode() 本身已较均匀,但仍有优化空间;而 IntegerhashCode() 就是自身值,必须靠这步扰动

put() 执行时,怎么决定是链表插入还是树化?

不是一上来就树化,也不是达到某个固定 size 就转。真正触发条件有两层检查:

  • 当前桶(bin)的链表长度 ≥ TREEIFY_THRESHOLD(默认 8)
  • 整个 HashMapsizeMIN_TREEIFY_CAPACITY(默认 64)

第二条常被忽略:如果总容量还不到 64,说明数组太小,优先选择 resize() 扩容(翻倍),而不是树化。因为扩容后链表自然分散,性价比更高。只有在大容量下仍出现长链,才值得树化。

立即学习Java免费学习笔记(深入)”;

树化入口是 treeifyBin(),它先检查是否满足上述两个条件,再调用 treeify() 把 Node 链表转为 TreeNode 红黑树节点,并重排结构。

扩容时 resize() 怎么处理红黑树和链表?

扩容不是简单复制,而是重新哈希再分配。由于新容量是旧容量的 2 倍,每个元素的新索引只有两种可能:原位置 lolo + oldCap(因为 (n*2 - 1) & hash 相比 (n - 1) & hash 多了一位判断位)。

对链表:遍历一次,按新索引拆成两个子链(loHead / hiHead),再分别挂到新数组对应位置。

对红黑树:同样拆成两个子树,但会进一步判断——如果拆分后任一子树节点数 ≤ UNTREEIFY_THRESHOLD(默认 6),就退化回链表;否则保留红黑树结构。

  • 注意:红黑树节点迁移不涉及旋转或颜色重排,只是“拆分+降级/保留”,所以开销可控
  • 如果频繁扩容又频繁树化,说明初始容量设得太小,或 key 的 hashCode() 实现极差

为什么 get() 查找快?但多线程下不能直接用?

get() 快,是因为:① 定位桶是 O(1) 位运算;② 链表平均长度被控制在 1 以内(负载因子 0.75);③ 树化后查找是 O(log n)。但所有这些都建立在「结构稳定」前提下。

多线程 put 可能导致死循环(JDK 7 的典型问题)、数据覆盖、甚至 get() 返回 null(明明 put 过)。JDK 8 虽修复了死循环,但依然不保证线程安全:比如两个线程同时触发 resize(),可能一个扩容完,另一个把旧节点插到新数组里,造成数据丢失

  • 需要并发场景,请用 ConcurrentHashMap,它通过分段锁(JDK 7)或 CAS + synchronized(JDK 8+)保障安全
  • HashMap 的迭代器是 fail-fast 的,一旦检测到结构性修改(如其他线程 put),立刻抛 ConcurrentModificationException

真正难啃的不是代码行数,而是每处设计背后的取舍:比如为何树化阈值是 8 而不是 7 或 9?Oracle 的解释是基于泊松分布,链表长度 ≥ 8 的概率已低于千万分之一——这意味着绝大多数桶根本不会树化。这种统计直觉,比背源码更重要。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

866

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

745

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

741

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

420

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

447

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

431

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16947

2023.08.03

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

70

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
SQL 教程
SQL 教程

共61课时 | 3.6万人学习

Java 教程
Java 教程

共578课时 | 51.2万人学习

oracle知识库
oracle知识库

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号