0

0

在Java中HashMap的初始容量有什么影响_Java性能参数解析

P粉602998670

P粉602998670

发布时间:2026-01-03 18:09:56

|

777人浏览过

|

来源于php中文网

原创

初始容量应设为大于等于预期元素数除以0.75后向上取整到最近的2的幂;否则频繁resize导致O(n)开销、GC压力及并发性能问题。

在java中hashmap的初始容量有什么影响_java性能参数解析

初始容量太小会触发频繁 resize,拖慢插入性能

HashMap 底层是数组 + 链表/红黑树,initialCapacity 决定了初始桶(bucket)数量。默认是 16,负载因子 0.75f,意味着存到第 12 个元素就会触发第一次扩容——整个哈希表重建、所有已有 key 重新 hash、再散列到新数组。这个过程不是 O(1),而是 O(n),且伴随大量内存分配和 GC 压力。

  • 预期存 1000 个键值对却用 new HashMap():大概率经历 4–5 次 resize(16 → 32 → 64 → 128 → 256 → 512),每次都要复制全部已有元素
  • 高并发批量导入场景下,多个线程同时触发 resize,JDK 7 可能链表成环死循环;JDK 8 虽修复了成环,但竞争仍导致 CPU 尖刺和吞吐骤降
  • 监控中可观察到 sun.misc.Unsafe.copyMemoryHashMap.resize() 方法耗时突增,GC 日志出现密集的 Young GC

怎么算出“刚好够用”的初始容量?别直接除以 0.75

公式看似简单:initialCapacity = (int) Math.ceil(expectedSize / 0.75f),但 HashMap 构造函数内部会把它**向上取整到最近的 2 的幂**。比如你传 134,实际容量变成 256(因为 128 );传 <code>100,结果还是 128

所以更稳妥的做法是:先算理论值,再手动对齐 2 的幂,避免无谓浪费:

int expectedSize = 1000;
int capacity = (int) Math.ceil(expectedSize / 0.75f); // ≈ 1334
capacity = tableSizeFor(capacity); // JDK 内部方法逻辑:返回 ≥ capacity 的最小 2 的幂 → 2048
<p>Map<String, Object> map = new HashMap<>(capacity);</p><p><span>立即学习</span>“<a href="https://pan.quark.cn/s/c1c2c2ed740f" style="text-decoration: underline !important; color: blue; font-weight: bolder;" rel="nofollow" target="_blank">Java免费学习笔记(深入)</a></a>”;</p><div class="aritcle_card flexRow">
                                                        <div class="artcardd flexRow">
                                                                <a class="aritcle_card_img" href="/ai/2481" title="Tago AI"><img
                                                                                src="https://img.php.cn/upload/ai_manual/001/246/273/176784238677602.png" alt="Tago AI"  onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a>
                                                                <div class="aritcle_card_info flexColumn">
                                                                        <a href="/ai/2481" title="Tago AI">Tago AI</a>
                                                                        <p>AI生成带货视频,专为电商卖货而生</p>
                                                                </div>
                                                                <a href="/ai/2481" title="Tago AI" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a>
                                                        </div>
                                                </div>

如果你不想手写 tableSizeFor,直接用 JDK 提供的静态辅助也行(Java 8+):

import java.util.HashMap;
<p>// 等效于 HashMap 内部逻辑
static int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= 1 << 30) ? 1 << 30 : n + 1;
}</p>

初始容量设太大,真会浪费内存吗?看场景

是的,但浪费程度取决于数据规模和 JVM 设置。一个空的 HashMap 容量为 2048,底层数组就是 Node[2048],每个 Node 引用占 4 字节(32 位 JVM)或 8 字节(64 位 + 普通对象指针压缩关闭),仅数组本身就要 ~16KB(8×2048)。如果只存几十个元素,纯属冗余。

  • 缓存类场景(如用户 session 映射):通常有明确上限(如 1w 用户),建议按需计算,不盲目堆大容量
  • 临时聚合容器(如 stream.collect(Collectors.toMap(...))):若上游 size 可预估,显式传 capacity;否则依赖框架默认行为更安全
  • 注意:容量过大不会影响读性能(get 仍是 O(1) 平均),但会略微拉长迭代(如 keySet().forEach)时间,因要遍历更多 null 桶

JDK 7 和 JDK 8 在容量初始化上有什么关键差异?

核心逻辑一致:都向上取整到 2 的幂,都用 threshold = capacity × loadFactor 控制扩容时机。但底层实现细节影响实操判断:

  • JDK 7:resize() 是单线程全量拷贝,扩容期间 map 不可用;多线程 put 可能引发死循环(链表反转成环)
  • JDK 8:resize() 支持并发协助迁移(helpTransfer),扩容过程 map 仍可读写;链表转红黑树阈值为 8,缓解高冲突下的退化问题
  • 但二者对「初始容量设置不当」的后果描述完全一致:都是性能瓶颈主因之一,阿里 Java 开发手册、Google Guava 文档、Spring 源码注释都明确建议「预估 size 后显式指定」

真正容易被忽略的是:即使用了 JDK 8,如果在构造时传了非 2 的幂数字(如 new HashMap(100)),它仍会默默变成 128,而开发者可能误以为“我只申请了 100 个桶”。查 capacity 最可靠的方式是反射调用 capacity() 方法,而不是依赖传入值。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
spring框架介绍
spring框架介绍

本专题整合了spring框架相关内容,想了解更多详细内容,请阅读专题下面的文章。

160

2025.08.06

Java Spring Security 与认证授权
Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用,涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造(CSRF)防护、会话管理与安全漏洞防范。通过实际项目案例,帮助学习者掌握如何 使用 Spring Security 实现高安全性认证与授权机制,提升 Web 应用的安全性与用户数据保护。

88

2026.01.26

guava包作用
guava包作用

guava是一个java库,增强了java标准库,提供更有效率和易于使用的集合、实用程序、缓存和并发工具。想了解更多guava的相关内容,可以阅读本专题下面的文章。

271

2024.05.29

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1089

2024.03.01

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

267

2025.12.04

session失效的原因
session失效的原因

session失效的原因有会话超时、会话数量限制、会话完整性检查、服务器重启、浏览器或设备问题等等。详细介绍:1、会话超时:服务器为Session设置了一个默认的超时时间,当用户在一段时间内没有与服务器交互时,Session将自动失效;2、会话数量限制:服务器为每个用户的Session数量设置了一个限制,当用户创建的Session数量超过这个限制时,最新的会覆盖最早的等等。

336

2023.10.17

session失效解决方法
session失效解决方法

session失效通常是由于 session 的生存时间过期或者服务器关闭导致的。其解决办法:1、延长session的生存时间;2、使用持久化存储;3、使用cookie;4、异步更新session;5、使用会话管理中间件。

776

2023.10.18

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.4万人学习

C# 教程
C# 教程

共94课时 | 11.2万人学习

Java 教程
Java 教程

共578课时 | 81.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号