在Java中HashSet是如何保证元素唯一的_Java哈希机制解析

P粉602998670

发布时间：2026-01-21 13:05:02

160人浏览过

来源于php中文网

原创

HashSet唯一性依赖equals()与hashCode()协同校验：若equals()为true则hashCode()必须相同，否则可能跳过equals比较导致重复；自定义类须同时重写二者，且加入后勿修改参与哈希计算的字段。

在java中hashset是如何保证元素唯一的_java哈希机制解析

HashSet 的唯一性靠的是 `equals()` + `hashCode()` 两层校验

不是只看哈希值，也不是只比内容。Java 要求：如果两个对象 equals() 返回 true，它们的 hashCode() 必须相同；反过来不强制，但若不同，HashSet 会直接认为它们不在同一个桶里，根本不会调用 equals() 去比较。

所以唯一性失效的常见原因只有一个：重写了 equals() 却没重写 hashCode()。

自定义类加入 HashSet 前，必须同时重写 equals(Object) 和 hashCode()
IDE（如 IntelliJ）生成的 hashCode() 默认基于所有参与 equals 判断的字段，别手动删掉某字段的哈希计算
字段值在对象加入 HashSet 后被修改，且该字段参与了 hashCode() 计算 → 后续 contains() 或 remove() 可能失败

`HashSet` 底层是 `HashMap`，元素存在 key 位置，value 固定为 `Presentation` 静态对象

翻 JDK 源码能看到：HashSet 的 add(E) 实际调用的是内部 HashMap 的 put(e, PRESENT)。这意味着：

HashSet 的性能、扩容逻辑、线程不安全性，完全继承自 HashMap
初始容量默认是 16，负载因子 0.75 → 实际能存约 12 个元素才触发扩容
哈希冲突时，JDK 8+ 会将链表转为红黑树（当桶中节点 ≥ 8 且 table.length ≥ 64），前提是 key 类型实现了 Comparable

常见误判场景：浮点数、时间、数据库实体做 `HashSet` 元素时容易重复

不是哈希机制出错，而是对象语义和 equals() 实现不匹配：

立即学习“Java免费学习笔记（深入）”；

PathFinder

AI驱动的销售漏斗分析工具

下载

Double.NaN 的 equals() 返回 true，但 NaN == NaN 是 false；而 Double.hashCode() 对所有 NaN 返回同一固定值（0x7ff8000000000000L），所以多个 NaN 在 HashSet 中仍视为一个
java.util.Date 的 equals() 比毫秒值，但若用 new Date() 创建两个“看起来一样”的时间（比如都格式化为 "2024-01-01"），实际毫秒数可能差几毫秒 → equals() 为 false，就会被当成不同元素
JPA 实体若未重写 equals()/hashCode()，默认用内存地址比较，即使主键相同也会被当作不同对象加入 HashSet

验证是否真唯一：别只看 `size()`，要查 `contains()` 行为

有时候你以为加进去了两个相同对象，其实是 add() 返回 false，但你没检查返回值：

HashSet<String> set = new HashSet<>();
boolean r1 = set.add("hello");
boolean r2 = set.add("hello"); // r2 == false
System.out.println(set.size()); // 输出 1
System.out.println(r1 + ", " + r2); // true, false

更隐蔽的问题是：自定义类的 hashCode() 返回常量（比如永远返回 1），会导致所有元素挤进同一个桶，退化成链表遍历，add() 仍能保证唯一，但性能暴跌 —— 这时候 size() 是对的，但响应时间暴露问题。

哈希机制本身很稳，真正出问题的地方，永远在你怎么定义“相同”。

如何在Java中使用Selenium进行自动化测试或爬虫_WebDriver驱动浏览器模拟点击与输入

如何在IDEA中配置Java的SonarLint_代码静态检查工具安装

Java中的CyclicBarrier怎么用_循环栅栏同步多线程到达屏障点的应用场景

如何在Java中使用HashMap_键值对存储、哈希冲突与链表转红黑树原理

Java的ParNew收集器有什么特点_配合CMS使用的多线程新生代GC

相关标签:

java ai Object 常量 date double 继承 Length 线程对象 table ide 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：在Java中模板方法模式如何应用_JavaTemplatePattern示例说明下一篇：Java内存泄漏与垃圾回收的核心问题

作者最新文章

mysql如何使用BETWEEN范围查询_mysql数值与日期区间筛选

2026-03-13 09:52

mysql如何配置日志目录_mysql自定义日志路径设置

2026-03-13 09:53

Java中的方法内联(Method Inlining)是什么_减少方法调用开销原理

2026-03-13 09:53

如何理解Java中的协同进化_父类与子类功能的同步更新

2026-03-13 09:54

Python怎么画柱状图_多维分类数据对比与堆叠柱状图颜色映射实现

2026-03-13 09:55

如何在Java中获取Map的所有Value_values方法与集合流转换

2026-03-13 09:56

mysql如何处理升级后SQL_MODE变化_mysql严格模式兼容调整

2026-03-13 09:56

怎么在Spring Boot中使用RedisTemplate序列化对象_JSON序列化器的自定义设置

2026-03-13 09:56

深度掌握Navicat全局查找与替换字符技巧_高级开发者实战

2026-03-13 09:57

Python Django怎么跑定时任务_Celery分布式集成与异步任务队列Redis Broker配置

2026-03-13 09:57

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1567

2023.10.24

c++怎么把double转成int

本专题整合了 c++ double相关教程，阅读专题下面的文章了解更多详细内容。

334

2025.08.29

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

108

2025.10.23

length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度，以便在查询和处理字符串数据时进行操作和判断。需要注意的是length函数计算的是字符串的字符数，而不是字节数。对于多字节字符集，一个字符可能由多个字节组成。因此，length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法，大家可以阅读本专题下面的文章。

954

2023.09.19

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

765

2023.08.10

数据库三范式

数据库三范式是一种设计规范，用于规范化关系型数据库中的数据结构，它通过消除冗余数据、提高数据库性能和数据一致性，提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

386

2023.06.29

如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构，作用包括：1、释放存储空间；2、确保数据的安全性；3、提高数据库的整体性能，加速查询和操作的执行速度。尽管删除数据库具有一些好处，但在执行任何删除操作之前，务必谨慎操作，并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构，无法回滚。

2111

2023.08.14