Java中Set保证元素唯一性依赖底层实现:HashSet用hashCode()与equals()协同校验;TreeSet通过compareTo()/Comparator比较结果为0判重;LinkedHashSet复用HashSet机制并维护插入顺序;自定义类必须重写equals()和hashCode()。

Java中Set保证元素唯一,核心在于其底层实现类(如HashSet、TreeSet、LinkedHashSet)对equals()和hashCode()方法的协同使用,或通过比较器逻辑实现自然/定制排序约束。
HashSet靠hashCode+equals双重校验
HashSet基于HashMap实现,将元素作为key存入。添加元素时:
- 先计算元素的
hashCode(),定位到哈希桶(数组索引) - 若桶中无元素,直接插入;若有,则遍历该桶中的链表或红黑树节点
- 对每个已存在元素调用
equals(),只要有一个返回true,就认定重复,不插入
⚠️ 注意:若只重写equals()不重写hashCode(),会导致相同逻辑对象被散列到不同桶中,equals()根本不会被调用,从而破坏唯一性。
TreeSet靠compareTo或Comparator做有序去重
TreeSet底层是红黑树,不依赖hashCode(),而是通过比较确定元素位置:
立即学习“Java免费学习笔记(深入)”;
- 元素需实现
Comparable接口(如String、Integer已实现),或构造时传入Comparator - 插入时调用
compareTo()(或compare()),返回0即视为重复,拒绝插入 - 即使两个对象
equals()为false,只要比较结果为0,TreeSet也认为它们相等
? 示例:自定义Person类按name排序,若两个Person name相同但age不同,TreeSet会把它们当作重复元素。
LinkedHashSet继承HashSet机制,仅维护插入顺序
LinkedHashSet是HashSet的子类,额外用双向链表记录插入顺序。它完全复用HashSet的去重逻辑——仍依赖hashCode()和equals(),只是迭代时按插入顺序返回元素。
因此,它的唯一性保障与HashSet一致,不引入新规则,也不影响判重行为。
自定义类使用Set前必须重写equals和hashCode
这是最易出错的一环。JDK默认的Object.equals()比较的是引用地址,Object.hashCode()返回的是内存地址哈希值,导致逻辑上相同的对象被当成不同元素。
- IDE(如IntelliJ)可一键生成基于关键字段的
equals()和hashCode() - 确保参与
hashCode()计算的字段,也必须用于equals()判断(反之亦然) - 若字段可能为null,用
Objects.equals(a, b)和Objects.hash(...)更安全
不复杂但容易忽略。










