Java中Set的唯一性依赖equals()和hashCode()的正确实现:HashSet用哈希表存储,通过hashCode()定位桶、equals()判重;TreeSet用排序比较;自定义类需同时重写二者并保持一致性,且推荐不可变设计。

Java 中的 Set 接口天然保证元素唯一性,但“唯一”依赖于 equals() 和 hashCode() 的正确实现——不是靠语言自动识别,而是靠你写的逻辑。
为什么 add() 不重复添加相同对象
HashSet(最常用实现)内部用 HashMap 存储,把元素作为 key。调用 add(e) 时,先算 e.hashCode() 定位桶位置,再遍历该桶内所有元素,逐个用 e.equals(existing) 判断是否已存在。
- 若未重写
equals()和hashCode(),默认使用Object版本——比较的是内存地址,两个内容相同的new Person("Alice")会被视为不同元素 - 若只重写
equals()不重写hashCode(),可能违反哈希契约:相等对象必须有相同哈希值,否则HashSet查不到已有元素,导致重复插入 -
TreeSet不依赖哈希,而是用compareTo()或Comparator排序判断“相同”,要求元素可比较且比较逻辑与equals()一致(否则行为不可预测)
自定义类必须重写 equals() 和 hashCode()
比如一个 Student 类,按学号 id 判重:
public class Student {
private String id;
private String name;
public Student(String id, String name) {
this.id = id;
this.name = name;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
return Objects.equals(id, student.id);
}
@Override
public int hashCode() {
return Objects.hash(id);
}
}
这样两个 new Student("S001", "Tom") 和 new Student("S001", "Jerry") 在 HashSet 中只会保留一个。
立即学习“Java免费学习笔记(深入)”;
注意 null 元素和不可变性
HashSet 允许存一个 null;TreeSet 默认不允许 null(会抛 NullPointerException),除非构造时传入支持 null 的 Comparator。
- 如果对象在加入
Set后修改了影响hashCode()或equals()的字段(如上面的id),它可能再也无法被contains()找到,或导致集合内部结构异常 - 推荐将用于
Set的类设计为不可变(final字段、不提供 setter),或至少确保关键判重字段不被修改
唯一性不是魔法,是契约。写错 hashCode() 或漏掉 equals(),Set 就会“失灵”——而且往往只在特定数据组合下才暴露,调试起来很隐蔽。










