Java中Set存对象需重写equals()和hashCode()方法,否则因默认引用比较导致去重失效;HashSet依赖二者协同判重,TreeSet则依赖Comparable或Comparator,且要求compareTo与equals语义一致。

Java中Set存对象时,核心在于正确重写equals()和hashCode()方法。否则即使两个对象逻辑上相等,Set也可能重复添加,导致去重失效。
Set判重依赖hashCode()和equals()协同工作
Set(如HashSet)底层基于HashMap实现,添加元素时:
- 先调用对象的hashCode()计算哈希值,确定存储桶位置
- 若桶内已有元素,则调用equals()逐个比较,确认是否真正重复
二者必须保持一致:如果equals()返回true,hashCode()必须返回相同值;反之不强制,但不同hashCode可加速判断(避免equals调用)。
不重写或重写不规范的典型问题
默认继承自Object的equals()只比较引用,hashCode()返回内存地址哈希——这会导致:
立即学习“Java免费学习笔记(深入)”;
- 两个字段完全相同的对象,被当作不同元素加入Set
- 修改对象后再次查询,可能查不到(因hashCode已变,查找去了错误的桶)
- 用作Map键时同样失效(如HashMap、ConcurrentHashMap)
正确重写建议与实践要点
使用IDE(如IntelliJ)自动生成是稳妥选择,注意以下细节:
- 只选用不可变字段或业务上决定“相等性”的字段(如User类用id或身份证号,而非name+age这种可能变更的组合)
- 确保字段不为null,或在equals中用Objects.equals(a, b)安全比较
- 若类有继承关系,子类重写需谨慎:要么声明final,要么在equals中检查getClass()一致性(避免跨类型误判)
- 重写后务必编写单元测试,覆盖相同内容、不同顺序、null值等边界场景
其他Set实现的注意事项
TreeSet不依赖hashCode/equals,而是依赖Comparable接口或Comparator。此时需确保比较逻辑与业务“相等”定义一致:
- 若compareTo返回0,应等价于equals返回true(否则TreeSet可能违反Set契约)
- 避免在比较器中使用易变字段,否则可能导致元素“消失”(无法被contains/find)










