推荐使用Stream + Collectors.toMap保留首次出现对象,原理是按字段作key、遇重复key保留第一个,配合LinkedHashMap维持顺序;也可重写equals/hashCode后用LinkedHashSet,或TreeSet实现排序去重,手动遍历则适合复杂条件。

Java中对List对象按指定字段去重,核心思路是利用Stream + Collectors.toMap 或自定义Comparator + TreeSet,也可以借助LinkedHashSet配合重写equals/hashCode。关键不在于“能不能去重”,而在于“是否保留原始顺序”“是否需要线程安全”“对象是否可修改”。下面给出几种常用、可靠、贴近实际场景的方案。
用Stream + toMap保留首次出现的对象(推荐)
这是最简洁、可读性强、且能保持原List顺序的方式。原理是把对象按去重字段作为key,value为对象本身,遇到重复key时保留第一个((a, b) -> a)。
ListuniqueList = list.stream() .collect(Collectors.toMap( User::getId, // 去重字段:id user -> user, // value就是当前对象 (a, b) -> a, // 冲突时保留第一个 LinkedHashMap::new // 保证插入顺序 )) .values() .stream() .collect(Collectors.toList());
- ✅ 保持原始顺序(靠
LinkedHashMap) - ✅ 空间换时间,性能较好(O(n))
- ⚠️ 注意:字段值不能为
null,否则toMap会抛NullPointerException;如需支持null,可先filter(Objects::nonNull)或改用其他方式
重写equals和hashCode后用LinkedHashSet
如果该对象在多个地方都需要按某字段判断相等(比如User按id唯一),建议直接在类中重写equals和hashCode,之后用LinkedHashSet自动去重:
// 在User类中
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
User user = (User) o;
return Objects.equals(id, user.id); // 只比较id
}
@Override
public int hashCode() {
return Objects.hash(id);
}
然后去重就一行:
立即学习“Java免费学习笔记(深入)”;
ListuniqueList = new ArrayList<>(new LinkedHashSet<>(list));
- ✅ 一次定义,处处可用;语义清晰
- ✅ 自动保持顺序(
LinkedHashSet) - ⚠️ 谨慎使用:若该类还有其他业务场景需按多个字段判等,这种单字段
equals可能引发逻辑错误
用TreeSet + 自定义Comparator(适合已排序或需二次处理)
当你要去重的同时还希望结果有序(比如按id升序),可以用TreeSet:
Setset = new TreeSet<>((u1, u2) -> Long.compare(u1.getId(), u2.getId())); set.addAll(list); List uniqueList = new ArrayList<>(set);
- ✅ 自动排序 + 去重一步到位
- ⚠️ 不保留原始顺序;且
TreeSet要求Comparator不能对相同字段返回0以外的结果,否则逻辑混乱 - ⚠️ 如果只是去重,不用排序,不建议用这个——比
LinkedHashSet慢(O(n log n))
手动遍历+Set记录已见字段(兼容老版本/复杂条件)
JDK 7或需要动态字段名(比如通过反射)、或字段组合去重(如 name + age 联合唯一)时,手动控制更灵活:
SetseenIds = new HashSet<>(); List uniqueList = new ArrayList<>(); for (User user : list) { if (seenIds.add(user.getId())) { // add返回true表示首次加入 uniqueList.add(user); } }
- ✅ 兼容所有JDK版本
- ✅ 易扩展:比如
seenIds.add(user.getName() + "-" + user.getAge())实现联合去重 - ✅ 零依赖、无副作用、易调试
基本上就这些。选哪种取决于你的具体约束:要不要保序、字段是否可能为空、是否已在类层面定义相等逻辑、是否需要排序。多数新项目推荐第一种(Stream + toMap),干净利落又可控。










