retainAll本质是原地保留交集,直接修改调用方集合;需浅拷贝保原集合、确保equals/hashCode正确实现;参数为null抛NPE;性能优化关键在于将参数转HashSet以使contains达O(1)。

retainAll 方法的本质是“原地保留交集”
retainAll 不是返回新集合,而是直接修改调用方集合,只留下它和参数集合都包含的元素。这意味着:如果想保留原集合不变,必须先 new ArrayList(original) 或调用 stream().toList()(Java 16+)做浅拷贝,再对副本调用 retainAll。
调用前必须确保元素能正确比较
交集结果依赖 equals() 和 hashCode() 的实现。常见踩坑点:
- 自定义对象未重写
equals和hashCode→ 交集为空或行为不可预测 - 使用
HashSet但元素是可变对象(如未设final字段)→ 后续修改字段导致哈希值变化,retainAll可能漏匹配 -
ArrayList和LinkedList调用retainAll性能差异大:前者底层用contains遍历,时间复杂度 O(m×n);后者同理,但实际更慢;推荐把参数集合转为HashSet再传入
参数集合为 null 会抛出 NullPointerException
这是运行时异常,不是编译错误,容易遗漏检查。安全写法:
if (otherCollection != null) {
list.retainAll(otherCollection);
}
另外注意:retainAll 返回 boolean,仅表示集合是否被修改(即是否有元素被删),不反映交集大小。别用它来判断“有没有交集”,而应检查调用后集合是否为空。
立即学习“Java免费学习笔记(深入)”;
与 stream.filter + contains 的性能对比
在 Java 8+ 中,有人倾向用流式写法取交集:
Listintersection = list1.stream() .filter(list2::contains) .collect(Collectors.toList());
但要注意:list2::contains 若是 ArrayList,每次调用都是 O(n),整体 O(m×n);而 retainAll 在内部也会遍历并调用 contains,二者算法本质一致。真正提升性能的方式是:把 list2 包装成 HashSet:
Setset2 = new HashSet<>(list2); list1.retainAll(set2); // 此时 contains 变为 O(1),整体接近 O(m)
这个优化点最容易被忽略,尤其当 list2 较大时,性能差距可达百倍。










