可用 removeAll 和 retainAll 提取增删元素:新增为 new ArrayList(listB).removeAll(listA),删除为 new ArrayList(listA).removeAll(listB);需注意保序、避副作用、处理重复元素及类型可比性。

用 removeAll 和 retainAll 快速提取增删元素
Java 原生 List 没有内置「差集」方法,但靠 removeAll 和 retainAll 组合就能拆出新增和删除项。关键不是“能不能”,而是“怎么保顺序、避副作用”。
常见错误:直接对原始 List 调用 removeAll,结果原集合被改了;或者没考虑重复元素,把多次出现的同一值当成单次变化。
- 先用
new ArrayList(listB)创建副本再操作,别动原始数据 - 新增元素 =
listB有但listA没有的 →new ArrayList(listB).removeAll(listA) - 删除元素 =
listA有但listB没有的 →new ArrayList(listA).removeAll(listB) - 如果元素可重复(比如
["a", "a", "b"]→["a", "b"]),这组操作会丢失频次信息,得换方案
重复元素多时,用 Map<T, Integer> 统计频次再比
当列表含重复项且你关心“多了几个”“少了几个”,removeAll 就失效了——它只管存在性,不管数量。这时候得退一步,用频次映射来算净变化。
典型场景:配置项列表同步、数据库批量变更日志、缓存预热校验。
立即学习“Java免费学习笔记(深入)”;
- 遍历
listA,用Map记每个元素出现次数 - 遍历
listB,对每个元素做map.merge(item, 1, Integer::sum)或手动减 - 最终 map 中值 > 0 的是新增(在 B 多出的数量),值
- 注意:
Integer作 key 时没问题,但自定义对象必须正确重写equals和hashCode,否则统计全乱
Stream + Collectors.groupingBy 写法更函数式但别滥用
有人倾向用 Stream 一行流式写出差异,确实可读性高,但要注意实际开销和空指针风险。
错误现象:NullPointerException 出现在 groupingBy 后接 getOrDefault 时,因为 key 为 null 不被允许;或 stream().distinct() 提前去重,又绕回丢了频次的问题。
- 频次统计必须用
Collectors.groupingBy(Function.identity(), Collectors.counting()) - 别对
listA和listB分别流式处理后直接collect(Collectors.toSet())再取差——又回到无频次的老问题 - 如果列表很大(>10 万),
Stream并行化不一定更快,反而因分段合并引入额外对象创建,实测有时比传统 for 慢 20%
第三方库如 guava 的 Sets.difference 不适用于 List
看到 Sets.difference 别急着抄——它只接受 Set,传 List 会自动转成 Set,瞬间丢顺序、去重复、还可能抛 UnsupportedOperationException(如果 list 是 Collections.unmodifiableList)。
真要用 Guava,得先明确需求:你要的是集合语义(不重不序)还是列表语义(有序可重)。大多数业务场景要后者。
- 硬要用 Guava 处理列表差异,得自己封装:先转
Multiset(对应频次),再用Multisets.difference -
Multiset的elementSet()返回的是去重后的视图,想看完整变化还得遍历entrySet() - 加 Guava 只为一个差集操作,有点重,除非项目里 already 在大量用它
最易忽略的一点:两个 List 元素类型是否真正可比。比如都是 String 没问题,但若混了 "" 和 null,或用了不同编码的 byte[] 包装类,equals 一错,整个差异结果就不可信。动手前先确认 listA.get(0).equals(listB.get(0)) 是否符合预期。










