Java的CopyOnWriteArraySet怎么保证去重_内部基于数组的遍历比较机制

P粉602998670

发布时间：2026-03-14 10:29:02

488人浏览过

来源于php中文网

原创

CopyOnWriteArraySet.add()通过遍历底层数组并用equals()逐个比较判断重复，不依赖hashCode；若未重写equals()，则按引用比较，导致逻辑重复元素无法去重。

java的copyonwritearrayset怎么保证去重_内部基于数组的遍历比较机制

CopyOnWriteArraySet.add() 怎么判断重复元素

它不靠哈希，也不维护红黑树，而是每次 add() 时遍历底层数组，用 equals() 逐个比较。只要已有元素和待添加元素 equals() 返回 true，就跳过插入。

这意味着：去重行为完全取决于你元素类型的 equals()（和 hashCode() 无关，因为没哈希表）；如果没重写 equals()，默认用 Object.equals()，也就是引用比较——两个新 new String("a") 会被视为不同元素。

常见错误现象：CopyOnWriteArraySet 里出现“看起来一样”的对象，比如多个 new User("Alice")
必须确保元素类正确重写了 equals()（且最好连带 hashCode() 一起重写，虽然这里不用，但避免后续误用）
性能影响明显：集合越大，每次 add() 的时间越接近 O(n)，不适合高频写 + 大数据量场景

底层数组怎么做到“写时复制”又保持线程安全

每次修改（add()、remove()）都会新建一个数组副本，在副本上操作完再原子替换掉旧数组引用。读操作（contains()、迭代器）始终面对某个快照，不加锁也不阻塞。

关键点在于：写操作的“复制-修改-替换”三步是原子的，但中间没有锁；读操作看到的永远是某次写完成后的完整数组，不会读到半截状态。

立即学习“Java免费学习笔记（深入）”；

Otter.ai

一个自动的会议记录和笔记工具，会议内容生成和实时转录

下载

迭代器是弱一致性的：它基于构造时的数组快照，所以遍历时看不到之后的新增，也看不到自己正在遍历的元素被其他线程删掉（不会抛 ConcurrentModificationException）
不能用于需要强实时一致性的场景，比如“立刻看到最新成员列表”的管理后台
内存开销比普通 HashSet 高：每次写都多一份数组内存，尤其元素大或写频繁时要注意 GC 压力

为什么不用 equals() 就会失效？看一个典型误用

假设你往 CopyOnWriteArraySet 里加了几个未重写 equals() 的 POJO：

class Point {
    int x, y;
    Point(int x, int y) { this.x = x; this.y = y; }
}
// ...
Set<Point> set = new CopyOnWriteArraySet<>();
set.add(new Point(1, 2));
set.add(new Point(1, 2)); // 这个会被插入！因为 Object.equals() 比较的是引用

结果集合大小是 2，而不是预期的 1。

修复方式只有：在 Point 中重写 equals() 和 hashCode()
注意 IDE 自动生成的 equals() 要包含所有业务相关字段，别漏掉
如果元素类型是第三方类（如 LocalDateTime），确认它已正确定义 equals()——好在 JDK 类基本都做了

和 CopyOnWriteArrayList 的去重逻辑有关系吗

没有。两者底层都是数组 + 写时复制，但 CopyOnWriteArrayList 根本不去重，add() 总是追加；而 CopyOnWriteArraySet 是在 add() 前先调用 contains() 判断是否已存在——而 contains() 正是那个遍历数组 + equals() 的逻辑。

换句话说：CopyOnWriteArraySet 是“套壳”实现，内部持有一个 CopyOnWriteArrayList，所有去重逻辑都在自己的 add() 方法里手动遍历检查。

所以别指望它支持 TreeSet 那样的排序去重，也没法传 Comparator
也不能通过反射去改底层 list 来绕过去重——它的 list 字段是私有的，且所有 public 方法都走自己的逻辑
如果真需要排序 + 线程安全 + 去重，得考虑 Collections.synchronizedSortedSet(new TreeSet(...))，但注意读写都需同步，性能模型完全不同

实际用的时候，最容易被忽略的是：你以为加进去的“相同对象”其实不是，只因 equals() 没生效；或者在大数据量下反复写入，发现 CPU 和内存悄悄涨上去了。

如何在Java中克隆包含集合的对象_深克隆工具类与JSON转换法

如何在Java中优雅地处理多个异常_多重捕获(Multi-catch)语法

如何在 Java 中递归获取对象及其所有嵌套子对象（树形结构扁平化）

Java中的双亲委派模型究竟是什么_防范核心类库被篡改的安全机制原理

Java Objects类常用方法说明_判空、哈希计算与相等性比较

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1051

2023.08.02

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

766

2023.08.10

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

177

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

227

2026.03.05

热门下载

网站特效

网站源码

网站素材

前端模板