在Java中如何使用HashSet去除集合重复元素_HashSet操作指南

P粉602998670

发布时间：2025-10-29 19:56:01

181人浏览过

来源于php中文网

原创

HashSet基于哈希表实现，不允许重复元素、允许一个null值、不保证顺序且非线程安全，底层使用HashMap存储，add()添加重复元素时返回false；可通过将List转为HashSet实现去重，如List转Set后重复项被自动过滤；自定义对象需重写equals()和hashCode()方法才能正确去重；去重后可转回ArrayList；若需保持插入顺序可用LinkedHashSet，排序可用TreeSet；HashSet添加和查找平均时间复杂度O(1)，适合大数据量但消耗额外内存。

在java中如何使用hashset去除集合重复元素_hashset操作指南

在Java中，HashSet 是一种基于哈希表实现的集合类，它继承自 AbstractSet 并实现了 Set 接口。它的最大特点就是不允许重复元素，并且不保证元素的顺序。正因为这一特性，HashSet 常被用来去除集合中的重复元素。

HashSet 的基本特性

使用 HashSet 去重前，先了解它的几个关键点：

不允许存储重复元素：添加相同元素时，add() 方法返回 false，原集合不变。
允许一个 null 值：HashSet 可以包含一个 null 元素。
非线程安全：多线程环境下需手动同步或使用 Collections.synchronizedSet() 包装。
底层基于 HashMap：每个元素作为 key 存储，value 使用一个固定对象（如 PRESENT）。

如何用 HashSet 去除重复元素

将已有集合（如 ArrayList、数组等）转为 HashSet，重复项会自动被过滤。以下是常见操作示例：

1. 从 ArrayList 中去除重复元素

List<String> list = Arrays.asList("apple", "banana", "apple", "orange", "banana");
Set<String> set = new HashSet<>(list);
System.out.println(set); // 输出: [banana, orange, apple]（顺序可能不同）

2. 手动添加元素并去重

Set<Integer> numbers = new HashSet<>();
numbers.add(1);
numbers.add(2);
numbers.add(2); // 重复，不会添加
numbers.add(3);
System.out.println(numbers); // 输出: [1, 2, 3]

3. 去重后保留为 List

如果需要将去重后的结果转回 List：

立即学习“Java免费学习笔记（深入）”；

PaperFake

AI写论文

下载

List<String> uniqueList = new ArrayList<>(set);

自定义对象去重的注意事项

对于自定义类（如 Person），HashSet 判断重复依赖于 equals() 和 hashCode() 方法。必须正确重写这两个方法，否则即使内容相同也会被视为不同对象。

示例：Person 类的正确重写

public class Person {
    private String name;
    private int age;

    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (!(o instanceof Person)) return false;
        Person person = (Person) o;
        return age == person.age && Objects.equals(name, person.name);
    }

    @Override
    public int hashCode() {
        return Objects.hash(name, age);
    }
}

这样，当两个 Person 对象 name 和 age 相同时，HashSet 就能识别为重复并自动去除。

性能与适用场景

HashSet 的添加和查找操作平均时间复杂度为 O(1)，效率很高，适合大数据量去重。但注意：

不维护插入顺序 —— 如需保持顺序，可使用 LinkedHashSet。
若需排序，可用 TreeSet。
去重过程中会消耗额外内存，因底层是 HashMap 实现。

基本上就这些。HashSet 是 Java 中最简单高效的去重工具，只要注意重写 equals 和 hashCode 方法，就能在大多数场景下稳定使用。

如何在Java中实现两个独立创建的Wizard对象之间的对战逻辑

Java 中方法引用绑定功能接口时的默认方法覆盖规则详解

Java中方法引用绑定功能接口时的默认方法覆盖行为解析

Java 中方法引用绑定功能接口时的默认方法调用陷阱解析

Java 中方法引用绑定功能接口时的默认方法覆盖行为详解

相关标签:

java 大数据工具 apple NULL 继承接口线程多线程对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：从 XML 文件构建 JTree：动态加载树节点下一篇：Java ThreadPoolExecutor任务优雅停止策略：避免无限运行

作者最新文章

悟空浏览器怎么关闭启动时的加载动画闪屏_悟空浏览器秒开优化

2026-03-13 17:04

如何在Golang中通过反射创建并操作切片 Go语言reflect.MakeSlice实战

2026-03-13 17:05

如何避免PL/SQL中的SQL注入_绑定变量Bind Variables的最佳实践

2026-03-13 17:05

Safari浏览器如何关闭网页的安全证书警告_Safari浏览器继续访问

2026-03-13 17:06

宝塔面板下如何安装Node.js的特定版本镜像源？

2026-03-13 17:09

如何在Golang中实现优雅的请求超时控制 Go语言http.TimeoutHandler使用

2026-03-13 17:09

如何在Golang中利用Trace工具分析延迟 Go语言执行链路可视化追踪

2026-03-13 17:09

如何在Golang中利用SQLite进行本地存储 Go语言嵌入式数据库应用

2026-03-13 17:11

如何在Golang中利用Finalizer清理非内存资源 Go语言runtime.SetFinalizer使用

2026-03-13 17:11

如何为Oracle配置多监听器_不同端口的并发监听机制实现

2026-03-13 17:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1089

2024.03.01

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1954

2023.10.19