set通过红黑树实现自动去重,插入重复元素时无效并返回失败标志,例如insert(5)两次只保留一个;自定义类型需重载<运算符定义比较规则,否则无法正确去重;查找元素可用find()或count(),时间复杂度O(log n),前者返回迭代器后者返回0或1,常用于判断存在性。

在C++中,set容器天然具备去重功能,这是由其底层实现决定的。set基于红黑树(一种自平衡二叉搜索树)实现,插入元素时会自动排序并拒绝重复值。因此,只要使用set存储数据,就能在插入过程中自动完成去重,无需额外操作。
set如何实现自动去重
当你向set中插入一个已存在的元素时,插入操作不会生效,且返回一个表示是否插入成功的标志。具体行为如下:
- 插入成功:元素不存在于set中,被添加进去。
- 插入失败:元素已存在,set保持不变。
#include <iostream>
#include <set>
using namespace std;
int main() {
set<int> nums;
nums.insert(5);
nums.insert(3);
nums.insert(5); // 重复元素,不会被插入
nums.insert(1);
for (int n : nums) {
cout << n << " ";
}
// 输出:1 3 5
return 0;
}
自定义类型去重需重载比较规则
如果set中存放的是自定义结构体或类,默认无法判断是否重复,必须提供比较方式。通常通过重载<运算符或传入比较函数对象来实现。
struct Person {
string name;
int age;
bool operator<(const Person& p) const {
return age < p.age; // 按年龄去重(相同年龄视为重复)
}
};
此时插入相同年龄的Person对象,只会保留一个。
立即学习“C++免费学习笔记(深入)”;
查找元素是否存在
set提供了高效的查找方法,时间复杂度为O(log n)。常用方式有两种:
-
find():返回指向元素的迭代器,若未找到则返回end() -
count():对set而言,结果只能是0或1,可用于判断是否存在
set<string> words = {"hello", "world", "cpp"};
if (words.find("hello") != words.end()) {
cout << "找到了!\n";
}
if (words.count("world")) {
cout << "world存在\n";
}
基本上就这些。只要理解set的有序性和唯一性特性,就能自然掌握其去重机制和查找用法。不复杂但容易忽略细节,比如自定义类型的比较逻辑必须正确定义,否则可能导致去重失效或程序异常。










