std::set自动去重并升序排列,因其底层为红黑树,插入时依据operator

set 自动去重和升序排列的原理
std::set 底层是红黑树(RB-tree),插入时自动按 operator 比较,重复元素直接忽略,且始终维持有序。这意味着你不用手动调用 <code>sort 或 unique,只要用 insert 或初始化列表塞进去,结果天然去重+升序。
注意:去重基于「等价」而非「相等」——两个元素 a 和 b 被视为重复,当且仅当 !(a 。所以自定义类型必须正确定义 <code>operator,不能只重载 <code>operator==。
- 内置类型(
int、string)默认支持,开箱即用 - 若想降序,用
std::set<int std::greater>></int> - 插入
vector所有元素:用迭代器区间构造,比循环insert更高效
从 vector 去重并排序的常用写法
最常见需求:把一个乱序、含重复的 vector<int></int> 变成有序无重集合。别先 sort + unique,那是为 vector 设计的老套路;对 set 来说,一步到位更自然。
std::vector<int> v = {3, 1, 4, 1, 5, 9, 2, 6, 5};
std::set<int> s(v.begin(), v.end()); // 直接构造,O(n log n)
// s 现在是 {1, 2, 3, 4, 5, 6, 9}
- 如果后续还要当数组用,再拷回
vector:std::vector<int>(s.begin(), s.end())</int> - 不要用
s.insert(v.begin(), v.end())—— 这是成员函数,但语义和构造一样;不过构造更简洁、意图更清晰 - 性能上,构造和批量
insert差不多,但比逐个push_back后再sort+unique少一次遍历
自定义类型必须提供严格弱序比较
比如有个结构体 Person,按 id 去重排序,但忘了定义 operator,编译会报错:「no match for ‘operator<p><span>立即学习</span>“<a href="https://pan.quark.cn/s/6e7abc4abb9f" style="text-decoration: underline !important; color: blue; font-weight: bolder;" rel="nofollow" target="_blank">C++免费学习笔记(深入)</a>”;</p>
<pre class="brush:php;toolbar:false;">struct Person {
int id;
std::string name;
};
// 必须加这个,否则 set<Person> 编译失败
bool operator<(const Person& a, const Person& b) {
return a.id < b.id; // 注意:不能用 != 或 == 判断是否重复
}
</pre>
<ul>
<li>比较函数必须满足严格弱序:反对称、传递、不可比关系可传递</li>
<li>如果想按多个字段排序(如先按 <code>id,id 相同时按 name),写成:return a.id != b.id ? a.id
lambda 定义比较器只能用于模板参数(如 set<person decltype></person>),不能用于非模板友元函数,容易混淆set 不支持随机访问,别误用下标
有人想取「排序后第 3 个元素」,写 s[2],编译直接失败——std::set 没有 operator[],也不支持 + 运算符随机跳转。
- 要访问第 k 个(0-indexed),得用
std::next(s.begin(), k),时间复杂度 O(k),不是 O(1) - 频繁按位置访问?说明数据结构选错了,考虑先转成
vector再索引 - 遍历时用范围
for最安全:for (const auto& x : s) { ... } - 删除某个值用
s.erase(value),不是s.erase(iterator),除非你已经有迭代器
set 做去重排序,核心就三点:确认类型可比较、用构造代替手写去重逻辑、别把它当数组用。最容易卡住的地方,其实是自定义类型的比较函数没写对,或者误以为 set 支持下标访问。











