std::set 自动去重且按序存储,插入重复元素时返回 pair 的 second 为 false;unordered_set 基于哈希去重但不保证顺序;二者均需正确实现比较或哈希逻辑。

std::set 本身就会自动去重,不需要额外操作。 它的底层是红黑树,插入时直接拒绝重复元素——这不是“功能”,而是它的定义行为。
为什么 insert() 不报错但也不增加元素?
当你对 std::set 调用 insert() 插入已存在的值,函数返回一个 std::pair,其中 second 为 false,first 指向原元素。这常被误认为“失败”,其实是设计使然。
- 不抛异常、不崩溃,是安全且可预测的行为
- 想确认是否新增成功,必须检查返回值的
second字段 - 若只关心最终集合状态,完全不用管返回值
set 和 unordered_set 去重逻辑有啥区别?
两者都去重,但机制不同:std::set 依赖 operator(或自定义比较器)判断等价;std::unordered_set 依赖 == 和哈希值。这意味着:
- 若自定义类型只重载了
operator==却没提供operator 或哈希函数,set编译不过,unordered_set也编译不过 - 若两个对象
a 和b 都为false,set认为它们等价(即去重) -
unordered_set中若hash(a) == hash(b)但a != b,它们仍会被视为不同元素(除非哈希碰撞严重)
想保留插入顺序又去重,能用 set 吗?
不能。std::set 按键排序,天然打乱原始插入顺序。常见替代方案:
立即学习“C++免费学习笔记(深入)”;
- 用
std::vector+ 手动查重(小数据量够用) - 用
std::unordered_set记录已见元素,同时往std::vector插入(推荐) - 用
std::map存首次出现位置,再按 value 排序(仅当需要索引信息时)
真正容易被忽略的是:去重不是目的,而是服务于后续查找、遍历或内存控制。选 set 还是 unordered_set,关键看你要不要有序,以及能否稳定提供哈希和相等判断——而不是“哪个更快去重”。











