std::unique不会真正删除元素,仅将重复项移至末尾并返回新逻辑尾部迭代器;必须配合erase才能实际去重,且要求数据已排序以处理相邻重复项。

为什么直接用 std::unique 对 vector 去重没效果?
std::unique 不会真正删除元素,它只是把重复元素“挤到后面”,并返回一个指向新逻辑尾部的迭代器。原 vector 大小不变,后续元素仍存在——如果不配合 erase,看起来就像什么都没发生。
常见错误写法:std::unique(v.begin(), v.end()); → 这行执行完,v.size() 没变,重复项还在内存里。
正确姿势必须两步走:
- 先调用
std::unique获取去重后的新末尾位置 - 再用
erase真实删掉尾部冗余元素
std::unique 要求数据已排序吗?
是的,std::unique 只移除「相邻重复项」。如果 vector 是乱序的,比如 {1, 3, 1, 2, 3},调用后仍是 {1, 3, 1, 2, 3}(因为没有相邻相等的)。
所以实际使用前通常要先排序:
立即学习“C++免费学习笔记(深入)”;
std::sort(v.begin(), v.end()); auto new_end = std::unique(v.begin(), v.end()); v.erase(new_end, v.end());
注意:排序会改变原始顺序;若需保持首次出现顺序(如去重但不打乱输入顺序),就不能用 std::unique,得手写循环或用 std::unordered_set 辅助判断。
用 unordered_set 实现稳定去重(保序)
当你要保留元素第一次出现的位置,又不想排序时,std::unique 就不适用了。这时用哈希集合边遍历边记录已见元素更直接:
std::unordered_setseen; auto new_end = std::remove_if(v.begin(), v.end(), [&seen](int x) { if (seen.find(x) != seen.end()) return true; seen.insert(x); return false; }); v.erase(new_end, v.end());
要点:
- 适用于任意可哈希类型(
int、string等),自定义类型需提供hash和== - 时间复杂度平均 O(n),空间 O(n);
std::unique + sort是 O(n log n) - 注意
std::remove_if是“逻辑删除”,仍需配erase
去重后还想保留原 vector 不被修改?
有时你只是想获取去重结果,不希望动原容器。别直接对原 vector 操作,改用构造新容器:
- 排序 + unique 方式:
std::vectorunique_v(v); std::sort(unique_v.begin(), unique_v.end()); auto it = std::unique(unique_v.begin(), unique_v.end()); unique_v.erase(it, unique_v.end()); - 保序方式:
std::vectorunique_v; std::unordered_set seen; for (int x : v) { if (seen.insert(x).second) unique_v.push_back(x); }
注意 seen.insert(x).second 返回 true 表示本次插入成功(即之前未见过),这是比先查再插更高效的一次性写法。
最易忽略的一点:所有基于 std::unique 的方案都依赖「相邻重复」,哪怕你只漏掉一次 sort,结果就完全不对——而编译器不会报错,运行时也无异常,容易误以为逻辑正确。










