使用sort+unique+erase组合可高效去重,先排序使重复元素相邻,再用unique将重复元素移至末尾并返回新逻辑尾部迭代器,最后通过erase删除冗余元素,实现全局去重。

在C++中,对vector数组进行去重是一个常见需求。最常用且高效的方法是结合std::sort和std::unique函数。需要注意的是,std::unique并不会真正删除元素,而是将重复元素移到容器末尾,因此需要配合erase方法才能实现真正的去重。
unique函数的基本用法
std::unique定义在头文件中,用于去除**连续重复**的元素。它会遍历区间,将相邻的重复元素“压缩”,只保留第一个,并返回指向新逻辑结尾的迭代器。
基本语法如下:
std::unique(vec.begin(), vec.end());但使用前必须先排序,否则只能去除连续重复项,无法实现全局去重。
立即学习“C++免费学习笔记(深入)”;
vector去重的标准做法
完整的去重流程包含三步:排序、去重、擦除。代码示例如下:
#include#include
using namespace std;
vector
// 1. 排序
std::sort(vec.begin(), vec.end());
// 2. 去重(移动重复元素到末尾)
auto it = std::unique(vec.begin(), vec.end());
// 3. 删除冗余元素
vec.erase(it, vec.end());
最终vec中将只包含{1, 2, 3, 5, 8},无重复元素。
自定义去重算法实现
如果不使用STL函数,也可以手动实现去重逻辑。例如使用额外set记录已出现元素:
vectorunordered_set
for (int x : vec) {
if (seen.find(x) == seen.end()) {
result.push_back(x);
seen.insert(x);
}
}
这种方法保持原始顺序,但时间复杂度为O(n),空间开销较大。若允许排序,则推荐使用sort + unique + erase组合,效率更高。
注意事项
unique仅对连续重复元素有效,因此排序是前提。另外,对于自定义类型,需重载==操作符或提供比较函数。
如果希望保留原顺序又避免set开销,可考虑使用双指针原地去重(适用于有序数据)。
基本上就这些。标准做法简洁高效,适合大多数场景。理解其原理有助于灵活应对不同需求。不复杂但容易忽略细节。










