去重函数unique，sort，erase

2024年6月9日 108次阅读

std::unique

一.总述

　　unique函数属于STL中比较常用函数，它的功能是元素去重。即”删除”序列中所有相邻的重复元素(只保留一个)。此处的删除，并不

是真的删除，而是指重复元素的位置被不重复的元素给占领了。由于它”删除”的是相邻的重复元素，所以在使用unique函数之前，一般都

会将目标序列进行排序。

功能：对有序的容器重新排列，将第一次出现的元素从前往后排，其他重复出现的元素依次排在后面

二.函数原型

unique函数的函数原型如下：1.只有两个参数，且参数类型都是迭代器：

iterator unique(iterator it_1,iterator it_2);

这种类型的unique函数是我们最常用的形式。其中这两个参数表示对容器中[it_1，it_2)范围的元素进行去重(注：区间是前闭后开，即不包含it_2所指的元素),返回值是一个迭代器，它指向的是去重后容器中不重复序列的最后一个元素的下一个元素。

有序的容器：

unique处理过的容器：

unique	unique	unique	unique	unique	unique	迭代器指向的地址
1	2	3	4	5	6	1	3	4	4

三、去重函数`unique`

头文件：#include <algorithm>

unique的作用就是"去除"数组中重复的元素，unique去重的过程是将重复的元素移到容器的后面去，实际上这种说法并不正确，应该是把不重复的元素移到前面来：

#include <iostream>
#include <algorithm>

using namespace std;

int main()
{
    int a[10] = { 0, 7, 7, 6, 1, 1, 5, 5, 8, 9 };

    int n = unique(a, a + 10) - a;

    cout << n << endl;  //7，得到不重复元素的个数；

    for (int i = 0; i < 10; i++)
        cout << a[i] << " ";  //0 7 6 1 5 8 9 5 8 9

    return 0;
}

可以看见最后三个元素是：5 8 9，而重复的数字是1 5 7，所以网上这种说法：“unique去重的过程是将重复的元素移到容器的后面去”是不对的。
上面的n返回的是7，它就是：最后一个不重复数字的下标。
所以，把上面的for循环改成：

for (int i = 0; i < n; i++)
    cout << a[i] << " ";  //0 7 6 1 5 8 9

让i < n就是只输出前面不重复的数字，这样就实现的去重的效果。

四、去重函数`unique`与排序函数`sort`结合

如果先去重再排序那么结果就是：去重毫无作用。因为去重再排序排序时会把重复的数字又放在了一起，所以要先排序再去重。这点应该好理解，这里就提一下。

先排序再去重代码如下：

#include <iostream>
#include <algorithm>  //sort(), unique()
#include <functional>  //less<int>()

using namespace std;

int main()
{
    int i;
    int a[10] = { 0, 7, 7, 6, 1, 1, 5, 5, 8, 9 };

    sort( a, a + 10, less<int>() );  //排序

    int n = unique(a, a + 10) - a;  //去重

    for ( i = 0; i < n; i++)  //注意i < n
        cout << a[i] << " ";  //0 1 5 6 7 8 9
}

于是就得到了想要的结果：先把数字排序，再去掉重复数字。

五，以上便是去重应用于数组的情况：接下来看一下字符串的情况：

uniqe()函数是去掉重复的字符。是指两个字符连续出现就只留下一个，其余的就删除。例如:

string s(“hello,world”);

string::iterator iterEnd=unique(s.begin(),s.end()); //返回出现重复元素的迭代器位置

这代码执行后，s的值为helo,worldd. 只消除连续出现的同样的字符。重点是不连续的不消除。

unique函数通常和erase函数一起使用，来达到删除重复元素的目的。(注：此处的删除是真正的删除，即从容器中去除重复的元素，容器

的长度也发生了变换；而单纯的使用unique函数的话，容器的长度并没有发生变化，只是元素的位置发生了变化)

还有一个就是unqiue()函数删除重复的字符后，字符串长度不变，所以如果字符串删除字符后，后面按照之前的值填上。所以就是helo,worldd，而不是helo,world；

所以就会有一个函数erase()函数存在的必要性了。它可以删除字符。

s.erase(iterEnd,s.end()); //删除掉重复元素；

执行后s的值就是我们想要的helo,world.

如果想要只留下一个字符l，只能先排序！！！！让他们挨在一块。

sort()函数是排序字符串字符。即如果是akjsc,排序后为acjks.

所以一般用unique函数的时候都会用到erase(). sort()用到也也比较多。

六，总结：

#include <iostream>
#include <algorithm>  //sort(), unique()
#include <functional>  //less<int>()
#include<string>
using namespace std;

int main()
{
	/////////////////字符串的去重排序
	string str = "sjscncmkzmxkz";

	sort(str.begin(), str.end());        //先对字符串排序；

	string::iterator itend = unique(str.begin(), str.end());  //返回出现重复元素的首地址；

	cout << str << endl;

	str.erase(itend, str.end());    //删除重复元素；

	cout << str << endl;

	////////////数组的去重排序；
	int a[10] = { 0, 7, 7, 6, 1, 1, 5, 5, 8, 9 };

	sort(a, a + 10, less<int>());  //排序

	int n = unique(a, a + 10) - a;        //去重
	int n1 = distance(a, unique(a, a + n));   //获得不重复元素的个数；

	for (int i = 0; i < n1; i++)  //注意i < n
		cout << a[i] << " ";  //0 1 5 6 7 8 9
}