1、所有sort算法介绍
所有的sort算法的参数都需要输入一个范围,[begin,end)。这里使用的迭代器(iterator)都需是随机迭代器(RadomAccessIterator), 也就是说可以随机访问的迭代器,如:it+n什么的。(partition 和stable_partition 除外)
如果需要自己定义比较函数,可以把定义好的仿函数(functor)作为参数传入。每种算法都支持传入比较函数。以下是所有STL sort算法函数的名字列表:
函数名 功能描述
sort 对给定区间所有元素进行排序
stable_sort 对给定区间所有元素进行稳定排序
partial_sort 对给定区间所有元素部分排序
partial_sort_copy 对给定区间复制并排序
nth_element 找出给定区间的某个位置对应的元素
is_sorted 判断一个区间是否已经排好序
partition 使得符合某个条件的元素放在前面
stable_partition 相对稳定的使得符合某个条件的元素放在前面
其中nth_element 是最不易理解的,实际上,这个函数是用来找出第几个。例如:找出包含7个元素的数组中排在中间那个数的值,此时,我可能不关心前面,也不关心后面,我只关心排在第四位的元素值是多少。
2、sort中的比较函数
当需要按照某种特定方式进行排序时,需要给sort指定比较函数,否则程序会自动提供一个默认比较函数(仿函数)。
STL中提供的仿函数列表:
名称 功能描述
equal_to 相等
not_equal_to 不相等
less 小于
greater 大于
less_equal 小于等于
greater_equal 大于等于
需要注意的是,这些函数不是都能适用于你的sort算法,如何选择,决定于你的应用。另外,不能直接写入仿函数的名字,而是要写其重载的()函数:
less<int>()
greater<int>()
当容器元素是一些标准类型(int,float,char)或者string时,可以直接使用这些函数模板。但如果是自己定义的类型或者需要按照其他方式排序,可以有两种方法来达到效果:一种是自己写比较函数。另一种是重载类型的’<’操作赋。
例子如下:
#include <iostream>
#include <algorithm>
using namespace std;
bool cmp(int x,int y)
{
return x>y?true:false;
}
int main()
{
int arr[5] = {3,2,5,8,4};
for(int i=0;i<5;i++)
{
cout<<arr[i]<<" ";
}
cout<<endl;
//sort(arr,arr+5); //(1)默认从小到大排序
//sort(arr,arr+5,cmp);//(2)用自己定义的cmp函数排序
//sort(arr,arr+5,less<int>());//(3)用STL提供的仿函数。注意用法!
sort(arr,arr+5,greater<int>());//(4)用STL提供的仿函数。注意用法!
for(int i=0;i<5;i++)
{
cout<<arr[i]<<" ";
}
cout<<endl;
return 0;
}
3、sort算法稳定性
你发现有sort和stable_sort,还有 partition 和stable_partition, 感到奇怪吧。其中的区别是,带有stable的函数可保证相等元素的原本相对次序在排序后保持不变。或许你会问,既然相等,你还管他相对位置呢,也分不清楚谁是谁了?这里需要弄清楚一个问题,这里的相等,是指你提供的函数表示两个元素相等,并不一定是一模一样的元素。
例如,如果你写一个比较函数:
bool less_len(const string &str1, const string &str2)
{
return str1.length() < str2.length();
}
此时,”apple” 和 “winter” 就是相等的,如果在”apple” 出现在”winter”前面,用带stable的函数排序后,他们的次序一定不变,如果你使用的是不带”stable”的函数排序,那么排序完后,”Winter”有可能在”apple”的前面。
4、各种排序函数
4.1 全排序: sort,stable_sort
全排序即把所给定范围所有的元素按照大小关系顺序排列。用于全排序的函数有:sort和stable_sort。
template <class RandomAccessIterator>
void sort(RandomAccessIterator first, RandomAccessIterator last);
template <class RandomAccessIterator, class StrictWeakOrdering>
void sort(RandomAccessIterator first, RandomAccessIterator last,
StrictWeakOrdering comp);
template <class RandomAccessIterator>
void stable_sort(RandomAccessIterator first, RandomAccessIterator last);
template <class RandomAccessIterator, class StrictWeakOrdering>
void stable_sort(RandomAccessIterator first, RandomAccessIterator last,
StrictWeakOrdering comp);
在第1,3种形式中,sort和stable_sort都没有指定比较函数,系统会默认使用operator<
对区间[first,last)内的所有元素进行排序。第2, 4种形式,你可以随意指定比较函数,应用更为灵活一些。
sort采用的是成熟的”快速排序算法”(目前大部分STL版本已经不是采用简单的快速排序,而是结合内插排序算法)。可以保证很好的平均性能、复杂度为n*log(n),由于单纯的快速排序在理论上有最差的情况,性能很低,其算法复杂度为n*n,但目前大部分的STL版本都已经在这方面做了优化,因此你可以放心使用。
stable_sort采用的是”归并排序”,分派足够内存是,其算法复杂度为n*log(n), 否则其复杂度为n*log(n)*log(n),其优点是会保持相等元素之间的相对位置在排序前后保持一致。
4.2 局部排序
局部排序其实是为了减少不必要的操作而提供的排序方式。其函数原型为:partial_sort和partial_sort_copy。
template <class RandomAccessIterator>
void partial_sort(RandomAccessIterator first,
RandomAccessIterator middle,
RandomAccessIterator last);
template <class RandomAccessIterator, class StrictWeakOrdering>
void partial_sort(RandomAccessIterator first,
RandomAccessIterator middle,
RandomAccessIterator last,
StrictWeakOrdering comp);
template <class InputIterator, class RandomAccessIterator>
RandomAccessIterator partial_sort_copy(InputIterator first, InputIterator last,
RandomAccessIterator result_first,
RandomAccessIterator result_last);
template <class InputIterator, class RandomAccessIterator,
class StrictWeakOrdering>
RandomAccessIterator partial_sort_copy(InputIterator first, InputIterator last,
RandomAccessIterator result_first,
RandomAccessIterator result_last, Compare comp);
理解了sort 和stable_sort后,再来理解partial_sort 就比较容易了。先看看其用途: 班上有10个学生,我想知道分数最低的5名是哪些人。如果没有partial_sort,你就需要用sort把所有人排好序,然后再取前5个。现在你只需要对分数最低5名排序:
partial_sort(vect.begin(), vect.begin()+5, vect.end(),less<student>());
这样的好处知道了吗?当数据量小的时候可能看不出优势,如果是100万学生,我想找分数最少的5个人……
partial_sort采用的堆排序(heapsort),它在任何情况下的复杂度都是n*log(n). 如果你希望用partial_sort来实现全排序,你只要让middle=last就可以了。
partial_sort_copy其实是copy和partial_sort的组合。被排序(被复制)的数量是[first, last)和[result_first, result_last)中区间较小的那个。如果[result_first, result_last)区间大于[first, last)区间,那么partial_sort相当于copy和sort的组合。
4.3 nth_element 指定元素排序
nth_element一个容易看懂但解释比较麻烦的排序。用例子说会更方便:
班上有10个学生,我想知道分数排在倒数第4名的学生。
如果要满足上述需求,可以用sort排好序,然后取第4位(因为是由小到大排), 更聪明的朋友会用partial_sort, 只排前4位,然后得到第4位。其实这是你还是浪费,因为前两位你根本没有必要排序,此时,你就需要nth_element:
template <class RandomAccessIterator>
void nth_element(RandomAccessIterator first, RandomAccessIterator nth,
RandomAccessIterator last);
template <class RandomAccessIterator, class StrictWeakOrdering>
void nth_element(RandomAccessIterator first, RandomAccessIterator nth,
RandomAccessIterator last, StrictWeakOrdering comp);
对于上述实例需求:
nth_element(vect.begin(), vect.begin()+3, vect.end(),less<student>());
为什么是begin()+3而不是+4? begin()是第一个,begin()+1是第二个,… begin()+3当然就是第四个了。
另外,partition 和stable_partition,好像这两个函数并不是用来排序的,’分类’算法,会更加贴切一些。partition就是把一个区间中的元素按照某个条件分成两类。如果使用的是stable_partition, 元素之间的相对次序是没有变.