计数排序:
该算法于1954年由 Harold H. Seward 提出。
它是一个不需要比较的,类似于桶排序的线性时间排序算法。该算法是对已知数量范围的数组进行排序。其时间复杂度为O(n),适用于小范围集合的排序。计数排序是用来排序0到100之间的数字的最
好的算法。比如100万学生参加高考,我们想对这100万学生的数学成绩(假设分数为0到100)做个排序。
基本思想:
对于给定的输入序列中的每一个元素x,确定该序列中值小于x的元素的个数 。一旦有了这个信息,就可以将x直接存放到最终的输出序列的正确位置上。它创建一个长度为这个数据范围的数组C,C中每个元素记录要排序数组中对应记录的出现个数。
下面以示例来说明这个算法:
假设要排序的数组为 A = {1,0,3,1,0,1,1}这里最大值为3,最小值为0,那么我们创建一个数组C,长度为4。然后一趟扫描数组A,得到A中各个元素的总数,并保持到数组C的对应单元中。比如0 的出现次数为2次,则 C[0] = 2;1 的出现次数为4次,则C[1] = 4。由于C 是以A的元素为下标的,所以这样一做,A中的元素在C中自然就成为有序的了,这里我们可以知道 顺序为 0,1,3 (2 的计数为0)然后我们把这个在C中的记录按每个元素的计数展开到输出数组B中,排序就完成了。
也就是 B[0] 到 B[1] 为0 B[2] 到 B[5] 为1 这样依此类推。
这种排序算法,依靠一个辅助数组来实现,不基于比较,算法复杂度为 O(n) ,但由于要一个辅助数组C,所以空间复杂度要大一些,由于计算机的内存有限,所以这种算法不适合范围很大的数的排序。
上述为计数排序算法的经典解法,不过这个解法并不是最优的,因为空间复杂度还应该可以优化,我们完全可以不要那个输出的数组B,直接对C进行排序。
算法的步骤如下:
1.找出待排序的数组中最大和最小的元素
2.统计数组中每个值为i的元素出现的次数,存入数组C的第i项
3.对所有的计数累加(从C中的第一个元素开始,每一项和前一项相加)
4.反向填充目标数组:将每个元素i放在新数组的第C(i)项,每放一个 元素就将C(i)减去1
测试代码:
#include <stdio.h>
#include <stdlib.h>
void print_arry(int *arr,int n) //打印数组
{
int i;
for(i = 0; i<n; i++)
{
printf("%d ", arr[i]);
}
printf("\n");
}
void count_sort(int *arr, int *sorted_arr, int n)
{
int *count_arr = (int *)malloc(sizeof(int) * 100);
int i;
//初始化计数数组
for(i = 0; i<100; i++)
count_arr[i] = 0;
//统计i的次数
for(i = 0;i<n;i++)
count_arr[arr[i]]++;
//对所有的计数累加
for(i = 1; i<100; i++)
count_arr[i] += count_arr[i-1];
//逆向遍历源数组(保证稳定性),根据计数数组中对应的值填充到先的数组中
for(i = n; i>0; i--)
{
sorted_arr[count_arr[arr[i-1]]-1] = arr[i-1];
count_arr[arr[i-1]]--;
}
free(count_arr);
}
int main()
{
int n,i;
int *arr,*sorted_arr;
printf ("输入数组大小n:");
scanf ("%d", &n);
arr = (int *)malloc(sizeof(int) * n);
sorted_arr = (int *)malloc(sizeof(int) * n);
for (i = 0; i<n; i++)
{
arr[i] = rand() % 100;
}
printf ("随机生成数值为0~99的数组...\n");
print_arry(arr, n);
count_sort(arr, sorted_arr, n);
printf ("排序后的数组:");
print_arry(sorted_arr, n);
return 0;
}
示例结果:
输入数组大小n:5
随机生成数值为0~99的数组…
41 67 34 0 69
排序后的数组:0 34 41 67 69