7种常用排序算法的实现示例

其实写排序算法的博客已经有很多了,其中不乏某些细心的博主去仔细讲解各种排序的过程,甚至有使用gif图来表现排序过程的博客,还有对已有排序算法进行改进的,我表示很佩服这些博主,谢谢你们。

这里附上一些我参考过的博客:
7种排序算法(系列博客) – 静默虚空
常用排序算法总结(一) – SteveWang
[直观学习排序算法] 视觉直观感受若干常用排序算法 – todayx
白话经典算法系列 – MoreWindows
常用排序算法稳定性、时间复杂度分析 – jiuyueguang
八大排序算法

然后附上我重新写的排序算法

这里的排序算法示例都用函数模板来写

  • 简单排序算法:
    • 选择排序
    • 冒泡排序
    • 插入排序
  • 复杂排序算法:
    • 快速排序
    • 归并排序
    • 堆排序
    • shell排序

选择排序

  • 原理:遍历元素集合,每次遍历找到剩下的集合中最大\最小的元素放入已排序集合中,直到找完为止。
  • 时间复杂度:O(n^2)
  • 空间复杂度:O(1)
  • 算法稳定性:不稳定排序。使用序列6 9 6 3 2来举例,第一个6与3交换,导致第一个6排到了第二个6后面,所以选择排序是不稳定的排序算法。
  • 算法示例
template <class T>
void sort_array_select(T* dataArray, int dataSize)
{
    //遍历数据集合
    for (int i = 0; i < dataSize; i++)
    {
        //记录最小索引
        int minIndex = i;
        //遍历剩余数据集合
        for (int j = i; j < dataSize; j++)
        {
            //查找更小的值
            if (dataArray[minIndex] > dataArray[j])
            {   
                //保存更小值的索引
                minIndex = j;
            }
        }
        //判断当前索引处是否是最小值
        if (minIndex != i)
        {
            //将找到的最小值与当前索引处的值交换
            T temp = dataArray[i];
            dataArray[i] = dataArray[minIndex];
            dataArray[minIndex] = temp;
        }
    }
}

冒泡排序

  • 原理:遍历元素集合,依次比较相邻元素,将相邻元素中较大\较小者移向一端,每次遍历找到剩余数据集合中较大\较小者,直到全部排序完成。
  • 时间复杂度
    • 最佳(已经顺序排好的集合):O(n)
    • 最差(已经逆序拍好的集合):O(n^2)
  • 空间复杂度:O(1)
  • 算法稳定性:稳定的排序。因为比较与交换均发生在相邻的元素之间,对于两个相等的元素不会进行交换,所以是稳定的排序。
  • 算法示例
template <class T>
void sort_array_bubble(T* dataArray, int dataSize)
{
    //遍历集合
    for (int i = 0; i < dataSize; i++)
    {
        //遍历剩余元素集合
        for (int j = 0; j < dataSize - i - 1; j++)
        {
            //比较相邻元素大小
            if(dataArray[j] > dataArray[j + 1])
            {
                //将较大元素后移
                T temp = dataArray[j];
                dataArray[j] = dataArray[j + 1];
                dataArray[j + 1] = temp;
            }
        }
    }
}

插入排序

  • 原理:将数据集合中第一个数据视为已排序集合,依次获取未排序集合中的元素,将获取到的元素插入到已排序集合中的正确位置,直到全部排序完成。
  • 时间复杂度
    • 最佳(已排序集合):O(n)
    • 最差(逆序已排序集合):O(n^2)
  • 空间复杂度:O(1)
  • 算法稳定性:稳定的排序算法。因为比较的过程发生在相邻元素之间,对于相等的元素,算法中不会改变他们的相对位置,所以是稳定的排序算法。
  • 算法示例
template <class T>
void sort_array_insert(T* dataArray, int dataSize)
{
    //遍历数据集合(从1开始,0号元素已排序)
    for (int i = 1; i < dataSize; i++)
    {
        //获取未排序集合中第一个元素
        T temp = dataArray[i];
        int j = i;
        //依次与已排序集合中元素比较,找到正确位置
        while(j > 0 && temp < dataArray[j - 1])
        {
            dataArray[j] = dataArray[j - 1];
            j--;
        }
        //取到的元素放入已排序列表中正确位置
        dataArray[j] = temp;
    }
}

快速排序

  • 原理:应用了分治的思想和以递归取代循环的思想。取一个元素作为flag,并将数据集合分为大于(等于)flag和小于(等于)flag两个子集,然后对子集进行同样的操作,直到子集元素个数为1或0,则所有元素完成排序。
  • 时间复杂度
    • 最差(每次取到的flag都在边界):O(n^2)
    • 最佳(每次取到的flag都在中间):O(nlog2n)
  • 空间复杂度:O(1)
  • 算法稳定性:不稳定的排序。因为比较和替换不是发生在相邻元素之间,而是从某个方向开始找到满足条件的值,然后进行替换,这样可能导致两个相同元素的相对位置变化,所以是不稳定的排序方式。
  • 算法示例
template <class T>
void sort_array_quick(T* dataArray, int left, int right)
{
    //递归退出条件
    if (left >= right)
    {
        return;
    }
    //取flag,并控制左右范围
    T flag = dataArray[left];
    int sub_left = left;
    int sub_right = right;
    //根据flag来整理数据集合
    while(sub_left < sub_right)
    {
        //在右侧找小的值换到左侧
        //此时dataArray[sub_left]中的值是冗余的
        while (sub_left < sub_right && dataArray[sub_right] >= flag)
        {
            sub_right--;
        }
        if (sub_left < sub_right)
        {
            dataArray[sub_left] = dataArray[sub_right];
        }
        //在左侧找大的值换到右侧
        //此时dataArray[sub_right]中的值是冗余的
        while (sub_left < sub_right && dataArray[sub_left] <= flag)
        {
            sub_left++;
        }
        if (sub_left < sub_right)
        {
            dataArray[sub_right] = dataArray[sub_left];
        }
    }
    //上面的步骤进行完成后,dataArray[sub_left]中的值是冗余的,这里将flag放回
    dataArray[sub_left] = flag;
    //以flag为中心,左侧的值小于等于flag,右侧的值大于等于flag
    //分别对左侧的值的集合和右侧的值的集合进行递归再次排序划分
    sort_array_quick(dataArray, left, sub_left - 1);
    sort_array_quick(dataArray, sub_left + 1, right);
}

归并排序

  • 原理:应用了分治的思想和以递归取代循环的思想。将待排序数据集合划分为两个子集,对子集分别进行排序,排序完成后将两个有序子集中的元素。
  • 时间复杂度:O(nlog2n)
  • 空间复杂度:O(n)
  • 算法稳定性:稳定的排序算法。在元素集合被拆分为n个子集合之后,合并集合时,是通过对已排序集合中值最相近的两个元素进行比较并存储的,所以不会造成值相同的元素相对位置变化。
  • 算法示例
//按顺序合并集合
template <class T>
void array_merge(T* dataArray, int left, int mid, int right, T* sortedArray)
{
    int i = left;
    int j = mid + 1;
    int count = 0;
    
    //将dataArray中left->mid和mid+1->right部分的元素按顺序放入sortedArray中
    while (i <= mid && j <= right)
    {
        if (dataArray[i] < dataArray[j])
        {
            sortedArray[count++] = dataArray[i++];
        }
        else
        {
            sortedArray[count++] = dataArray[j++];
        }
    }
    
    //剩余元素直接放入sortedArray
    while (i <= mid)
    {
        sortedArray[count++] = dataArray[i++];
    }
    while (j <= right)
    {
        sortedArray[count++] = dataArray[j++];
    }
    
    //排序好的元素放回dataArray
    for (int i = 0; i < count; i++)
    {
        dataArray[left + i] = sortedArray[i];
    }
}

//拆分集合
template <class T>
void sort_array_merge(T* dataArray, int left, int right, T* sortedArray)
{
    //递归停止条件
    if (left >= right)
    {
        return;
    }
    
    //集合分为两个子集
    int mid = (left + right) / 2;
    //继续拆分
    sort_array_merge(dataArray, left, mid, sortedArray);
    sort_array_merge(dataArray, mid + 1, right, sortedArray);
    
    //按顺序合并集合
    array_merge(dataArray, left, mid, right, sortedArray);
}

堆排序

  • 原理:应用了二叉堆的特点,即父节点的值总是大于(小于)子节点的值。这样每一次将待排序集合调整为堆时,便能得到待排序集合中的一个最值。堆排序分为两步:第一步是建立堆,将无序的集合调整为满足堆的条件的集合;第二步是依次取得最值,此时只破坏了堆顶,以堆顶为根进行一次调整,形成一个新的堆,然后循环第二步。
  • 时间复杂度:O(nlog2n)
  • 空间复杂度:O(1)
  • 算法稳定性:不稳定的排序算法。因为比较与交换不是发生在相邻元素之间,两个相同的元素相邻时会被分配到不同的子树中,在调整子树时可能导致值相同的元素的相对位置发生变化。
  • 算法示例
//调整为最大堆,保证父节点值大于子节点
template <class T>
void heap_update(T* dataArray, int rootIndex, int arraySize)
{
    //递归终止条件,rootIndex处应为非叶子节点
    if (rootIndex >= arraySize / 2)
    {
        return;
    }
    
    //计算左右子节点的index
    int left_child = rootIndex * 2 + 1;
    int right_child = rootIndex * 2 + 2;
    
    //查找父、左子、右子节点中最大值
    int largest = rootIndex;
    
    if (left_child < arraySize && dataArray[left_child] > dataArray[largest])
    {
        largest = left_child;
    }
    if (right_child < arraySize && dataArray[right_child] > dataArray[largest])
    {
        largest = right_child;
    }
    //将最大值替换到父节点位置
    if (largest != rootIndex)
    {
        T temp = dataArray[rootIndex];
        dataArray[rootIndex] = dataArray[largest];
        dataArray[largest] = temp;
        
        //largest所处位置元素相对其子节点来说,又是一个被破坏的堆顶,所以继续调整
        heap_update(dataArray, largest, arraySize);
    }
    
    //对左右子节点分别进行调整
    //heap_update(dataArray, left_child, arraySize);
    //heap_update(dataArray, right_child, arraySize);
}

//建立堆。即逆序对所有非叶子节点进行一次堆调整。
template <class T>
void heap_build(T* dataArray, int arraySize)
{
    for (int i = arraySize / 2 - 1; i >= 0; i--)
    {
        heap_update(dataArray, i, arraySize);
    }
}

//堆排序
template <class T>
void sort_array_heap(T* dataArray, int arraySize)
{
    //建立堆
    heap_build(dataArray, arraySize);
    
    //循环获得堆顶元素并调整堆
    int count = arraySize;
    while (count > 1)
    {
        //将堆顶元素与待排序数组末尾元素交换
        T temp = dataArray[0];
        dataArray[0] = dataArray[count - 1];
        dataArray[count - 1] = temp;
        
        //调整堆,只破坏了堆顶,这里以堆顶为root,对待排序的部分进行堆调整
        count--;
        heap_update(dataArray, 0, count);
    }
}

shell排序

  • 原理:对直接插入法排序的改良。因为直接插入法排序在元素基本有序的情况下效率最高,所以将待排序元素依次划分为n组(n为size/2,size/4,… 首先保持元素数量最少,组内排序完成后再重新划分为元素更多的组,保持直接插入法的高效),然后对组内进行直接插入法排序。
  • 时间复杂度
    • 最差:O(n^2)
    • 最佳(有序排列的集合):O(nlog2n)
  • 空间复杂度:O(1)
  • 算法示例
template <class T>
void sort_array_shell(T* dataArray, int arraySize)
{
    //使用step划分组
    for (int step = arraySize / 2; step > 0; step /= 2)
    {
        //逐个元素进行组内插入排序
        for (int i = step; i < arraySize; i++)
        {
            //组内直接插入排序
            T temp = dataArray[i];
            int k = i - step;
            //在组内依次向前查找正确位置
            while (k >= 0 && dataArray[k] > temp)
            {
                dataArray[k + step] = dataArray[k];
                k -= step;
            }
            //元素插入到正确位置
            dataArray[k + step] = temp;
        }
    }
}

上面所有的算法示例在排序一个int类型的数组时,是正常可用的。但是很多都有优化的空间(比如看到一篇博客中对插入法排序写了多种实现方法),而且使用临时变量来交换两个值的过程也值得思考。

总结:以上排序算法只是提供一种思想,在我们面临遍历大量数据、从大量数据中查找某个值等问题的时候,其中的某些点是可以借鉴的。其中的分段、构建二叉树的思想是很值得学习的,以此告诫自己思维不要太刻板。

    原文作者:qufangliu
    原文地址: https://www.jianshu.com/p/4d95d7e3aada#comments
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞