十大经典排序算法python

2019年3月14日 163次阅读来源: 排序算法

十大经典排序算法

来源：https://github.com/wangguanfu/-Sorting-algorithm.git

排序算法是“数据结构与算法”中最基本的算法之一。

排序算法可以分为内部排序和外部排序，内部排序是数据记录在内存中进行排序，而外部排序是因排序的数据很大，一次不能容纳全部的排序记录，在排序过程中需要访问外存。常见的内部排序算法有：插入排序，希尔排序，选择排序，冒泡排序，归并排序，快速排序，堆排序，基数排序等用一张图概括：

《十大经典排序算法python》

关于时间复杂度：

平方阶（O（n2））排序各类简单排序：直接插入，直接选择和冒泡排序。

线性对数阶（O（nlog2n））排序快速排序，堆排序和归并排序。

O（n1 +§））排序，§是介于0和1之间的常数。希尔排序。

线性阶（O（n））排序基数排序，此外还有桶，箱排序。

关于稳定性：

稳定的排序算法：冒泡排序，插入排序，归并排序和基数排序。

不是稳定的排序算法：选择排序，快速排序，希尔排序，堆排序。

名词解释：

N：数据规模

K：“桶”的个数

就地：占用常数内存，不占用额外内存

出位：占用额外内存

稳定性：排序后2个相等键值的顺序和排序之前它们的顺序相同

冒泡排序

冒泡排序（冒泡排序）也是一种简单直观的排序算法。它重复地走访过要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。

作为最简单的排序算法之一，冒泡排序给我的感觉就像Abandon在单词书里出现的感觉一样，每次都在第一页第一位，所以最熟悉。冒泡排序还有一种优化算法，就是立一个flag，当在一趟序列遍历中元素没有发生交换，则证明该序列已经有序。但这种改进对于提升性能来说并没有什么太大作用。

算算步骤

比较相邻的元素。如果第一个比第二个大，就交换他们两个。

对每一对相邻元素作同样的工作，从开始第一对到结尾的最后一对。这步做完后，最后的元素会是最大的数。

针对所有的元素重复以上的步骤，除了最后一个。

持续每次对越来越少的元素重复上面的步骤，直到没有任何一对数字需要比较。

2.动图演示

《十大经典排序算法python》

3.什么时候最快

当输入的数据已经是正序时（都已经是正序了，我还要你冒泡排序有何用啊）。

4.什么时候最慢

当输入的数据是反序时（写一个用于循环反序输出数据不就行了，干嘛要用你冒泡排序呢，我是闲的吗）。

5. Python代码实现

defbubbleSort（ARR）：

foriinrange（1，len（arr））：

forjinrange（0，len（arr）-i）：

ifarr [j]> arr [j + 1]：

arr [j]，arr [j +1] = arr [j +1]，arr [j]

returnarr

选择排序

选择排序是一种简单直观的排序算法，无论什么数据进去都是O（n²）的时间复杂度。所以用到它的时候，数据规模越小越好。唯一的好处可能就是不占用额外的内存空间了吧。

算算步骤

首先在未排序序列中找到最小（大）元素，存放到排序序列的起始位置

再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾。

重复第二步，直到所有元素均排序完毕。

2.动图演示

《十大经典排序算法python》

3. Python代码实现

defselectionSort（ARR）：

foriinrange（len（arr）-1）：

＃记录最小数的索引

minIndex = i

forjinrange（i + 1，len（arr））：

ifarr [j] <arr [minIndex]：

minIndex = j

#i不是最小数时，将i和最小数进行交换

ifi！= minIndex：

arr [i]，arr [minIndex] = arr [minIndex]，arr [i]

returnarr

插入排序

插入排序的代码实现虽然没有冒泡排序和选择排序那么简单粗暴，但它的原理应该是最容易理解的了，因为只要打过扑克牌的人都应该能够秒懂。插入排序是一种最简单直观的排序算法，它的工作原理是通过构建有序序列，对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。

插入排序和冒泡排序一样，也有一种优化算法，叫做拆半插入。

算算步骤

将第一待排序序列第一个元素看做一个有序序列，把第二个元素到最后一个元素当成是未排序序列。

从头到尾依次扫描未排序序列，将扫描到的每个元素插入有序序列的适当位置。（如果待插入的元素与有序序列中的某个元素相等，则将待插入元素插入到相等元素的后面。）

《十大经典排序算法python》

3. Python代码实现

definsertionSort（ARR）：

foriinrange（LEN（ARR））：

preIndex = i-1

current = arr [i]

whilepreIndex> = 0andarr [preIndex]> current：

arr [preIndex + 1] = arr [preIndex]

preIndex- = 1

arr [preIndex + 1] =当前

returnarr

希尔排序

希尔排序，也称递减增量排序算法，是插入排序的一种更高效的改进版本。但希尔排序是非稳定排序算法。

希尔排序是基于插入排序的以下两点性质而提出改进方法的：

插入排序在对几乎已经排好序的数据操作时，效率高，即可以达到线性排序的效率;

但插入排序一般来说是低效的，因为插入排序每次只能将数据移动一位;

希尔排序的基本思想是：先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序，待整个序列中的记录“基本有序”时，再对全体记录进行依次直接插入排序。

算算步骤

选择一个增量序列t1，t2，……，tk，其中ti> tj，tk = 1;

按增量序列个数k，对序列进行k趟排序;

每趟排序，根据对应的增量ti，将待排序列分割成若干长度为m的子序列，分别对各子表进行直接插入排序。仅增量因子为1时，整个序列作为一个表来处理，表长度即为整个序列的长度。

2. Python代码实现

defshellSort（ARR）：

importmath

间隙= 1

while（gap <len（arr）/ 3）：

gap = gap * 3 + 1

whilegap> 0：

foriinrange（间隙，LEN（ARR））：

temp = arr [i]

j = i-gap

whilej> = 0andarr [j]> temp：

ARR [J +间隙] = ARR [j]的

J- =间隙

arr [j + gap] = temp

gap = math.floor（gap / 3）

returnarr

归并排序

归并排序（Merge sort）是建立在归并操作上的一种有效的排序算法。该算法是采用分治法（Divide and Conquer）的一个非常典型的应用。

作为一种典型的分而治之思想的算法应用，归并排序的实现由两种方法：

自上而下的递归（所有递归的方法都可以用迭代重写，所以就有了第2种方法）;

自下而上的迭代;

在“数据结构与算法JavaScript描述”中，作者给出了自下而上的迭代方法。但是对于递归法，作者却认为：

但是，在JavaScript中不可能这样做，因为递归对于语言来说太深了。

然而，在JavaScript中这种方式不太可行，因为这个算法的递归深度对其来讲太深了。

说实话，我不太理解这句话。意思是JavaScript编译器内存太小，递归太深容易造成内存溢出吗？还望有大神能够指教。

和选择排序一样，归并排序的性能不受输入数据的影响，但表现比选择排序好的多，因为始终都是O（nlogn）的时间复杂度。代价是需要额外的内存空间。

算算步骤

申请空间，使其大小为两个已经排序序列之和，该空间用来存放合并后的序列;

设定两个指针，最初位置分别为两个已经排序序列的起始位置;

比较两个指针所指向的元素，选择相对小的元素放入到合并空间，并移动指针到下一位置;

重复步骤3直到某一指针达到序列尾;

将另一序列剩下的所有元素直接复制到合并序列尾。

2.动图演示

《十大经典排序算法python》

3. Python代码实现

defmergeSort（ARR）：

importmath

如果（LEN（ARR）<2）：

returnarr

middle = math.floor（len（arr）/ 2）

left，right = arr [0：middle]，arr [middle：]

returnmerge（mergeSort（左），mergeSort（右））

defmerge（左，右）：

result = []

whileleftandright：

ifleft [0] <=右[0]：

result.append（left.pop（0））;

其他：

result.append（right.pop（0））;

whileleft：

result.append（left.pop（0））;

whileright：

result.append（right.pop（0））;

returnresult

快速排序

快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下，排序n个项目要Ο（nlogn）次比较。在最坏状态下则需要Ο（n2）次比较，但这种状况并不常见。事实上，快速排序通常明显比其他Ο（nlogn）算法更快，因为它的内部循环（内环）可以在大部分的架构上很有效率地被实现出来。

快速排序使用分治法（Divide and conquer）策略来把一个串行（list）分为两个子串行（子列表）。

快速排序又是一种分而治之思想在排序算法上的典型应用。本质上来看，快速排序应该算是在冒泡排序基础上的递归分治法。

快速排序的名字起的是简单粗暴，因为一到了这个名字你就知道它存在的意义，就是快，而且效率高！它是处理大数据最快的排序算法之一了。虽然最糟糕的情况的时间复杂度达到了O（n²），但是人家就是优秀，在大多数情况下都比平均时间复杂度为O（n logn）的排序算法表现要更好，可是这是为什么呢，我也不知道。好在我的强迫症又犯了，查了N多资料终于在“算法艺术与信息学竞赛”上找到了满意的答案：

快速排序的最坏运行情况是O（n²），比如说顺序数列的快排。但它的平摊期望时间是O（nlogn），且O（nlogn）记号中隐含的常数因子很小，比复杂度稳定等于O（nlogn）的归并排序要小很多。所以，对绝大多数顺序性较弱的随机数列而言，快速排序总是优于归并排序。

算算步骤

从数列中挑出一个元素，称为“基准”（pivot）;

重新排序数列，所有元素比基准值小的摆放在基准前面，所有元素比基准值大的摆在基准的后面（相同的数可以到任一边）。在这个分区退出之后，该基准就处于数列的中间位置这个称为分区（分区）操作。

递归地（递归）把小于基准值元素的子数列和大于基准值元素的子数列排序;

递归的最底部情形，是数列的大小是零或一，也就是永远都已经被排序好了。虽然一直递归下去，但是这个算法总会退出，因为在每次的迭代（迭代）中，它至少会把一个元素摆到它最后的位置去。

2.动图演示

《十大经典排序算法python》

3. Python代码实现

defquickSort（arr，left = None，right = None）：

left = 0ifnotisinstance（left，（int，float））elseleft

right = len（arr）-1ifnotisinstance（right，（int，float））elseright

ifleft <右：

partitionIndex = partition（arr，left，right）

quickSort（arr，left，partitionIndex-1）

quickSort（arr，partitionIndex + 1，右）

returnarr

defpartition（arr，left，right）：

pivot = left

index = pivot + 1

我=索引

whilei <= right：

ifarr [i] <arr [pivot]：

交换（arr，i，索引）

索引+ = 1

I + = 1

交换（ARR，枢轴，索引-1）

returnindex-1

defswap（arr，i，j）：

arr [i]，arr [j] = arr [j]，arr [i]

堆排序

堆排序（堆排序）是指利用堆这种数据结构所设计的一种排序算法堆积是一个近似完全二叉树的结构，并同时满足堆积的性质：即子结点的键值或索引总是小于（或者大于）它的父节点堆排序可以说是一种利用堆的概念来排序的选择排序分为两种方法。：

大顶堆：每个节点的值都大于或等于其子节点的值，在堆排序算法中用于升序排列;

小顶堆：每个节点的值都小于或等于其子节点的值，在堆排序算法中用于降序排列;

堆排序的平均时间复杂度为Ο（nlogn）。

算算步骤

创建一个堆H [0 …… n-1];

把堆首（最大值）和堆尾互换;

把堆的尺寸缩小1，并调用shift_down（0），目的是把新的数组顶端数据调整到相应位置;

重复步骤2，直到堆的尺寸为1。

。动图演示2。动图演示

《十大经典排序算法python》

3. Python代码实现

defbuildMaxHeap（ARR）：

importmath

foriinrange（math.floor（LEN（ARR）/ 2）， – 1，-1）：

heapify（ARR，i）的

defheapify（arr，i）：

left = 2 * i + 1

对= 2 * i + 2

最大= i

ifleft <arrLenandarr [left]> arr [最大]：

最大=左

ifright <arrLenandarr [right]> arr [最大]：

最大=对

iflargest！= i：

交换（arr，i，最大）

heapify（arr，最大）

defswap（arr，i，j）：

arr [i]，arr [j] = arr [j]，arr [i]

defheapSort（ARR）：

globalarrLen

arrLen = len（arr）

buildMaxHeap（ARR）

foriinrange（LEN（ARR）-1,0，-1）：

交换（ARR，0，i）的

arrLen – = 1

heapify（ARR，0）

returnarr

计数排序

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。作为一种线性时间复杂度的排序，计数排序要求输入的数据必须是有确定范围的整数。

《十大经典排序算法python》

2. Python代码实现

defcountingSort（arr，maxValue）：

bucketLen = maxValue + 1

bucket = [0] * bucketLen

sortedIndex = 0

arrLen = len（arr）

foriinrange（arrLen）：

ifnotbucket [ARR [I]]：

桶[ARR [I] = 0

桶[ARR [I]] + = 1

forjinrange（bucketLen）：

whilebucket [j]的> 0：

arr [sortedIndex] = j

sortedIndex + = 1

桶[J] – = 1

returnarr

桶排序

。桶排序是计数排序的升级版它利用了函数的映射关系，高效与否的关键就在于这个映射函数的确定为了使桶排序更加高效，我们需要做到这两点：

在额外空间充足的情况下，尽量增大桶的数量

使用的映射函数能够将输入的N个数据均匀的分配到K个桶中

同时，对于桶中元素的排序，选择何种比较排序算法对于性能的影响至关重要。

1.什么时候最快

当输入的数据可以均匀的分配到每一个桶中。

2.什么时候最慢

当输入的数据被分配到了同一个桶中。

基数排序

基数排序是一种非比较型整数排序算法，其原理是将整数按位数切割成不同的数字，然后按每个位数分别比较。由于整数也可以表达字符串（比如名字或日期）和特定格式的浮点数，所以基数排序也不是只能使用于整数。

1.基数排序vs计数排序vs桶排序

基数排序有两种方法：

这三种排序算法都利用了桶的概念，但对桶的使用方法上有明显差异：

基数排序：根据键值的每位数字来分配桶;

计数排序：每个桶只存储单一键值;

桶排序：每个桶存储一定范围的数值;

2. LSD基数排序动图演示

《十大经典排序算法python》

（完）

    原文作者：排序算法
    原文地址: https://blog.csdn.net/weixin_40907382/article/details/79635052
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。