排序算法总结之堆排序

2023年9月6日 182次阅读来源: hapjin

一，堆排序介绍

堆是一个优先级队列，对于大顶堆而言，堆顶元素的权值最大。将待排序的数组建堆，然后不断地删除堆顶元素，就实现了排序。关于堆，参考：数据结构–堆的实现之深入分析

下面的堆排序算法将数组中的元素从小到大排序，用大顶堆来实现。

二，堆排序算法分析

现给定了一维数组，需要将数组中的元素使用堆排序。首先，得创建一个堆，可以在这个给定的一维数组上建堆。对N个元素建堆的时间复杂度为O(N)

堆排序具体的细节实现有两种方式：一种方式是将堆顶元素删除后，放到一个辅助数组中，然后进行堆调整使之成为一个新堆。接下来，继续删除堆顶元素，直至将堆中所有的元素都出堆，此时排序完成。这种方式需要一个额外的辅助空间O(N)

另一种方式是：将每次删除的堆顶元素放到数组的末尾。因为，对于堆的基本操作 delMin/delMax 而言（delMin针对的是小顶堆，delMax针对的是大顶堆，原理一样）是将堆中的最后一个元素替换堆顶元素，然后向下进行堆调整。因此，可以利用这个特点将每次删除的堆顶元素保存在数组末尾，当所有的元素都出堆后，数组就排好序了。这种方式不需要额外的辅助空间，空间复杂度为O(1)

三，堆排序算法实现

 1 public class HeapSort {
 2     
 3     public static <T extends Comparable<? super T>> void heapSort(T[] arr){
 4         //build heap
 5         for(int i = arr.length/2 - 1; i >= 0; i--)
 6             percDown(arr, i, arr.length);
 7         
 8         
 9         for(int i = arr.length - 1; i >= 0; i--)
10         {
11             swapReference(arr, 0, i);//delete Max
12             
13             percDown(arr, 0, i);// 从根开始向下堆调整
14         }
15     }
16     
17     private static <T extends Comparable<? super T>> void swapReference(T[] arr, int from, int to){
18         T tmp;
19         tmp = arr[from];
20         arr[from] = arr[to];
21         arr[to] = tmp;
22     }
23     
24     //求解 i 的左孩子
25     private static int leftChild(int i){
26         return 2*i + 1;
27     }
28     
29     /**
30      * 
31      * @param arr 存储堆的一维数组
32      * @param i 从 i 位置开始进行向下堆调整
33      * @param n 堆中元素的个数(不是数组的长度)
34      */
35     private static <T extends Comparable<? super T>> void percDown(T[] arr, int i, int n){
36         int child;
37         T tmp;//保存当前待调整的结点，当找到了合适的位置后，需要将之放入到合适位置，以保持堆序性质
38         
39         for(tmp = arr[i];  leftChild(i) < n; i = child)
40         {
41             child = leftChild(i);
42             if(child != n-1 && arr[child].compareTo(arr[child+1]) < 0)
43                 child++;//右孩子更大
44             if(tmp.compareTo(arr[child]) < 0)
45                 arr[i] = arr[child];//父节点下移
46             else
47                 break;//父节点比左右孩子都大时,不需要再向下移动了
48         }
49         arr[i] = tmp;//将节点放入合适的位置
50     }
51     
52     //for test purpose
53     public static void main(String[] args) {
54         Integer[] arr = {31,41,59,26,53,58,97};
55         heapSort(arr);
56         for (Integer i : arr) {
57             System.out.print(i + " ");
58         }
59     }
60 }

有几个细节地方解释一下：

①在第3行的heapSort方法中，第5-6行是建堆操作，因为数组中的元素是从下标0开始存储的，故最后一个非叶子结点的下标为：arr.length/2 – 1

②第9-14行是进行堆排序的操作。swapReference方法相当于删除堆顶元素，因为它把堆顶元素交换到数组的末尾去了，此时堆顶元素不再是最大值（大顶堆)。删除了堆顶元素之后，就要进行堆调整以保持堆序性质，故percDown方法完成向下进行堆调整的功能。

③在堆调整的过程中，需要求解某个结点的左右孩子结点的位置。故有一个leftChild方法用来求解左孩子的位置（注意元素是从数组下标0开始存储的）

④percDown方法实现向下的堆调整功能。第37行 tmp 变量保存当前待调整的结点，当找到了合适的位置后，需要将之放入到合适位置，以保持堆序性质。对于建堆而言，待调整的结点是从非叶结点开始，直至根的那些结点。对于删除堆顶元素而言，则总是从堆顶元素起开始调整（待调整的结点是根）

⑤第39行的for循环实现得非常巧妙，首先tmp保存当前待调整的结点 arr[i]，然后判断 arr[i] 是否有左孩子，如果有左孩子的话，又在第42行的if语句中判断它是否还有右孩子(child != n-1)，然后左右孩子进行比较，child记录下权值大的那个孩子。

⑥第44-45行的if语句完成的功能是：将权值大的孩子与父结点比较，如果父结点的权值小，则需要将那个较大的孩子上移到父结点的位置（也相当于父结点下移到孩子的位置）

如果父结点的权值大，已经找到了合适的位置了。说明不需要再进行堆调整了，执行else break;

⑦第49行，就待调整的结点入到到合适的位置i处。整个过程并没有用交换操作，而是用的是赋值操作来隐式地实现了交换操作完成的功能，这是一个优化。

四，堆排序算法复杂度分析

对N个元素建堆的时间复杂度为O(N)，删除堆顶元素的时间复杂度为O(logN)，尽管随着元素的不断删除，堆的调度越来越小，但是总的而言，删除堆所有元素的时间复杂度为O(NlogN)

故堆排序的时间复杂度为O(NlogN)，空间复杂度为O(1)

其实，堆排序是一个非常稳定的算法，最坏和平均情况下的时间复杂度都为O(NlogN)

此外，对于堆排序而言，数据的初始顺序对它的复杂度没有影响。不管数组初始时就是有序的还是逆序的，它都会先建堆，变成了堆序的性质。

五，参考资料

    原文作者：hapjin
    原文地址: https://www.cnblogs.com/hapjin/p/5519167.html
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。