若干排序算法的Python实现方法及原理

2024年6月9日 190次阅读

今天突然想到了一个问题：让你立即把堆排、快排等等排序算法写出来会不会，并且不能犯逻辑错误？

我说：不会，至少需要思考一下，并且可能还需要时间调试。

之前总是觉得，不就是排序算法吗？有什么大不了的？网上、书上一查一大堆。但是换个角度想：1+1 = ? 你会不会？

排序算法应是作为最基本的工具一样，是信手捏来的，所以我把《算法导论》上的几个排序问题看了并且实现了一遍；在此做分享：

冒泡排序：

冒泡排序应该算是比较简单并且使用广泛的排序算法之一了吧，但是它的效率并不怎么高，我们可以先看一下实现：

def bubbleSort(A):
	length = len(A);
	for i in range(0, length):
		for j in range(length - 1, i, -1):
			if A[j] < A[j - 1]:
				(A[j], A[j - 1]) = (A[j - 1], A[j]);
	return A;


a = [5, 0, 1, 3, 6, 2, 4, 9, 12, 11, 18, 20, 7, 8, 19, 13, 14, 17, 16, 10];
a = bubbleSort(a);
print(a);

顾名思义，冒泡排序就
像泡沫一样一层一层往上冒，需要一个一个比较；

比较次数(n-1)*n / 2，数据交换次数最坏情况3*(n-1)*n/2，最好情况0，所以其时间复杂度O(n^2);

插入排序：

def insertionSort(A):
	for i in range(1, len(A)):
		key = A[i];
		j = i - 1;
		while (j >= 0) and (A[j] > key):
			A[j + 1] = A[j];
			j = j - 1;
		A[j+1] = key;
	return A;


a = [5, 0, 1, 3, 6, 2, 4, 9, 12, 11, 18, 20, 7, 8, 19, 13, 14, 17, 16, 10];
a = insertionSort(a);
print(a);

要理解插入排序，可以想象打扑克的时候是怎么拿牌的，我们摸一张牌，然后
从左往右（或从右往左）按顺序比较，再把牌插入相应位置，插入排序就是这种思想。

时间复杂度O(n^2)

归并排序：

记得大二学习《数据结构》第一次写这个算法的时候想了好久，因为使用递归的思想，有些地方总是转不过弯来。

def merge(A):
	length = len(A);
	if length <= 1 : return A;
	n1 = length / 2;
	n2 = length - n1;
	L = [];
	R = [];
	for i in range(0, n1):
		L.append(A[i]);
	for i in range(0, n2):
		R.append(A[n1 + i]);
	if n1 > 1 : merge(L);
	if n2 > 1 : merge(R);
	i = 0;
	j = 0;
	for k in range(0, length):
		if L[i] < R[j]:
			A[k] = L[i];
			i = i + 1;
			if i >= n1:
				for i in range(j, n2):
					k = k + 1;
					A[k] = R[i];
				break;
		else: 
			A[k] = R[j]
			j = j + 1;
			if j >= n2:
				for j in range(i, n1):
					k = k + 1;
					A[k] = L[j];
				break;
	return A;

	
a = [5, 0, 1, 3, 6, 2, 4, 9, 12, 11, 18, 20, 7, 8, 19, 13, 14, 17, 16, 10];
a = merge(a);
print(a);

如果你能很好的理解递归的思想的话，想必归并排序也是很简单的。其核心思想在于怎么把问题分解成一系列类型一样的小问题。我们可以这样想：

两个排好序的数列怎么合并成一个序列？

两个序列的数据一个一个比较，将小的存入新的队列，直至这两个数列一个为空，则将另外一个数列剩余数据插入队列。如果你把这两个数列想象成扑克的话或许更好理解。如果这两个序列都只有一个数据的话，是不是会很简单的就排完了？

[1, 3, 5], [2, 4, 6, 7] ======> [1, 2, 3, 4, 5, 6, 7]

归并排序通过递归方法，最终将一个待排序序列换成若干组待排序的包含一个数据的数列。

时间复杂度O(nlog(n))

堆排序：

曾经，第一次写堆排，用C链表，自信满满地构建了一颗二叉树！原来堆排序不需要构建一颗视觉上的二叉树！！！运用原址排序（只操作下标和对应的元素）解决！！！

parent = lambda i : (i -  1) / 2;
left = lambda i : 2 * i + 1;
right = lambda i : 2 * i + 2;
exchange = lambda a, b : (b, a);

def maxHeapfy(A, i, length):
	l = left(i);
	r = right(i);
	if l < length and A[l] > A[i]:
		large = l;
	else:
		large = i;
	if r < length and A[r] > A[large]:
		large = r;
	if large != i:
		(A[i], A[large]) = exchange(A[i], A[large]);
		maxHeapfy(A, large, length);
	return A;

def buildHeap(A, length):
	for i in range(length / 2 - 1, -1, -1):
		maxHeapfy(A, i, length);

def heapSort(A):
	length = len(A);
	buildHeap(A, length);
	for i in range(len(A) - 1, 0, -1):
		(A[0], A[i]) = exchange(A[0], A[i]);
		length = length - 1;
		maxHeapfy(A, 0, length);
	return A;
	

a = [5, 0, 1, 3, 6, 2, 4, 9, 12, 11, 18, 20, 7, 8, 19, 13, 14, 17, 16, 10];
a = heapSort(a);
print(a);

堆排的思想在于理解最大（小）堆的概念：对于一个二叉树，父节点总是不小（大）于子节点的，即

A[parent(i)] >= A[i] ……①

后面便于称述不过于冗余，只讨论最大堆。

所以堆排的第一目的是建立一个满足条件的最大堆，要建立最大堆，就需要有最大堆的判定条件，即①式。建立最大堆之后，将根节点找到、保存并剔除、对剩下的序列继续做最大堆，重复上述过程即可完成排序。

时间复杂度O(nlog(n))

快速排序：

注意也是原址排序！！！

def partition(A, p, r):
	x = A[r];
	i = p - 1;
	for j in range(p, r):
		if A[j] <= x:
			i = i + 1;
			(A[i], A[j]) = (A[j], A[i]);
	(A[i + 1], A[r]) = (A[r], A[i + 1]);
	return i + 1;

def quickSort(A, p, r):
	if p < r:
		q = partition(A, p, r);
		quickSort(A, p, q - 1);
		quickSort(A, q + 1, r);
	return A;


a = [5, 0, 1, 3, 6, 2, 4, 9, 12, 11, 18, 20, 7, 8, 19, 13, 14, 17, 16, 10];
a = quickSort(a, 0, len(a) - 1);
print(a);

快排的思想在于将序列分成三部分A[0,i-1],A[i],A[i+1,n]，并且满足条件A[0, i-1]中所有元素小于等于A[i]，A[i+1,n]中所有元素大于等于A[i]。同样可以使用递归的方法实现。不理解的可以参考归并排序。

时间复杂度O(nlog(n))