排序算法(三)--关于快速排序Partition的思考

2023年9月13日 325次阅读来源: 排序算法

上一章我们讲解了快速排序，其中快速排序一趟划分的算法Partition.Partition可不只用在快速排序中,还可Selection algorithm(在无序数组中寻找第K大的值)中.甚至有可能正是这种通过一趟扫描来进行分类的思想激发Edsger Dijkstra想出了Three-way Partitioning,高效的解决了Dutch national flag problem问题.接下来我们一起探索Partition算法.

Partition实现

快速排序中用到的partion算法思想很简单,首先从无序数组中选出枢轴点pivot,然后通过一趟扫描,以pivot为分界线将数组中的元素分为两部分:使得左边的数小于等于枢轴,右边的数大于等于枢轴(左右部分可能为空),最后返回枢轴在新数组中的位置.

Partition的一个直观简单实现如下(取数组第一个元素为pivot):

<pre name="code" class="cpp">// 直观的设置一个指针的partition算法
int partition(int array[], int nStart, int nEnd)
{
	int pivot = array[nStart];
	int nPos = nStart;
	// 从第二个数开始和基准值比较
	for (int i = nStart+1; i<=nEnd; i++)
	{
		if (array[i]<=pivot)
		{
			nPos++;
			Swap(array[i], array[nPos]);
		}
	}
	Swap(array[nPos], array[nStart]);
	return nPos;
}

这种实现思路比较直观,但是其实并不高效.从直观上来说,每个小于piovt的值基本上都需要交换一次,而大于piovt的值可能要交换多次.

如果我们考虑用Two Pointers的思想,保持头尾两个指针向中间扫描,在头部找到大于piovt的值,同时在尾部找到小于piovt的值,把他们做一次交换。就可以一次把这两个数组放到最终的位置.

template <class T>
int Partition(T array[], int nStart, int nEnd)
{
	int i = nStart;
	int j = nEnd;
	while (i < j)
	{
		while (i<j)
		{
			// 右侧扫描
			if (array[j] > array[i])
			{
				j--;
			}else
			{
				T temp = array[j];
				array[j] = array[i];
				array[i] = temp;
				i++;
				break;
			}
		}
		while (i<j)
		{
			// 左侧扫描
			if (array[i] < array[j])
			{
				i++;
			}else
			{
				T temp = array[j];
				array[j] = array[i];
				array[i] = temp;
				j--;
				break;
			}
		}

	}
	return i;
}

Partition应用

除了用在快速排序,partition还可以用O(n)的平均时间复杂度从无序数组中寻找第k大的值.和快排一样,这里也用到了分而治之的思想.思路是,首先对数组进行一次Partition,得到坐标nPos:

如果nPos+1 == k,返回array[nPos];

如果nPos+1 > k,对数组左半部分继续进行Partition;

如果nPos+1 < k, 对数组右半部分继续进行Partition.

// 利用Partition实现复杂度为O(n)的寻找数组中第K大的数
int GetArrayMaxK(int array[], int nStart, int nEnd, int k)
{
	if (k <= 0)
	{
		throw;
	}
	int nPos = -1;
	while (true)
	{
		nPos = Partition(array, nStart, nEnd);
		if ((nPos+1) == k)
		{
			return array[nPos];
		}else if ((nPos+1) > k)
		{
			nEnd = nPos - 1;
		}else
		{
			nStart = nPos + 1;
		}
	}
}

Partition进阶

考虑如下一个问题:给定红,白,蓝三种颜色的小球若干,将其排成一列,使相同颜色的小球相邻,且三种颜色的先后顺序为红,白,蓝.这就是经典的Dutch national flag problem.

我们可以针对红,蓝,白三种颜色的球分别计数,然后根据计数结果重新放球.我们可以将问题进一步抽象,也就是说将一个数组按照某个target分为三部分,左边部分小于target,中间部分等于target,右边部分大于target.这样就不能简单计数来确定排序后的结果,这时候，可以用另一种partition算法:three-way-partition.它的思路稍微复杂一点,同三个指针将数组分为四个部分,通过一次扫描将数组分为<,=,>三部分.

// 三个指针扫描
void three_way_partition(int array[], int nLen, int target)
{
	int next_less_pos = 0;
	int next_bigger_pos = nLen - 1;
	int next_scan_pos = 0;
	while (next_scan_pos <= next_bigger_pos)
	{
		if (array[next_scan_pos] > target)
		{
			Swap(array[next_scan_pos], array[next_bigger_pos--]);
		}else if (array[next_scan_pos] < target)
		{
			Swap(array[next_scan_pos++],array[next_less_pos++]);
		}else
		{
			next_scan_pos++;
		}
	}

}

这里主要的思想就是在一遍扫描中,通过交换不通位置的数字,使得数组可以维持一定的顺序.和前面快排用到的partition思想一致.区别在于快排通过pivot将数组分为两部分.而three-way-partition将数组分为<,=,>三部分.

    原文作者：排序算法
    原文地址: https://blog.csdn.net/superinzaghi747/article/details/52765555
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。