算法导论 第7章 快速排序

一、概念

快速排序是基于分治模式的,选择一个数作为主元,经过一遍扫描,所有小于主元的数放在主元的左边,大于主元的数放在主元的右边,这样就划分成了两组数据。然后对两组数分别进行快排。

快排的运行时间与划分是否对称有关,关键是如何选择主元。

最坏情况下,时间复杂度是O(n^2),最好情况下,时间是O(nlgn)

二、程序

头文件
算法过程
测试

三、练习

7.1 快速排序的描述

7.1-1
    A = {13 19 9 5 12 8 7 4 21 2 6 11}
==> A = {9 5 8 7 4 2 6 11 21 13 19 12}
==> A = {5 4 2 6 9 8 7 11 21 13 19 12}
==> A = {2 4 5 6 9 8 7 11 21 13 19 12}
==> A = {2 4 5 6 9 8 7 11 21 13 19 12}
==> A = {2 4 5 6 7 8 9 11 21 13 19 12}
==> A = {2 4 5 6 7 8 9 11 21 13 19 12}
==> A = {2 4 5 6 7 8 9 11 12 13 19 21}
==> A = {2 4 5 6 7 8 9 11 12 13 19 21}
==> A = {2 4 5 6 7 8 9 11 12 13 19 21}
7.1-2
返回r
7.1-2
修改PARTITION(A, p, r),增加对A[i]==x时的处理。对于A[i]==x的数据,一半放在x左边,一半放在x右边
https://code.csdn.net/mishifangxiangdefeng/exerciseforalgorithmsecond/tree/master/src/chapter7/Exercise7_1_2.cpp
7.1-3
PARTITION()的具体过程如下:
(1)x<-A[r],O(1)
(2)遍历数组,O(n)
(3)exchange,O(1)
因此运行时间为O(n)
7.1-4
修改PARTITION(A, p, r),把L4改为do if A[j] >= x

7.2 快速排序的性能

7.2-1
见《算法导论》7.4.1。
我的方法:
T(n)   = T(n-1) + O(n)
T(n-1) = T(n-2) + O(n-1)
……   = ……   + ……
T(2)   = T(1)   + O(2)
------------------------
T(n)   = T(1)   + O(n) + O(n-1) + …… + O(2)
       = O(n^2)
7.2-2
O(n^2)
7.2-3
当数组A包含不同元素且按降序排序时,每次划分会划分成n-1个元素和1个元素这两个区域,即最坏情况。因此时间为O(n^2)
7.2-4
基本有序的数列用快排效率较低
7.2-5
若第一层的元素个数是n,那么会划分成n(1-a)个元素和na个元素这两个区域。0<a<=1/2 ==> na<=n(1-a),因此只考虑n(1-a)。第t层元素个数为na^(t-1)。当na^(t-1)=1时划分结束。解得t=-lgn/lg(1-a)+1,大约是-lgn/lg(1-a)。
7.2-6
可参考http://blog.163.com/kevinlee_2010/blog/static/16982082020112585946451/,
不过我没看懂

7.3 快速排序的随机化版本

7.3-1
随机化不是为了提高最坏情况的性能,而是使最坏情况尽量少出现
7.3-2
最坏情况下,n个元素每次都划分成n-1和1个,1个不用再划分,所以O(n)次
最好情况下,每次从中间划分,递推式N(n)=1+2*N(n/2)=O(n)

7.4 快速排序的分析

7.4-1
没有找到关于这几个符号的定义
7.4-2
见《算法导论》P88最佳情况划分
7.4-3
令f(q) = q^2 + (n-q-1)^2
       = 2q^2 + 2(1-n)q + (n-1)^2
这是一个关于q的抛物线,且开口向上。因此q的取值离对称轴越远,f(q)的值就越大。
对称轴为q = -b/2a = (n-1)/2
当q=0或q=n-1时取得最大值
7.4-4
见《算法导论》P7.4.2
7.4-5
https://code.csdn.net/mishifangxiangdefeng/exerciseforalgorithmsecond/tree/master/src/chapter7/Exercise7_4_5.cpp

 

四、思考题

7-1 Hoare划分的正确性

7-1 Hoare划分的正确性
a)  
    A = {13 19 9 5 12 8 7 4 11 2 6 21}    
==> A = {6 19 9 5 12 8 7 4 11 2 13 21}    
==> A = {6 2 9 5 12 8 7 4 11 19 13 21}    
==> A = {4 2 9 5 12 8 7 6 11 19 13 21}    
==> A = {4 2 5 9 12 8 7 6 11 19 13 21}    
==> A = {2 4 5 9 12 8 7 6 11 19 13 21}    
==> A = {2 4 5 6 12 8 7 9 11 19 13 21}    
==> A = {2 4 5 6 7 8 12 9 11 19 13 21}    
==> A = {2 4 5 6 7 8 9 12 11 19 13 21}    
==> A = {2 4 5 6 7 8 9 12 11 13 19 21} 
 
b)自己写的,很乱,凑合看吧
主要证明以下几点:
(1)do repeat j<-j-1 until A[j]<=x
这个repeat中,第一次执行L6时p<=j<=r,最后一次执行L6时p<=j<=r
证明:
1.第一次执行L6时p<=j<=r。为了区分,j'=j-1,L6中的j用j'表示。
第一次进入while循环时,j=r+1,j'=r,满足p<=j<=r。
若不是第一次进入while循环,j<=r且j>p。因为如果j=p,在上一次while循环中L9的if不能通过,已经return了。因此p<=j<r-1,满足p<=j<=r。
2.最后一次执行L6时p<=j<=r,即要证明在A[p..r]中存在j'满足j'<=j且A[j]<=x
若第一次进入while循环,j'=p满足条件
若不是第一次进入while循环,在上一次while循环中交换过去的那个元素满足条件
(2)do repeat i<i+1 until A[i]>=x
这个repeat中,第一次执行L8时p<=i<=r,最后一次执行L8时p<=i<=r
证明:证明方法与(1)类似

c)根据b可知返回值p<=j<=r,这里只需证明j!=r
若A[r]>x,L5和L6的循环不会在j=r时停止,因此返回值j!=r
若A[r]<=x,只有在第一次进入while循环时,L5和L6的循环在j=r时停止。因为是第一次进入while循环,A[i]=A[p]=x,L7和L8的循环会在i=p时停止。显然会第二次进入while循环,此时j<r,因此返回值j!=r

d)题目写错了,应该是A[p..j]中的每个元素都小于或等于A[j+1..r]中的每个元素
结束时,A[p..i-1]中的元素都小于x,A[j+1..r]中的元素都大于x,命题得证

e)
int Hoare_Partition(int *A, int p, int r)    
{    
    int x = A[p], i = p - 1, j = r + 1;    
    while(true)    
    {    
        do{j--;}    
        while(A[j] > x);    
        do{i++;}    
        while(A[i] < x);    
        if(i < j)    
            swap(A[i], A[j]);    
        else return j;    
        Print(A, 12);    
    }    
}    
void Hoare_QuickSort(int  *A, int p, int r)    
{    
    if(p < r)    
    {    
        int q = Hoare_Partition(A, p, r);    
        Hoare_QuickSort(A, p, q-1);    
        Hoare_QuickSort(A, q+1, r);    
    }    
} 

 

7-2 对快速排序算法的另一种分析

a)           1 + 2 + …… + n       n + 1
    E[Xi] = -------------------- = -------
	                n                 2
b)后面几题表示完全看不懂

 

7-3 Stooge排序

void Stooge_Sort(int *A, int i, int j)  
{  
    if(A[i] > A[j])  
        swap(A[i], A[j]);  
    if(i + 1 >= j)  
        return;  
    k = (j - i + 1) / 3;  
    Stooge_Sort(A, i, j-k);  
    Stooge_Sort(A, i+k, j);  
    Stooge_Sort(A, i, j-k);  
}
以下内容转http://blog.csdn.net/zhanglei8893
a)对于数组A[i...j],STOOGE-SORT算法将这个数组划分成均等的3份,分别用A, B, C表示。
     第6-8步类似于冒泡排序的思想。它进行了两趟:
     第一趟的第6-7步将最大的1/3部分交换到C
     第二趟的第8步将除C外的最大的1/3部分交换到B
     剩余的1/3位于A,这样的话整个数组A[i...j]就有序了。
b)比较容易写出STOOGE-SORT最坏情况下的运行时间的递归式
           T(n) = 2T(2n/3)+Θ(1)
     由主定律可以求得T(n)=n^2.71
c)各种排序算法在最坏情况下的运行时间分别为:
    插入排序、快速排序:Θ(n^2)
    堆排序、合并排序:Θ(nlgn)
    相比于经典的排序算法,STOOGE-SORT算法具有非常差的性能,这几位终生教授只能说是浪得虚名了^_^

7-4 快速排序中的堆栈深度

a)
void QuickSort2(int *A, int p, int r)
{
	while(p < r)
	{
		int q = Partition(A, int p, r);
		QuickSort2(A, p, q-1);
		p = q + 1;
	}
}

b)
A = {1, 2, 3, 4, 5, 6}
c)
void QuickSort3(int *A, int p, int r)
{
	while(p < r)
	{
		int q = Partition(A, int p, r);
		if(r-q > q-p)
		{
			QuickSort3(A, p, q-1);
			p = q + 1;
		}
		else
		{
			QuickSort3(A, q+1, r);
			r = q - 1;
		}
	}
}

7-5 “三数取中”划分

a)n个数任意取三个不同的数的取法共有C(3,n)种
若要x=A'[i],必须在A'[1..i-1]中取一个数,在A'[i+1..n]中取一个数取法共(i-1)*(n-i)
      (i-1) * (n-i)     6 * (i-1) * (n-i)
pi = --------------- = -------------------
         C(3,n)         n * (n-1) * (n-2)
b)在一般实现中,pi=1/n。
n->正无穷时,极限为0。
在这种实现中,当i=(n+1)/2时,
      3(n-1)
pi = ---------,当n->正无穷时,极限为0
      2n(n-2)
c)遇到这种数学题就没办法了,哎,以前数学没学好
d)不会求
附自己写的程序
https://code.csdn.net/mishifangxiangdefeng/exerciseforalgorithmsecond/tree/master/src/chapter7/Exercise7_5.cpp

 

7-6 对区间的模糊排序

算法导论7-6对区间的模糊排序

    原文作者:排序算法
    原文地址: https://blog.csdn.net/mishifangxiangdefeng/article/details/7675718
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞