算法复杂度分析（下）：最好、最坏、平均、均摊等时间复杂度概述

2023年5月15日 522次阅读来源: Jonins

细化时间复杂度分析

代码千千万，有些代码逻辑会很复杂，所以为了更细化的分析算法的复杂度，再复杂度分析方面引入了4个知识点：

1.最好情况时间复杂度（best case time complexity）。

2.最坏情况时间复杂度（worst case time complexity）。

3.平均情况时间复杂度（average case time complexity）。

4.均摊时间复杂度（amortized time complexity）。

复杂度分析

示例如下(限定条件:0<n且0<x且n和x为整数)：

 1 public int Function(int n, int x)
 2  {
 3      int sum = 0;
 4      for (int i = 1; i <= n; ++i)
 5      {
 6          if (i == x)
 7              break;
 8          sum += i;
 9      }
10      return sum;
11  }
12  /*
13  * 作者：Jonins
14  * 出处：http://www.cnblogs.com/jonins/
15  */

这段代码逻辑非常简单，再此不描述。需要重点分析的是循环这一段代码，这段代码根据x值的不同，时间复杂度也有区别：

1.当x>n时，此代码的时间复杂度是O(n)。

2.当1<=x<=n时，时间复杂度是一个我们不确定的值，取决于x的值。

3.当x=1时，时间复杂度是O(1)。

这段代码在不同情况下，其时间复杂度是不一样的。所以为了描述代码在不同情况下的不同时间复杂度，我们引入了最好、最坏、平均时间复杂度。

最好情况时间复杂度

最好情况时间复杂度，表示在最理想的情况下，执行这段代码的时间复杂度。

上述示例就是当x=1的时候，循环的第一个判断就跳出，这个时候对应的时间复杂度就是最好情况时间复杂度。

最坏情况时间复杂度

最坏情况时间复杂度，表示在最糟糕的情况下，执行这段代码的时间复杂度。

上述示例就是n<x的时候，我们要把整个循环执行一遍，这个时候对应的时间复杂度就是最坏情况时间复杂度。

平均情况时间复杂度

最好和最好情况是极端情况，发生的概率并不大。为了更有效的表示平均情况下的时间复杂度，引入另一个概念：平均情况时间复杂度。

分析上面的示例代码，判断x在循环中出现的位置，有n+1种情况：1<=x<=n 和n<x。

我们将所有情况下代码执行的次数累加起来（（1+2+3….+n）+n），然后再除以所有情况数量（n+1），就可以得到需要遍历次数的平均值。

平均情况复杂度为：

$ \frac{((1+2+3…+n)+n)}{(n+1)}=\frac{n(n+3)}{2(n+1)} $

推导过程：

$ \because 1+2+3…+n=n+(n-1)+(n-2)…+1 $

$ \therefore (1+2+3…+n)=\frac{n(1+n)}{2} $

$ \therefore (1+2+3…+n)+n= \frac{n(3+n)}{2} $

大O表示法，会省略系数、低阶、常量，所以平均情况时间复杂度是O(n)。

但是这个平均复杂度没有考虑各自情况的发生概率，这里的n+1个情况，它们的发生概率是不一样的，所以还需要引入各自情况发生的概率再具体分析。

x要么在1~n中，要么不在1~n中，所以它们的概率都是$\frac{1}{2}$。

同时数据在1~n中各个位置的概率都是一样的为$\frac{1}{n}$。根据概率乘法法则，x在1~n中任意位置的概率是$\frac{1}{2n}$。

因此在前面推导过程的基础上，我们把每种情况发生的概率考虑进去，那么平均情况时间复杂度的计算过程变成：

考虑概率的平均情况复杂度为：

$(1\frac{1}{2n}+2\frac{1}{2n}+3\frac{1}{2n}…+n\frac{1}{2n})+n\frac{1}{2}=\frac{3n+1}{4}$

推导过程：

$\because (1+2+3…+n)=\frac{n(1+n)}{2}$

$\therefore (1\frac{1}{2n}+2\frac{1}{2n}+3\frac{1}{2n}…+n\frac{1}{2n})=\frac{1}{2n}(1+2+3…+n)=\frac{1}{2n}*\frac{n(1+n)}{2} =\frac{1+n}{4}$

$\therefore (1\frac{1}{2n}+2\frac{1}{2n}+3\frac{1}{2n}…+n\frac{1}{2n})+n\frac{1}{2}=\frac{1+n}{4} +n\frac{1}{2}=\frac{3n+1}{4}$

这就是概率论中的加权平均值，也叫做期望值，所以平均时间复杂度全称叫：加权平均时间复杂度或者期望时间复杂度。

引入概率之后，平均复杂度变为O($\frac{3n+1}{4}$)，忽略系数及常量后，最终得到加权平均时间复杂度为O(n)。

注意：

多数情况下，我们不需要区分最好、最坏、平均情况时间复杂度。只有同一块代码在不同情况下时间复杂度有量级差距，我们才会区分3种情况，为的是更有效的描述代码的时间复杂度。

均摊情况时间复杂度

均摊复杂度是一个更加高级的概念，它是一种特殊的情况，应用的场景也更加特殊和有限。

对应的分析方式称为：摊还分析或平摊分析。

示例如下（限定条件：0<=x<=n且0<=n且n,x为整数）：

 1 int n;
 2 int Function2(int x)
 3 {
 4     int count = 0;
 5     if (n == x)
 6     {
 7         for (int i = 0; i < n; i++)
 8         {
 9             count += i;
10         }
11     }
12     else
13         count = x;
14     return count;
15 }
16 /* 作者：Jonins
17 * 出处：http://www.cnblogs.com/jonins/
18 */

分析上述案例的时间复杂度：

最理想情况下x!=n，只执行一次赋值即可推出，所以最好时间复杂度为O(1)。

最坏的情况下x=n，要执行一次循环累加和的操作，所以最好时间复杂度为O(n)。

平均的情况下，因为限定条件0<=x<=n，x在0~n中存在的位置可以分为n+1种情况(0到n)。

当0<=x<n时，时间复杂度为O(1)。但是x=n的时候是一个例外，它的复杂度是O(n)。

而且这n+1种情况发生的概率都是一样的，为$\frac{1}{n+1}$。所以根据加权平均的计算方法，

平均时间复杂度为：

$ (1\tfrac{1}{n+1}+1\tfrac{1}{n+1}+1\tfrac{1}{n+1}+…+1\tfrac{1}{n+1})+n\tfrac{1}{n+1} = \tfrac{2n}{n+1} $

推导过程：

$(1\tfrac{1}{n+1}+1\tfrac{1}{n+1}+1\tfrac{1}{n+1}+…+1\tfrac{1}{n+1})+n\tfrac{1}{n+1}$

$=n\tfrac{1}{n+1}+n\tfrac{1}{n+1}$

$=\tfrac{2n}{n+1}$

当省略系数及常量后，平均时间复杂度为O(1)。

摊还分析法

分析上述示例的平均复杂度分析并不需要如此复杂，无需引入概率论的知识。

因为通过分析可以看出，上述示例代码复杂度大多数为O(1)，极端情况下复杂度才较高为O(n)。同时复杂度遵循一定的规律，一般为1个O(n)，和n个O(1)。针对这样一种特殊场景使用更简单的分析方法：摊还分析法。

通过摊还分析法得到的时间复杂度为均摊时间复杂度。

大致思路：每一次O(n)都会跟着n次O(1)，所以把耗时多的复杂度均摊到耗时低的复杂度。得到的均摊时间复杂度为O(1)。

应用场景：均摊时间复杂度和摊还分析应用场景较为特殊，对一个数据进行连续操作，大部分情况下时间复杂度都很低，只有个别情况下时间复杂度较高。而这组操作其存在前后连贯的时序关系。

这个时候我们将这一组操作放在一起分析，将高复杂度均摊到其余低复杂度上，所以一般均摊时间复杂度就等于最好情况时间复杂度。

注意：均摊时间复杂度是一种特殊的平均复杂度（特殊应用场景下使用），掌握分析方式即可。

    原文作者：Jonins
    原文地址: https://www.cnblogs.com/jonins/p/9956752.html
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。