程序猿必修课之数据结构(二)算法和算法的复杂度

原文出自:http://www.jianshu.com/p/d72d4c9e90c6

你还在为开发中频繁切换环境打包而烦恼吗?快来试试 Environment Switcher 吧!使用它可以在app运行时一键切换环境,而且还支持其他贴心小功能,有了它妈妈再也不用担心频繁环境切换了。https://github.com/CodeXiaoMai/EnvironmentSwitcher

上一章:程序猿必修课之数据结构(一)数据结构基本概念和术语

算法

算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。

算法的特性

算法具有五个基本特性:输入、输出、有穷性、确定性、可行性。

算法设计的要求

好的算法,应该具有:正确性、可读性、健壮性、高效率和低存储量的特征。

函数的渐近增长

输入规模 n 在没有限制的情况下,只要超过一个数值 N, 这个函数就总是大于另一个函数,我们称函数是渐近增长的。

给定两个函数 f(n) 和 g(n), 如果存在一个整数 N,使得对于所有的 n > N, f(n) 总是比 g(n) 大,那么我们说 f(n) 的增长渐近快于 g(n)。

算法时间复杂度

在进行算法分析时,语句总的执行次数 T(n) 是关于问题规模 n 的函数,进而分析 T(n) 随 n 的变化情况并确定 T(n) 的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n) = O(f(n))。它表示随问题规模 n 的增大,算法执行时间的增长率和 f(n) 的增长率相同,称为算法的渐近时间复杂度,简称为时间复杂度。其中 f(n) 是规模 n 的某个函数。

用 O() 来体现算法时间复杂度的记法,叫作大 O 记法。

推导大 O 阶方法

  1. 用常数 1 取代运行时间中的所有加法常数。
  2. 在修改后的运行次数函数中,只保留最高阶项。
  3. 如果最高阶项存在且不是 1 ,则去除与这个项相乘的常数。

常数阶

高斯算法

int sum = 0, n = 100;   // 执行 1 次
sum = (1 + n) * n / 2;  // 执行 1 次
printf("%d", sum);      // 执行 1 次

这个算法的运行次数函数是 f(n) = 3。根据推导大 O 阶的方法,第一步把常数项 3 改为 1。第二步保留最高阶项,它没有最高阶项,所以这个算法的时间复杂度为 T(n) = O(1)。

当 n = 1 时,算法执行次数为 3, 当 n = 100时,算法的执行次数还是 3,所以我们可以看出这个算法的执行次数与 n 的规模没关系。我们把这种与问题的大小(n 的大小)无关,执行时间恒定的算法, 叫作常数阶。

对于分支结构,无论是真还是假,执行的次数都是恒定的,不会随着 n 的变化而变化,所以单纯的分支结构(不包含在循环结构中),其时间复杂度也是 O(1)。

线性阶

下面这段代码的时间复杂度为 O(n),因为循环体中的代码必须要执行 n 次。

int i;
for (i = 0; i < n; i++) {
    /* 时间复杂度为 O(1) 的程序步骤序列 */
}

对数阶

int count = 1;
while (count < n) {
    count = count * 2;
    /* 时间复杂度为 O(1) 的程序步骤序列 */
}

由于每次 count 乘以 2 以后,就越来越接近于 n,也就是说有多少个 2 相乘后大于 n,则会退出循环。由 2x = n 等到 x = log2n。所以这个算法的时间复杂度为 T(n) = O(logn)。

平方阶

这是一个循环嵌套的代码。

int i, j;
for (i = 0; i < n; i++) {
    for (j = 0; j < n; j++) {
        /* 时间复杂度为 O(1) 的程序步骤序列 */
    }
}

它的内循环我们已经知道,时间复杂度为 O(n),而对于外层的循环,不过是内部这个时间复杂度为 O(n) 的语句,再循环 n 次。所以这段代码的时间复杂度为 O(n2)

如果外循环的次数改为了 m,时间复杂度就变为 O(m*n)。

int i, j, m;
for (i = 0; i < m; i++) {
    for (j = 0; j < n; j++) {
        /* 时间复杂度为 O(1) 的程序步骤序列 */
    }
}

所以我们可以总结得出,循环的时间复杂度等于循环体的复杂度乘以该循环运行的次数。

下面这个循环嵌套,它的时间复杂度是多少呢?

int i, j;
for (i = 0; i < n; i++) {
    for (j = i; j < n; j++) {   // 注意 j = i 而不是 0
        /* 时间复杂度为 O(1) 的程序步骤序列 */
    }
}

由于当 i = 0 时,内循环执行了 n 次,当 i = 1 时,执行了 n -1 次,…… 当 i = n – 1 时,执行了 1 次。所以部的执行次数为:

n + (n-1) + (n-2) + …… + 1 = n(n+1)/2 = n2/2 + n/2。

用我们推导大 O 阶的方法,第一条,没有加法常数不考虑;第二条,只保留最高阶项,因此保留 n2/2;第三条,去除这个项相乘的常数,也就是去除 1/2, 最终这个算法的时间复杂度为 T(n) = O(n2)

常见的时间复杂度

非正式术语
O(1)常数阶
O(n)线性阶
O(n2)平方阶
O(logn)对数阶
O(nlogn)nlogn阶
O(n3)立方阶
O(2n)指数阶

常用的时间复杂度所耗费的时间从小到大依次是:

O(1) < O(logn) < O(n) < O(nlogn) < O(n2) < O(n3) < O(2n) < O(n!) < O(nn)

算法空间复杂度

算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式:S(n) = O(f(n)),其中 n 为问题的规模,f(n)为语句关于 n 所占存储空间的函数。

总结

  1. 算法是解决特定问题求解步骤的描述,在计算机中为指令的有限序列,并且每条指令表示一个或多个操作。
  2. 算法的特性:有穷性、确定性、可行性、输入、输出。
  3. 算法的设计要求:正确性、可读性、健壮性、高效率和低存储量需求。

下一章:程序猿必修课之数据结构(三)线性表1

    原文作者:Xiao_Mai
    原文地址: https://www.jianshu.com/p/d72d4c9e90c6#comments
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞