程序员必须掌握的数据结构 1

无论是任何程序员,不论是算法,还是其他,都需要掌握一定的数据结构。本文以最优雅的方式,基于Python,完成算法,不要问,背下来就好。代码量更少,更好背。

源码github.com/SpikeKing/d…

第1篇 查找和排序:二分查找、冒泡排序、选择排序、插入排序、希尔排序、归并排序、快速排序。

1. 二分查找

二分查找,时间复杂度O(logn),排序一次,查找多次,排序成本可以忽略;只查找一次,则顺序查找比较好。非递归12行,递归10行。

# 源码: https://github.com/SpikeKing/data_structure_with_python
def binary_search(alist, item):
    """ 二分查找,非递归 1. 2个参数,待查找alist和查找项item 2. 声明2个变量,first,last 3. while条件,first小于等于last 4. mid是first和last的中值(整除); 5. 三个if条件,相等alist[mid]=item,小于中值换last,大于中值换first; 6. 默认返回False,12行 :param alist: 待查找alist :param item: 待查找项item :return: 是否找到 """
    first = 0
    last = len(alist) - 1
    while first <= last:
        mid = (first + last) // 2
        if alist[mid] == item:
            return True
        else:
            if alist[mid] > item:
                last = mid - 1
            else:
                first = mid + 1
    return False


def binary_search_re(alist, item):
    """ 二分查找,递归 1. if终止条件,长度为0,返回False; 2. 中点是长度除2,中值判断; 3. 小于递归前半部分,大于递归后半部分,返回递归函数; 4. 10行 :param alist: 待查找alist :param item: 待查找项item :return: 是否找到 """
    if len(alist) == 0:
        return False
    mid = len(alist) // 2
    if alist[mid] == item:
        return True
    else:
        if alist[mid] > item:
            return binary_search_re(alist[:mid], item)
        else:
            return binary_search_re(alist[mid + 1:], item)


def test_of_binary_search():
    test_list = [0, 1, 2, 8, 13, 17, 19, 32, 42]
    print(binary_search(test_list, 3))
    print(binary_search(test_list, 13))
    print(binary_search_re(test_list, 3))
    print(binary_search_re(test_list, 13))


if __name__ == '__main__':
    test_of_binary_search()
复制代码

2. 冒泡排序

冒泡排序,时间复杂度O(n^2),冒泡排序通常被认为是低效的排序方式。优势是:识别排序列表,和提前终止排序。短冒泡排序就是提前终止的冒泡排序。冒泡排序4行,短冒泡排序8行。

# 源码: https://github.com/SpikeKing/data_structure_with_python
def bubble_sort(alist):
    """ 冒泡排序 1. 两次遍历,第1次遍历长度,倒序逐渐减1,每遍历一次,排序一个; 2. 第2次,正常遍历,少1个值,因为i和i+1; 3. 当前位大于下一位,交换当前位和下一位; 4. 4行 :param alist: 待排序列表 :return: None,内部排序 """
    for p_num in range(len(alist) - 1, 0, -1):
        for i in range(p_num):
            if alist[i] > alist[i + 1]:
                alist[i], alist[i + 1] = alist[i + 1], alist[i]


def bubble_sort_short(alist):
    """ 短冒泡排序,增加exchange,额外终止参数 1. 初始为True,当为False时终止; 2. 在第2次循环前,设置为False,交换一次就设置为True,一次未交换则触发终止; 3. 8行,增加5行的exchange操作 :param alist: :return: """
    for p_num in range(len(alist) - 1, 0, -1):
        exchange = False
        for i in range(p_num):
            if alist[i] > alist[i + 1]:
                alist[i], alist[i + 1] = alist[i + 1], alist[i]
                exchange = True
        if not exchange:
            # print('提前终止')
            return

                
def test_of_bubble_sort():
    alist = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    # bubble_sort(alist)
    # print(alist)
    alist = [17, 20, 26, 93, 77, 31, 44, 55, 54]
    short_bubble_sort(alist)
    print(alist)


if __name__ == '__main__':
    test_of_bubble_sort()
复制代码

3. 选择排序

选择排序,时间复杂度O(n^2),比较次数与冒泡排序相同,交换次数小于冒泡排序。 选择排序6行。

# 源码: https://github.com/SpikeKing/data_structure_with_python
def selection_sort(alist):
    """ 选择排序,即选择最大值再交换 1. 依然是2次遍历,第1次反序,第2次正序,注意起始为1,末尾+1; 2. max_loc存储最大值,默认第0位; 3. 当loc的值大于max_loc的值时,max_loc重新赋值; 4. 交换loc和max_loc 5. 6行 :param alist: 待排序alist :return: None """
    for p_num in range(len(alist) - 1, 0, -1):
        max_loc = 0
        for i in range(1, p_num + 1):
            if alist[i] > alist[max_loc]:
                max_loc = i
        alist[p_num], alist[max_loc] = alist[max_loc], alist[p_num]


def tes_of_selection_sort():
    alist = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    selection_sort(alist)
    print(alist)


if __name__ == '__main__':
    tes_of_selection_sort()
复制代码

4. 插入排序

插入排序,时间复杂度O(n^2),用移位代替交换,移位操作的时间大约是交换时间的1/3。插入排序7行。

# 源码: https://github.com/SpikeKing/data_structure_with_python
def insert_sort(alist):
    """ 插入排序,子序列逐渐有序 1. 遍历列表,存储当前值cur_val,设置游标pos 2. 游标大于0和游标的值大于当前值,则移位,同时游标减1; 3. 将当前值赋予游标的终止位置; 4. 7行 :param alist: 待排序alist :return: None """
    for i in range(1, len(alist)):
        cur_val = alist[i]
        pos = i  # 游标
        while pos > 0 and alist[pos - 1] > cur_val:
            alist[pos] = alist[pos - 1]
            pos -= 1
        alist[pos] = cur_val  # 最后游标的位置


def test_of_insert_sort():
    alist = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    insert_sort(alist)
    print(alist)


if __name__ == '__main__':
    test_of_insert_sort()
复制代码

5. 希尔排序

希尔排序,时间复杂度,介于O(n)~O(n^2),也可以认为是O(n^3/2),插入排序的改进,比较和移位较少,每次遍历都会生成一个”更有序”的子列表。12行,增量部分5行,插入部分7行。

# 源码: https://github.com/SpikeKing/data_structure_with_python
def shell_sort(alist):
    """ 希尔排序 1. 两部分,第1部分,计算增量gap和起始位置s_pos; 2. 增量是累除2,s_pos是增量的遍历 3. 增量插入排序,额外传入起始位置和增量; 4. range的起始由起始位置+增量; 5. 循环条件为大于等于增量,差值为增量 6. 12行,增量部分5行,插入部分7行 :param alist: 待排序alist :return: None """
    gap = len(alist) // 2
    while gap > 0:
        for s_pos in range(gap):
            insert_sort_gap(alist, s_pos, gap)
        gap = gap // 2


def insert_sort_gap(alist, s_pos, gap):
    """ 带增量的插入排序 :param alist: 待排序alist :param s_pos: 起始位置 :param gap: 增量 :return: None """
    for i in range(s_pos + gap, len(alist), gap):
        cur_val = alist[i]
        pos = i
        while pos >= gap and alist[pos - gap] > cur_val:
            alist[pos] = alist[pos - gap]
            pos -= gap
        alist[pos] = cur_val


def test_of_shell_sort():
    alist = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    shell_sort(alist)
    print(alist)


if __name__ == '__main__':
    test_of_shell_sort()
复制代码

6. 归并排序

归并排序,时间复杂度O(nlogn)。20行。

# 源码: https://github.com/SpikeKing/data_structure_with_python
def merge_sort(alist):
    """ 归并排序 1. 递归,结束条件,只有1个元素,return; 2. mid中心,左右两部分,递归调用merge_sort; 3. 遍历左右,添加较小的值;遍历其余部分; 4. 20行 :param alist: :return: """
    if len(alist) < 2:
        return
    mid = len(alist) // 2
    left = alist[:mid]
    right = alist[mid:]
    merge_sort(left)
    merge_sort(right)
    i, j, k = 0, 0, 0
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            alist[k] = left[i]
            i += 1
        else:
            alist[k] = right[j]
            j += 1
        k += 1
    if i < len(left):
        alist[k:] = left[i:]
    if j < len(right):
        alist[k:] = right[j:]


def test_of_merge_sort():
    alist = [54, 26, 93, 17, 77, 31, 44, 55, 20]
    merge_sort(alist)
    print(alist)


if __name__ == '__main__':
    test_of_merge_sort()
复制代码

7. 快速排序

快速排序,时间复杂度O(nlogn)。不需要额外空间14行,需要额外空间7行。

# 源码: https://github.com/SpikeKing/data_structure_with_python
def quick_sort(alist, fst, lst):
    """ 快速排序 1. 确定终止条件,起始大于等于终止; 2. 起始fst和终止lst的位置,枢轴值pivot是第1个值; 3. 遍历i和j,i是第2个,j是最后一个; 4. 循环交换,直到i和j交叉; 5. 枢轴索引取i和j最小的1个; 6. 交换枢轴位置的值与起始位置的值; 7. 递归调用左右两部分; 8. 16行 :param alist: 待排序列表 :param fst: 起始idx :param lst: 终止idx :return: None """
    if fst >= lst:
        return
    pivot = alist[fst]
    i, j = fst + 1, lst
    while i < j:
        while alist[i] < pivot:
            i += 1
        while alist[j] > pivot:
            j -= 1
        if i < j:
            alist[i], alist[j] = alist[j], alist[i]
            i, j = i + 1, j - 1
    p_idx = min(i, j)  # 枢轴索引
    alist[fst], alist[p_idx] = alist[p_idx], alist[fst]
    quick_sort(alist, fst, p_idx - 1)
    quick_sort(alist, p_idx + 1, lst)


def quick_sort_v2(alist):
    """ 快速排序,需要额外空间 :param alist: 待排序列表 :return: 排序列表 """
    if len(alist) <= 1:
        return alist
    pivot = alist[0]
    small = [i for i in alist if i < pivot]
    mid = [i for i in alist if i == pivot]
    large = [i for i in alist if i > pivot]
    return quick_sort_v2(small) + mid + quick_sort_v2(large)
复制代码

OK, that’s all! Enjoy it!

    原文作者:算法小白
    原文地址: https://juejin.im/post/5bc5b4136fb9a05d171d6e7b
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞