大话数据结构读书笔记

2019年8月1日 155次阅读来源: scarqin

一、数据结构绪论

逻辑结构与物理结构
- 逻辑结构：集合、线性（一对一）、树（一对多）、图（多对多）
- 物理结构：顺序存储结构、链式储存结构
抽象数据类型（Abstract Data Type,ADT）：是指一个数学模型及定义在该模型上的一组操作
标准格式
　　　ADT　抽象数据类型名
　　　Date 数据元素之间的逻辑定义
Operation
操作1
初始条件
操作结果描述
操作2
……
操作3
……
endADT

二、算法

算法特性：输入输出、确定性、又穷性、可行性
算法要求：正确性、健壮性、可读性、时间效率高和存储量低
算法时间复杂度
- 推导大O阶方法
  1.用常数1取代运行时间中所有加法常数
  2.在修改后的运行函数中，只保留最高位
  3.如果最高阶项存在且不是1，则去除与这个项相乘的常数
  得到的结果是大O阶

三、线性表

定义：零个或多个数据元素的有限序列
抽象数据结构
ADT 线性表
Data ：
线性表的数据对象集合为{a1，a2，……，an}，每个元素的类型均为DataType。其中，除第一个元素a1外，每一个元素有且只有一个直接前驱元素，除了最后一个元素an外每一个元素有且只有一个直接后继元素。数据元素之间的关系是一对一的关系。
Operation：

InitList(&l)

操作结果：构造一个空的线性表L

DestroyList(&l)

初始条件：线性表已存在
操作结果：销毁线性表L

ClearList(&l)

初始条件：线性表已存在
操作结果：置线性表L为空表

ListEmpty(L)

初始条件：线性表已存在
操作结果：若线性表L为空表，则返回TRUE，否则返回FALSE

ListLenght(L)

初始条件：线性表已存在
操作结果：返回线性表L数据元素个数

GetElem(L,i,&e)

初始条件：线性表已存在（1≤i≤ListLenght(L)）
操作结果：用e返回线性表L中第i个数据元素的值

locatElem(L,e,comare())

初始条件：线性表已存在,comare()是数据元素判定函数
操作结果：返回线性表L中第1个与e满足关系comare()的数据元素的位序

PriorElem(L,cur_e,&pre_e)

初始条件：线性表已存在
操作结果：若cur_e是线性表L的数据元素，且不是第一个，则用pre_e返回它的前驱，否则操作失败，pre_e无定义

NextElem(L,cur_e,&)

初始条件：线性表已存在
操作结果：若cur_e是线性表L的数据元素，且不是第最后一个，则用next_e返回它的后继，否则操作失败，next_e无定义

ListInsert(&L,i,e)

初始条件：线性表已存在（1≤i≤ListLenght(L)+1）
操作结果：在线性表L中第i个数据元素之前插入新元素e，L长度加1

ListDelete(&L,i,&e)

初始条件：线性表已存在（1≤i≤ListLenght(L)）
操作结果：删除线性表L中第i个数据元素，用e返回其值，L长度减1

ListTraverse(L,visit())

初始条件：线性表已存在
操作结果：依次对线性表L的每个数据元素调用visit()函数，一旦visit()失败，则操作失败}ADT List

顺序储存结构代码
#define MAXSIZE 20
typedef int ElemType；
typedef struct{
ElemType data[MAXSIZE];
int length;
}SqList;

单链表、静态链表、循环链表、双向链表

单链表
单链表储存结构代码
typedef struct node{
ElemType data；
struct Node *next；
} Node；
typedef struct Node *LinkList；

静态链表（早期没有指针，用数组代替指针）
静态链表的储存结构代码
#define MAXSIZE 1000
typedef struct{
Elemtype data；
int cur；/游标/
}Component,StaticLinkList[MAXSIZE];
静态链表

头指针存放备用链表（后面空闲空间）第一个节点下标
数组最后一个元素的cur用来存放头结点（第一个插入元素的下标）

循环链表
将单链表中的终端结点的指针端由空指针改为指向头结点，链表就形成了一个环
双向链表
- 双向链表的储存结构代码
  typedef Struct DulNode{
  ElemType data;
  struct DuLNode *prior;
  struct DuLNode next;
  }DulNode,DuLinkList;

四、栈与队列

栈

栈的定义：限定仅在表尾进行插入和删除操作的线性表
栈的抽象数据类型
ADT 栈（stack）
Data ：
同线性表
Operation：

InitStack（*S）

初始化操作，建立一个空栈*S

DestroyStack（*S）

若栈存在，则销毁它

ClearStack（*S）

将栈清空

StackEmpty（*S）

若栈为空，则返回true，反之返回false

GetTop（S，*e）

若栈存在且非空，用e返回栈顶元素

Push（*S，e）

若栈存在，插入新元素e到栈S中并成为栈顶元素

Pop（S，e）

删除栈S中栈顶元素，并用e返回其值

StackLengh（S）

返回栈S的元素个数
endADT

栈的顺序存储结构
typedef int SElemType；
typedef struct{
SElemtype data[MAXSIZE];
int top;
}SqStack；
两栈共享空间
typedef struct{
SElemType data[MAXSIZE];
int top1;
int top2;
}sqDoubleStack；

判断是否满栈

top1+1==top2

栈的链式存储结构
typedef struct StackNode{
SElemType data;
struct StackNode next;
}StackNode,LinkStackPtr;
```
typedef struct LinkStack{
   LinkStack top;
   int count; 
}LinkStack；
```
栈的应用：
四则运算表达式求值：后缀表示法(逆波兰表示法)。

队列

队列的定义：只允许在一端进行插入操作，而在另一端进行删除操作的线性表
队列的抽象数据类型

ADT 队列（Queue）
Data ：
同线性表
Operation：

InitQueue（*Q）

初始化操作，建立一个空队列*Q

DestroyQueue（*Q）

若队列存在，则销毁它

ClearQueue（*S）

将队列清空

QueueEmpty（*Q）

若队列为空，则返回true，反之返回false

GetHead（Q，*e）

若队列存在且非空，用e返回队头元素

EnQueue（*Q，e）

若队列Q存在，插入新元素e到队列Q中并成为队尾元素

DeQueue（Q，e）

删除队列Q中队头元素，并用e返回其值

QueueLengh（Q）

返回队列Q的元素个数
endADT

循环队列
- 定义：队列头尾相接
- 循环队列顺序存储结构
  typedef int QElemType；
  typedef struct{
  QElemType data[MAXSIZE];
  int front;
  int rear;
  }SqQueue;

队列满的条件是
######（rear+1）%QueueSize == front

队列的链式储存结构
typedef int QElemType；
typedef struct QNode{
QElemType data；
struct QNde next；
}QNode,QueuePtr;
typedef struct{
QueuePtr font,rear;
}LinkQueue；

五、串

串的定义：串是由零个或多个字符组成的有限序列，又名叫字符串
串的抽象数据结构

ADT 串（string）
Data
串中元素仅由一个字符组成，相邻元素具有前驱和后继关系
Operation

StrAssign( &T, chars )

初始条件：chars是字符串常量。
操作结果：生成一个其值等于chars的串T。

StrCopy( &T, S )

初始条件：串S存在。
操作结果：由串S复制得串T。

StrEmpty( S )

初始条件：串S存在。
操作结果：若S为空串，则返回TRUE，否则返回FALSE。 StrCompare( S, T )
初始条件：串S和T存在。
操作结果：若S>T，则返回值>0；若S=T，则返回值=0；若S<T，则返回值<0。

StrLength( S )

初始条件：串S存在。
操作结果：返回S的元素个数，称为串的长度。

ClearString( &S )

初始条件：串S存在。
操作结果：将S清为空串。

Concat( &T, S1, S2 )

初始条件：串S1和S2存在。
操作结果：用T返回由S1和S2联接而成的新串。

SubString( &Sub, S, pos, len )

初始条件：串S存在，1≤pos≤StrLength(S)且0≤len≤StrLength(S)-pos+1
操作结果：用Sub返回串S的第pos个字符起长度为len的子串。

Index( S, T, pos )

初始条件：串S和T存在，T是非空串，1≤pos≤StrLength(S)。
操作结果：若主串S中存在和串T值相同的子串，则返回它在主串S中第pos个字符之后第一次出现的位置；否则函数值为0。

Replace( &S, T, V )

初始条件：串S，T和V存在，T是非空串。
操作结果：用V替换主串S中出现的所有与T相等的不重叠的子串。 ######StrInsert( &S, pos, T )
初始条件：串S和T存在，1≤pos≤StrLength(S)+1。
操作结果：在串S的第pos个字符之前插入串T。

StrDelete( &S, pos, len )

初始条件：串S存在，1≤pos≤StrLength(S)-len+1。
操作结果：从串S中删除第pos个字符起长度为len的子串。

DestroyString( &S )

初始条件：串S存在。
操作结果：串S被销毁。
}
endADT

串的匹配
朴素匹配算法
一个一个匹配
kmp模式匹配算法
算法思想：利用已经匹配过的数据，创建一个next数组。避免重复遍历
难点：理解next数组

六、树

树的定义
树是n个结点的有限集。n=0时称为空树。在任何一棵非空树：
（1）有且仅有一个特定的称为根的结点
（2）当n>1时，其余结点可分为m（m>0）个互不相交的有限集t1、t2、……、tm，其中每一个集合本身又是一棵树，并且称为根的子树
结点的度：结点拥有的子树数，度为零的称为叶节点（终端结点）
树的度是节点的度的最大值
结点的层次从根开始定义，根为第一层，树中结点的最大层次称为树的深度（高度）
树的抽象数据类型

ADT 树（tree）
Data
树是由一个根节点和若干棵子树构成。树中结点具有相同数据类型及层次关系。
Operation
endADT

树的存储结构

双亲表示法
#define MAX_TREE_SIZE 100
typedef int ElemType;
typedef struct PTNode{
TElemType data；
int parent；
}PTNode；
typedef struct
{
PTNode nodes[MAX_TREE_SIZE];
int r,n;/根的位置和结点数/
}PTree;

孩子表示法

#define MAX_TREE_SIZE 100
 typedef int ElemType;
 typedef struct CTNode{
       int child；
       struct CTNode *next；
 }*ChildPtr；
typedef  struct
{
   TElemType data；
   ChildPtr firstchild；
}CTBox;
typedef struct
{
 CTbox nodes[MAX_TREE_SIZE];
 int r,n;
}CTree;

线性表储存结点元素，孩子链表的孩子结点 child是数据域，储存某结点在表头数组中的下标。next是指针域，用来存储指向某结点的下一个孩子的指针

孩子兄弟表示法
typedef int ElemType;
typedef struct CSNode{
TElemType data；
struct CSNode firstchild，rightsib；
}CSNode，*CSTree；
二叉树
- 定义
  是n个结点的有限集合，该集合或者为空集（称为空二叉树），或者由一个跟结点和两棵互不相交的、分别称为根节点的左子树和右子树的二叉树组成。
- 存储结构
  - 顺序储存结构
    从根节点开始遍历二叉树，遇到没有则置空
  - 二叉链表
    typedef struct BiTNode{
    TElemType data；
    struct BiTNode lchild，rchild；
    } BiTNode，*BiTree；
- 遍历二叉树
  - 定义：从根节点出发，按照一定的次序依次访问二叉树中所有结点，使得每个结点被访问依次且仅被访问依次
  - 前序遍历
    根左右
    * 中序遍历
    >左根右
    * 后序遍历
    >左右根
- 线索二叉树
  - 定义：二叉树以某种次序遍历使其变为线索二叉树的过程称为线索化
  - 二叉树的线索存储结构
    typedef enum{Link,Thread} PointerTag;
    typedef struct BiThrNode
    {
    TElemType data;
    struct BiThrNode lchild,rchild;
    PointerTag LTag;
    PointerTag RTag;
    } BiThrNode,*BiThrTree;
  - 中序遍历线索化
    void InThreading(BiThrTree p）
    {
    if(p) {
    InThreading(p->lchild);//左子树线索化
    if(!p->lchild){
    p->LTag=Thread;
    p->lchild=pre;}//前驱线索
    if(!pre->rchild){
    pre->RTag=Thread;
    pre->rchild=p;}//后续线索
    pre=p; //保持pre指向p的前驱
    InThreading(p->rchild);//右子树线索化
    }
    }//InThreading

因为此时p结点的后继还没有访问到，因此只能对它的前驱界限pre的右指针rchild做判断，if（！pre->rchild）表示如果为空，则p就是pre的后继，于是pre->rchild=p，并且设置pre->RTag=Thread,完成后继结点的线索化

赫夫曼树
- 定义带权路径长度wpl最小的二叉树称为赫夫曼树（最优二叉树）
- 算法描述

七、图

图的定义
- 图是由顶点的有穷非空集合和顶点之间边的集合组成，通常表示为：G(V,E),其中，G表示一个图，V是图G中顶点的集合，E是图G中边的集合
- 有向边（弧）：顶点vi到vj有方向，则称这条边为有向边
- 简单图：不存在顶点到其自身的边，且同一条边不重复出现，则为简单图
- 无向（有向）完全图：任意两个顶点之间都存在边
- 权：与图的边或弧相关的数
- 网：带权的图
回路（环）：第一个顶点到最后一个顶点相同的路径
简单路径：顶点不重复出现的路径
连通图：图中任意两个顶点都是连通的
连通分量：无向图中的极大连通子图
强连通图：在有向图中，对于每一对vi，vj从vi到vj和从vj到vi都存在路径，则称G是强连通图。有向图中的极大连通子图称做有向图的强连通分量。
图的抽象数据结构

ADT 图（Graph）
Data
顶点的有穷非空集合和边的集合
Operation
endADT

图的储存结构
- 邻接矩阵
  typedef char VertexType;
  typedef int EdgeType;
  #define MAXVEX 100
  #define INFINITY 65355
  typedef struct{
  VertexType vexs[MAXVEX];/顶点数组/
  EdegeType arc[MAXVEX][MAXVEX];
  int numVertexes,numEdges;
  }MGraph;
- 邻接表

与上一章的孩子表示法思路相同

       typedef char VertexType;
       typedef int EdgeType;

       typedef struct EdgeNode{ 
        int adjvex； /*邻接点域，存储该顶点的对应下标*/
        EdgeType weight；/*存储权值*/
        struct EdgeNode *next; 
       }EdgeNode；

       typedef struct VertexNode{ 
        VertexType data；
        EdgeNode  firstedge；
       }VertexNode,AdjList[MAXVEX];

       typedef struct{
        AdjList adjList;
        int numVertexes,numEdges; 
       }GraphAdjList;
 * 边集数组

![边集数组]XO.png](http://upload-images.jianshu.io/upload_images/1318539-703d9b755b44bc94.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

 * 十字链表

【data、firstin、firstout】【tailvex、headvex、headlink、taillink】

《大话数据结构读书笔记》十字链表

容易求得顶点的出度和入度

邻接多重表
边表结点结构

《大话数据结构读书笔记》邻接多重表

图的遍历
- 深度优先遍历
  从图中某个顶点v出发，访问此顶点，然后从v的未被访问的邻接点出发，深度优先遍历图，直至图中所有和v有路径相通的顶点都被访问到（邻接表）
- 广度优先遍历
  类似于树的前序遍历（队列）
最小生成树
- （普里姆）prim算法
- （克鲁斯卡尔）kruskal算法
最短路径
- （地杰斯特拉）dijkstr算法
- （弗洛伊德）floyd算法
拓扑排序

八、查找

顺序表查找
有序表查找
- 有序查找
- 斐波那契查找
- 插值查找
线性索引查找
- 稠密查找
- 到排查找
- 分块索引
二叉排序树
平衡二叉树
多路查找树（B树）
散列表查找（哈希表）概述
散列函数构造方法
处理散列冲突方法
散列表的查找实现

九、排序

冒泡排序
简单选择排序
直接插入排序
希尔排序
堆排序
归并排序
快速排序

    原文作者：scarqin
    原文地址: https://www.jianshu.com/p/5b82e1cfe258
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。