拓扑排序详解+最小生成树（MST）详解【普利姆算法 + 优先队列优化 & 克鲁斯卡尔算法】

2019年3月17日 245次阅读来源: 拓扑排序

好基友YanBaoC的另一篇巨作，又被我“剽窃”来了。《拓扑排序详解+最小生成树（MST）详解【普利姆算法 + 优先队列优化 & 克鲁斯卡尔算法】》出处—————>我叫YanBaoC 我叫YanBaoC。

本文分为以下几个部分：

1、拓扑排序

3、普利姆算法 & 优先队列优化

4、克鲁斯卡尔算法

前情提要：本文的存图方式只有两种：邻接矩阵 or 前向星。

1、拓扑排序

　　我们起床穿裤子和鞋子时，相信大部分人的顺序是这样的，先穿上内裤，然后再穿上裤子，再穿上袜子，然后才是鞋子。那么，我们把这些步骤分解：

(1)穿内裤

(2)穿裤子

(3)穿袜子

(4)穿鞋子

我们把这四个步骤，按照上述的顺序给排一下，这就是所谓的拓扑排序。

当然这个排序的顺序是唯一的，如果你先进行(2)然后(1)(3)(4)，哦，不，你不是超人，请不要这样做，又假如你按照(1)(2)(4)(3)，那显然也是不行的。

拓扑排序也可以描述一个暑假写作业的过程：语文作业，数学作业，英语作业，生物作业，化学作业，物理作业。

(1) 语文

(2) 数学

(3) 英语

(4) 生物

(5) 化学

(6) 物理

你可以是(1)(2)(3)(4)(5)(6),也可以是(6)(5)(4)(3)(2)(1)，再者英语老师比较凶，那么可以是(3)(1)(2)(4)(5)(6)。等等其他的排序方式。

那么这个排序又是不唯一的。

因此拓扑排序可能是唯一的又有可能是不唯一的。

就像 3个篮球队进行比赛。编号分别为 1 ， 2 ， 3。

1打赢了2

2打赢了3

3打赢了1。问谁是最后的冠军。各一胜一负你问我谁是冠军，这不是扯蛋嘛。 So，这是不能判断谁是冠军的，因为这个事件存在一个环，互相牵制，进行排序是不行产生结果的。

如果这样：

1打赢了2

3打赢了2

那么最后的冠军可能是不确定的，因为你不知道1和3 谁强。所以只能是 1,3并列了，你如果喜欢大数在前那就是3 1 2，反之，就是1 3 2了。

拓扑排序其实就是这个样子。

前面大篇幅的扯犊子，主要是介绍什么是拓扑排序。那么我们要讨论一下，怎么样进行拓扑排序呢？哎，这个问题好！

插播：

我们再次的从 1 2 3 这三支队伍的冠军争夺赛说起。

1打赢了2 因为2输了一场比赛，所以要给2做一标记。因此2号的菊花上就出现了一杆长枪。我们称这个标记为入度那么2的入度就是 1了。

3打赢了2 因为2又输了一场比赛，又是一杆长枪啊。为什么受伤的总是2。那么2的入度就++了变成了2。

好了这就是什么是入度了。如果你还不是很懂入度是什么。那我告诉你，入度在这里就是2号被打败了几次。

那我们就要进入正题了。

拓扑排序：

　　由AOV网构造拓扑序列的拓扑排序算法主要是循环执行以下两步，直到不存在入度为0的顶点为止。

　　(1) 选择一个入度为0的顶点并输出之；
　　(2) 从网中删除此顶点及所有出边。

　　循环结束后，若输出的顶点数小于网中的顶点数，则输出“有回路”信息，否则输出的顶点序列就是一种拓扑序列。（摘自：百度百科）

我们继续以题来进行讲解和理解的加深。

Description
有N个比赛队（1<=N<=500），编号依次为1，2，3，。。。。，N进行比赛，比赛结束后，裁判委员会要将所有参赛队伍从前往后依次排名，但现在裁判委员会不能直接获得每个队的比赛成绩，只知道每场比赛的结果，即P1赢P2，用P1，P2表示，排名时P1在P2之前。现在请你编程序确定排名。
 

Input
输入有若干组，每组中的第一行为二个数N（1<=N<=500），M；其中N表示队伍的个数，M表示接着有M行的输入数据。接下来的M行数据中，每行也有两个整数P1，P2表示即P1队赢了P2队。
 

Output
给出一个符合要求的排名。输出时队伍号之间有空格，最后一名后面没有空格。

其他说明：符合条件的排名可能不是唯一的，此时要求输出时编号小的队伍在前；输入数据保证是正确的，即输入数据确保一定能有一个符合要求的排名。
 

Sample Input

4 3 
1 2 
2 3 
4 3

 

Sample Output

1 2 4 3

题目在这：http://acm.hdu.edu.cn/showproblem.php?pid=1285

因为数据较小，我们可以使用邻接矩阵进行存储。这是第一种方法。

题解在这：

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#include <queue>
#define LL long long

const int INF = 1e9+7;
const int VM = 503;// 点的个数

bool G[VM][VM];//图
int deg[VM];//各个顶点的入度  计数

void toposort(int n) {//拓扑排序
    int k = 0;

    for (int i = 1; i <= n; i++) {//共进行|G.V|次操作
        for (int j = 1; j <= n; j++) {//遍历所有的顶点  找入度为0的
            if (deg[j] == 0) {//找到
                printf("%d%c", j, i == n ? '\n' : ' ');//输出
                deg[j]--;//去掉这个点  让deg[j] = -1;
                k = j;//记录这个点
                break;//跳出循环
            }
        }
        for (int j = 1; j <= n; j++)//遍历所有的点
            if (G[k][j] == true) {//找被此点打败过的点
                G[k][j] = false;//标记为找到过
                deg[j]--;//让这个点的入度-1
            }
    }
}

int main() {
    int n, m;

    while (scanf("%d %d", &n, &m) == 2) {//多组输入， 获取n, m
        memset(G, 0, sizeof(G));//初始化
        memset(deg, 0, sizeof(deg));//初始化
        while (m--) {
            int u, v;
            scanf("%d %d", &u, &v);//获取 u,v  u打败过v
            if (G[u][v] == false) {//防止重边 如果被同一个对手打败多次，也太伤v的心了
                G[u][v] = true;//标记为真
                deg[v]++;//v的入度++   一杆长枪入洞了。
            }
        }
        toposort(n);//调用函数
    }
    return 0;
}

主函数对数据的获取和存图。

int main() {
    int n, m;

    while (scanf("%d %d", &n, &m) == 2) {//多组输入， 获取n, m
        memset(G, 0, sizeof(G));//初始化
        memset(deg, 0, sizeof(deg));//初始化
        while (m--) {
            int u, v;
            scanf("%d %d", &u, &v);//获取 u,v  u打败过v
            if (G[u][v] == false) {//防止重边 如果被同一个对手打败多次，也太伤v的心了
                G[u][v] = true;//标记为真
                deg[v]++;//v的入度++   一杆长枪入洞了。
            }
        }
        toposort(n);//调用函数
    }
    return 0;
}

拓扑排序的函数 :

void toposort(int n) {//拓扑排序
    int k = 0;

    for (int i = 1; i <= n; i++) {//共进行|G.V|次操作
        for (int j = 1; j <= n; j++) {//遍历所有的顶点  找入度为0的
            if (deg[j] == 0) {//找到
                printf("%d%c", j, i == n ? '\n' : ' ');//输出
                deg[j]--;//去掉这个点  让deg[j] = -1;
                k = j;//记录这个点
                break;//跳出循环
            }
        }
        for (int j = 1; j <= n; j++)//遍历所有的点
            if (G[k][j] == true) {//找被此点打败过的点
                G[k][j] = false;//标记为找到过
                deg[j]--;//让这个点的入度-1
            }
    }
}

此算法的时间复杂度为 O（n * n）复杂度挺高的呢。

那我们要想办法优化啊。

来了，第二种时间复杂度为 O（V + E）在这个算法中我们用到了前向星和优先队列。

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#include <queue>
#define LL long long

using namespace std;

const int INF = 1e9+7;
const int VM = 503;// 点的个数

struct node {//前向星的结构体
    int v;//输队编号
    int next;
};
node edge[VM * 4];//结构体数组
int head[VM];//头指针数组
int cnt;//下标
int deg[VM];//入度数组

void toposort(int n) {
    priority_queue<int, vector<int>, greater<int> > que;//优先队列

    for (int i = 1; i <= n; i++)//找所有点
        if (deg[i] == 0) {//入度为 0
            que.push(i);//加入队列
            deg[i]--;//入度 变为 -1
        }
    int k = 1;
    while (que.empty() == false) {//队列不为空
        int u = que.top();//取出队首的数
        que.pop();//删除
        printf("%d%c", u, k++ == n ? '\n' : ' ');//输出
        for (int i = head[u]; i != -1; i = edge[i].next) {//与该点相连的
            node e = edge[i];//便于书写
            deg[e.v]--;//点的入度 -1 
            if (deg[e.v] == 0)//若此点的 入度为 0
                que.push(e.v);//放入队列
        }
    }
}

int main() {
    int n, m;
    int i;

    while (scanf("%d %d", &n, &m) == 2) {//多组输入 ，获取n,m
        memset(head, -1, sizeof(head));//初始化
        memset(deg, 0, sizeof(deg));//初始化
        cnt = 0;//初始化
        while (m--) {
            int u, v;
            scanf("%d %d", &u, &v);//获取u,v
            for (i = head[u]; i != -1; i = edge[i].next)//查找重边
                if (edge[i].v == v)//输入重复数据
                    break;//不再储存
            if (i == -1) {//若不是重复数据
                deg[v]++;//加边
                edge[cnt].v = v;
                edge[cnt].next = head[u];
                head[u] = cnt++;
            }
        }
        toposort(n);//调用函数
    }
    return 0;
}

所用到的数据结构：

priority_queue<int, vector<int>, greater<int> > que;//优先队列
struct node {//前向星的结构体
    int v;//输队编号
    int next;
};
node edge[VM * 4];//结构体数组
int head[VM];//头指针数组
int cnt;//下标

主函数对数据的获取和图的存储

int main() {
    int n, m;
    int i;

    while (scanf("%d %d", &n, &m) == 2) {//多组输入 ，获取n,m
        memset(head, -1, sizeof(head));//初始化
        memset(deg, 0, sizeof(deg));//初始化
        cnt = 0;//初始化
        while (m--) {
            int u, v;
            scanf("%d %d", &u, &v);//获取u,v
            for (i = head[u]; i != -1; i = edge[i].next)//查找重边
                if (edge[i].v == v)//输入重复数据
                    break;//不再储存
            if (i == -1) {//若不是重复数据
                deg[v]++;//加边
                edge[cnt].v = v;
                edge[cnt].next = head[u];
                head[u] = cnt++;
            }
        }
        toposort(n);//调用函数
    }
    return 0;
}

拓扑排序函数

void toposort(int n) {
    priority_queue<int, vector<int>, greater<int> > que;//优先队列

    for (int i = 1; i <= n; i++)//找所有点
        if (deg[i] == 0) {//入度为 0
            que.push(i);//加入队列
            deg[i]--;//入度 变为 -1
        }
    int k = 1;
    while (que.empty() == false) {//队列不为空
        int u = que.top();//取出队首的数
        que.pop();//删除
        printf("%d%c", u, k++ == n ? '\n' : ' ');//输出
        for (int i = head[u]; i != -1; i = edge[i].next) {//与该点相连的
            node e = edge[i];//便于书写
            deg[e.v]--;//点的入度 -1 
            if (deg[e.v] == 0)//若此点的 入度为 0
                que.push(e.v);//放入队列
        }
    }
}

拓扑排序讲解完毕。

插播：

　　什么是生成树？什么又是最小生成树？

　　给定一个无向图，如果它的某个子图中的任意两个顶点都互相联通并且是一棵树，那么这棵树就是生成树。

　　也就是说，在一个图中，有 n 个顶点，若有 n – 1 条边，能使得所有的顶点相连，就是生成树了。

　　如果你给这些边加上权值，那权值总和最小的额生成树就是最小生成树

再插：

　　最小生成树有两种方法一种：普利姆算法另一种：克鲁斯卡尔。

3、普利姆算法 & 优先队列优化

　　prim算法和Dijkstra算法十分相似，都是从某个顶点出发，不断加边的算法。

　　1. 假设有一棵树只包含一个顶点的v的树T。

　　2.贪心的选取T和其他顶点之间相连的最小权值的边，并将它加入T中。

　　3.不断重复1,2 知道所有的点相连生成一棵最小生成树。（此算法的正确性，不给予证明）

　　下面开始练题。

　　题目：我是题目请点击　　

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>

using namespace std;

const int INF = 1e9+7;
const int VM = 103;

int G[VM][VM];//存图

void prim(int n) {
    int dis[VM];//记录 边的权值
    bool vis[VM];//记录为否访问
    int ans = 0;//

    memset(vis, 0, sizeof(vis));//初始化
    for (int i = 1; i <= n; i++)
        dis[i] = G[1][i];//初始化
    dis[1] = 0;// 
    vis[1] = true;// 1 点标记为已访问
    int i;
    for (i = 2; i <= n; i++) {//进行 n - 1 次操作
        int u = INF;//初始化
        int k;
        for (int j = 1; j <= n; j++) {//遍历所有顶点
            if (!vis[j] && u > dis[j]) {//在所有的未加入的点中  找一个最小的权值
                k = j;//记录下标
                u = dis[j];//更新最小值
            }
        }
        if (u == INF)//若图是不连通的   
            break;//提前退出
        vis[k] = true;//标记为已加入
        ans += u;//加权值
        for (int j = 1; j <= n; j++) {//遍历所有的点
            if (!vis[j] && dis[j] > G[k][j])//对未加入的点&&能找到与此点相连且的权值最小的边 
                dis[j] = G[k][j];//进行更新
        }
    }
    //输出
    if (i - 1 == n)
        printf("%d\n", ans);
    else
        printf("?\n");
}

int main() {
    int n, m;

    while (scanf("%d %d", &n, &m), n) {//对边数 和点数的获取
        for (int i = 1; i <= m; i++) {//初始化
            for (int j = 1; j <= m; j++) {
                G[i][j] = i == j ? 0 : INF;
            }
        }
        while (n--) {
            int u, v, w;
            scanf("%d %d %d", &u, &v, &w);//获取 数据
            if (G[u][v] > w)//防止重边&&存两点之间的最短距离
                G[u][v] = G[v][u] = w;
        }
        prim(m);//调用函数
    }
    return 0;
}
<span style="font: 15.19px/24px 微软雅黑, 宋体, Arial; color: rgb(0, 0, 0); text-transform: none; text-indent: 0px; letter-spacing: normal; word-spacing: 0px; float: none; display: inline !important; white-space: normal; background-color: rgb(255, 255, 255); -webkit-text-stroke-width: 0px;">主函数对数据的获取及图的存储</span>

<span style="font: 15.19px/24px 微软雅黑, 宋体, Arial; color: rgb(0, 0, 0); text-transform: none; text-indent: 0px; letter-spacing: normal; word-spacing: 0px; float: none; display: inline !important; white-space: normal; background-color: rgb(255, 255, 255); -webkit-text-stroke-width: 0px;"></span><pre class="html" name="code">int main() {
    int n, m;

    while (scanf("%d %d", &n, &m), n) {//对边数 和点数的获取
        for (int i = 1; i <= m; i++) {//初始化
            for (int j = 1; j <= m; j++) {
                G[i][j] = i == j ? 0 : INF;
            }
        }
        while (n--) {
            int u, v, w;
            scanf("%d %d %d", &u, &v, &w);//获取 数据
            if (G[u][v] > w)//防止重边&&存两点之间的最短距离
                G[u][v] = G[v][u] = w;
        }
        prim(m);//调用函数
    }
    return 0;
}

普利姆函数

void prim(int n) {
    int dis[VM];//记录 边的权值
    bool vis[VM];//记录为否访问
    int ans = 0;//

    memset(vis, 0, sizeof(vis));//初始化
    for (int i = 1; i <= n; i++)
        dis[i] = G[1][i];//初始化
    dis[1] = 0;// 
    vis[1] = true;// 1 点标记为已访问
    int i;
    for (i = 2; i <= n; i++) {//进行 n - 1 次操作
        int u = INF;//初始化
        int k;
        for (int j = 1; j <= n; j++) {//遍历所有顶点
            if (!vis[j] && u > dis[j]) {//在所有的未加入的点中  找一个最小的权值
                k = j;//记录下标
                u = dis[j];//更新最小值
            }
        }
        if (u == INF)//若图是不连通的   
            break;//提前退出
        vis[k] = true;//标记为已加入
        ans += u;//加权值
        for (int j = 1; j <= n; j++) {//遍历所有的点
            if (!vis[j] && dis[j] > G[k][j])//对未加入的点&&能找到与此点相连且的权值最小的边 
                dis[j] = G[k][j];//进行更新
        }
    }
    //输出
    if (i - 1 == n)
        printf("%d\n", ans);
    else
        printf("?\n");
}

上面的算法的时间复杂度为O（V * V），是不是和Dijkstra很相似呢？那么可不可用优化Dijkstra算法的方法来优化这个呢？当然可以

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#include <queue>
#define LL long long

using namespace std;

const int INF = 1e9+7;
const int VM = 103;

typedef pair<int, int>P;//对组
struct node {//前向星 结构体
    int v, w;
    int next;
};
node edge[4 * VM];//前向星数组
int head[VM];//头指针数组
int cnt;//计数

void add(int u, int v, int w) {//加边函数
    edge[cnt].v = v;//顶点
    edge[cnt].w = w;//权值
    edge[cnt].next = head[u];//下一个
    head[u] = cnt++;//头指针
}

void prim(int n) {//普利姆函数
    bool vis[VM];//标记是否访问过
    int dis[VM];//记录权值
    int ans = 0;//最小生成树的总值
    int count = 0;//计数
    priority_queue<P, vector<P>, greater<P> >que;//权值从小到大的队列

    fill(dis, dis + VM, INF);//初始化
    memset(vis, 0, sizeof(vis));//初始化
    dis[1] = 0;//初始化
    que.push(P(0, 1));//将 1点 和 dis[1] = 0 放入队列
    while (que.empty() == false) {//队列不为空时
        P p = que.top();//取出队首
        que.pop();//删除
        int u = p.second;//
        if (vis[u] == true)//若此顶点已经加入生成树
            continue;//
        vis[u] = true;//否则，就标记为加入
        ans += dis[u];//
        count++;//加入点个数
        for (int i = head[u]; i != -1; i = edge[i].next) {//遍历与该点相邻的点
            node e = edge[i];
            if (dis[e.v] > e.w) {//更新他们的权值
                dis[e.v] = e.w;//
                que.push(P(dis[e.v], e.v));//放入队列
            }
        }
    }
    //输出
    if (count == n)
        printf("%d\n", ans);
    else
        printf("?\n");
}

int main() {
    int n, m;

    while (scanf("%d %d", &n, &m), n) {//边的个数 顶点个数
        memset(head, -1, sizeof(head));//初始化
        cnt = 0;//初始化
        while (n--) {
            int u, v, w;
            scanf("%d %d %d", &u, &v, &w);//获取数据
            add(u, v, w);//加边
            add(v, u, w);//无向图
        }
        prim(m);//普利姆算法
    }
    return 0;
}

主函数对数据的获取和图的存储

int main() {
    int n, m;

    while (scanf("%d %d", &n, &m), n) {//边的个数 顶点个数
        memset(head, -1, sizeof(head));//初始化
        cnt = 0;//初始化
        while (n--) {
            int u, v, w;
            scanf("%d %d %d", &u, &v, &w);//获取数据
            add(u, v, w);//加边
            add(v, u, w);//无向图
        }
        prim(m);//普利姆算法
    }
    return 0;
}

prim函数

void prim(int n) {//普利姆函数
    bool vis[VM];//标记是否访问过
    int dis[VM];//记录权值
    int ans = 0;//最小生成树的总值
    int count = 0;//计数
    priority_queue<P, vector<P>, greater<P> >que;//权值从小到大的队列

    fill(dis, dis + VM, INF);//初始化
    memset(vis, 0, sizeof(vis));//初始化
    dis[1] = 0;//初始化
    que.push(P(0, 1));//将 1点 和 dis[1] = 0 放入队列
    while (que.empty() == false) {//队列不为空时
        P p = que.top();//取出队首
        que.pop();//删除
        int u = p.second;//
        if (vis[u] == true)//若此顶点已经加入生成树
            continue;//
        vis[u] = true;//否则，就标记为加入
        ans += dis[u];//
        count++;//加入点个数
        for (int i = head[u]; i != -1; i = edge[i].next) {//遍历与该点相邻的点
            node e = edge[i];
            if (dis[e.v] > e.w) {//更新他们的权值
                dis[e.v] = e.w;//
                que.push(P(dis[e.v], e.v));//放入队列
            }
        }
    }
    //输出
    if (count == n)
        printf("%d\n", ans);
    else
        printf("?\n");
}

此算法的时间复杂度为O(E*log(V)); 是不是很棒！

次算法结束。

4、克鲁斯卡尔算法

　　克鲁斯卡尔算法就是利用了并查集这一方法，通过对所有边从小到大排序后，判断这两个顶点是否在一个分组中，若在一个分组中，说明这两个点已经加入到生成树之中，若不在一个分组中

就可以直接加上这个边了。

　　还是以上一题为例

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#include <queue>
#define LL long long

using namespace std;

const int INF = 1e9+7;
const int VM = 103;

struct node {//边的结构体
    int u, v, w;
};
node edge[VM * 2];
int rank[VM];//分组的高度
int par[VM];//父节点

bool cmp(const node &a, const node &b) {
    return a.w < b.w;//按w从小到大排序
}

int find(int x) {
    if (par[x] == x)//若根节点为本身
        return x;
    return par[x] = find(par[x]);//路径压缩
}

bool same(int x, int y) {//判断为否在同一分组中 
    return find(x) == find(y);
}

void unite(int x, int y) {
    x = find(x);//查找根节点
    y = find(y);//查找根节点
    if (x == y)//若以在同一分组
        return ;
    if (rank[x] < rank[y])//y所在分组的高度 大于x的
        par[x] = y;//将y作x的父节点。
    else {
        par[y] = x;//将x作为y的父节点
        if (rank[x] == rank[y])//若两个分组高度相同
            rank[x]++;//x分组所在高度++
    }
}

int main() {
    int n, m;

    while (scanf("%d %d", &n, &m), n) {//获取边的个数 和顶点个数
        int cnt = 0;//
        for (int i = 1; i <= m; i++)//初始化
            par[i] = i;
        memset(rank, 0, sizeof(rank));//初始化
        while (n--) {
            scanf("%d %d %d", &edge[cnt].u, &edge[cnt].v, &edge[cnt].w);//获取数据
            cnt++;
        }
        sort(edge, edge + cnt, cmp);//按权值从小到大排序
        int ans = 0;//最小生成树 权值
        int count = 0;//计数
        for (int i = 0; i < cnt; i++) {//对所有的边
            node e = edge[i];
            if (!same(e.u, e.v)) {//若两点不属于一个分组
                ans += e.w;//权值总和
                unite(e.u, e.v);//合并两点
                count++;//计数
            }
        }
        //输出
        if (count == m - 1)
            printf("%d\n", ans);
        else
            printf("?\n");
    }
    return 0;
}

    原文作者：拓扑排序
    原文地址: https://blog.csdn.net/u013486414/article/details/39007595
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。