最小生成树
定义
设 为一个连通无向带权图,其中:
- 是顶点集,
- 是边集,
- 是边权函数(赋予每条边一个实数权重)。
**生成树(Spanning Tree)**是 的一个子图 ,满足:
- 包含 的所有顶点(即顶点集与 相同);
- 是一棵树(连通、无环,且恰好有 条边)。
若生成树 的所有边权之和 在 的所有生成树中最小,则称 为 的 最小生成树。
补充说明
-
存在性:
当且仅当图 是连通图时,最小生成树存在。对于非连通图,可通过**最小生成森林(Minimum Spanning Forest)**覆盖各连通分量。 -
唯一性:
最小生成树不一定唯一。若图中存在多条权值相同的边,可能存在不同的最小生成树,但它们的边权总和必定相等。
Kruskal 算法
Kruskal 算法是一种常见并且好写的最小生成树算法,由 Kruskal 发明。该算法的基本思想是从小到大加入边,是个贪心算法。
前置知识
Kruskal算法基于并查集来实现。
实现
图示:
伪代码:
算法虽简单,但需要相应的数据结构来支持……具体来说,维护一个森林,查询两个结点是否在同一棵树中,连接两棵树。
抽象一点地说,维护一堆 集合,查询两个元素是否属于同一集合,合并两个集合。
其中,查询两点是否连通和连接两点可以使用并查集维护。
如果使用 的排序算法,并且使用 或 的并查集,就可以得到时间复杂度为 的 Kruskal 算法。
证明
思路很简单,为了造出一棵最小生成树,我们从最小边权的边开始,按边权从小到大依次加入,如果某次加边产生了环,就扔掉这条边,直到加入了 条边,即形成了一棵树。
证明:使用归纳法,证明任何时候 K 算法选择的边集都被某棵 MST 所包含。
基础:对于算法刚开始时,显然成立(最小生成树存在)。
归纳:假设某时刻成立,当前边集为 ,令 为这棵 MST,考虑下一条加入的边 。
如果 属于 ,那么成立。
否则, 一定存在一个环,考虑这个环上不属于 的另一条边 (一定只有一条)。
首先, 的权值一定不会比 小,不然 会在 之前被选取。
然后, 的权值一定不会比 大,不然 就是一棵比 还优的生成树了。
所以, 包含了 ,并且也是一棵最小生成树,归纳成立。
例题
口袋的天空
有 朵云,你要将它们连成 个棉花糖,将 云朵和 连接起来需要 的代价,求最小代价。
Prim 算法
Prim 算法是另一种常见并且好写的最小生成树算法。该算法的基本思想是从一个结点开始,不断加点(而不是 Kruskal 算法的加边)。
实现
图示:
具体来说,每次要选择距离最小的一个结点,以及用新的边更新其他结点的距离。
其实跟 Dijkstra 算法一样,每次找到距离最小的一个点,可以暴力找也可以用堆维护。
堆优化的方式类似 Dijkstra 的堆优化,但如果使用二叉堆等不支持 decrease-key 的堆,复杂度就不优于 Kruskal,常数也比 Kruskal 大。所以,一般情况下都使用 Kruskal 算法,在稠密图尤其是完全图上,暴力 Prim 的复杂度比 Kruskal 优,但 不一定 实际跑得更快。
暴力:。
二叉堆:。
Fib 堆:。
伪代码:
注意:上述代码只是求出了最小生成树的权值,如果要输出方案还需要记录每个点的 代表的是哪条边。
证明
从任意一个结点开始,将结点分成两类:已加入的,未加入的。
每次从未加入的结点中,找一个与已加入的结点之间边权最小值最小的结点。
然后将这个结点加入,并连上那条边权最小的边。
重复 次即可。
证明:还是说明在每一步,都存在一棵最小生成树包含已选边集。
基础:只有一个结点的时候,显然成立。
归纳:如果某一步成立,当前边集为 ,属于 这棵 MST,接下来要加入边 。
如果 属于 ,那么成立。
否则考虑 中环上另一条可以加入当前边集的边 。
首先, 的权值一定不小于 的权值,否则就会选择 而不是 了。
然后, 的权值一定不大于 的权值,否则 就是一棵更小的生成树了。
因此, 和 的权值相等, 也是一棵最小生成树,且包含了 。