我在想什么时候应该用Prim的算法,什么时候用Kruskal的算法来寻找最小生成树?它们都有简单的逻辑,同样的最坏情况,唯一的区别是实现可能涉及一些不同的数据结构。那么决定因素是什么呢?


当前回答

Kruskal's的最佳时间是O(elogv)。对于Prim使用fib堆,我们可以得到O(E+V lgV)。因此,在密集图上,Prim的效果要好得多。

其他回答

如果我们中途停止算法,prim的算法总是生成连接的树,而kruskal的算法可以给出连接的树或森林

我在网上找到了一个很好的帖子,以非常直接的方式解释了两者的区别:http://www.thestudentroom.co.uk/showthread.php?t=232168。

Kruskal的算法将通过添加下一个最便宜的边来从最便宜的边增长一个解,前提是它不创建一个循环。

Prim的算法将通过添加下一个最便宜的顶点来从一个随机顶点增长一个解,这个顶点目前不在解中,但通过最便宜的边连接到它。

这里附上了一份关于这个主题的有趣的表格。

如果你同时实现Kruskal和Prim,以它们的最佳形式:分别使用联合查找和finbonacci堆,那么你会注意到Kruskal与Prim相比是多么容易实现。

Prim使用fibonacci堆比较困难,主要是因为您必须维护一个簿记表来记录图节点和堆节点之间的双向链接。而Union Find则恰恰相反,它的结构很简单,甚至可以直接生成mst,几乎没有额外的成本。

我知道你没有要求这样做,但如果你有更多的处理单元,你应该总是考虑bornikolvka的算法,因为它可能很容易并行化——因此它比Kruskal和Jarník-Prim算法有性能优势。

Kruskal算法的一个重要应用是单链聚类。

考虑n个顶点,你就有了一个完整的图。得到这n个点组成的k个簇。在已排序边集的前n-(k-1)条边上运行Kruskal算法。你得到了具有最大间距的图的k个簇。

克鲁斯卡尔时间复杂度最坏情况是O(eloge)这是因为我们需要对边排序。 Prim时间复杂度最坏的情况是O(E log V)优先队列,甚至更好的情况是O(E+V log V)斐波那契堆。 我们应该使用Kruskal当图是稀疏的,即少量的边,如E=O(V),当边已经排序或如果我们可以在线性时间内排序。 当图是密集的,即边的数量很高时,我们应该使用Prim,如E=O(V²)。