最小树形图

问题引入

在带权无向图中，最小生成树是一个广为人知的问题。对应的，在有向图中，我们也可以定义有向生成树（Directed Spanning Trees，简称 DST）。在有向图 $G = (V,\ E)$ 中，我们选定一个生成树的根节点 $r$，以 $r$ 为根的有向生成树是图 $G$ 的一个子图 $T$，并且子图 $T$ 中 $r$ 到任意非 $r$ 节点 $u$ 的路径存在且唯一。根据树的定义，子图 $T$ 的形状就是一棵以 $r$ 为根的树，只不过所有的边都是从父亲指向儿子的有向边。所以也称为 “树形图”。

需要注意的是，并非图 $G$ 中任意一个节点都能成为某个 DST 的根。具体而言，必须要满足从 $r$ 出发能够到达其它的顶点。如果将图 $G$ 的所有强连通分量缩点，得到一张拓扑图，且拓扑图中只有一个入度为 $0$ 的点 $u$，则 $r$ 必须来自 $u$ 所代表的强连通分量中。

类比最小生成树，最小树形图就是带权有向图 $G = (V,\ E,\ w)$ 中边权总和最小的 DST，简称 MDST（Minimum DST）。虽然定义类似，但算法却不尽相同。因为在有向图中，给定 DST 的根 $r$，有一些边可能不能成为任何一个 DST 的树边。例如，在下面的左图中，以绿色节点为根，红色边是无法存在于任何一棵 DST 中的。当然，如果再加入其它边，它还是有机会进入某棵 DST 的，如右图所示。

invalid-edges

Fig.1. 无效边的示意图。蓝色边是树边。

这导致对于无向图的算法（Kruskal 算法、Prim 算法等等）都无法在有向图上算出最小树形图。

1965 年，朱永津和刘振宏 [1] 最先提出了最小树形图时间复杂度为 $\mathrm O(VE)$ 的算法。两年后，也就是 1967 年，Edmonds [2] 也独立发现了同样的算法。可能 Edmonds 名气比较大，现在英文资料里面关于这个算法的叫法总少不了 Edmonds 的名字 QAQ

算法流程

首先，DST 有一个特点：除根节点外，其它节点的入度为 $1$。此外，DST 是不存在环的。一个非常奇怪的想法就是，对于每个非根节点，选择入边中边权最小的。因为这样选择之后，如果图中没有环，不难发现就构成了一棵 DST，并且显然它的边权之和也是最小的，因此直接找到了 MDST。

当然现实没有那么美好，很大概率下，这样选择会出现环。现在来考虑其中的一个简单环 $C$，这个环上至少有一条边是不能选的。但可能还有更多的边在真正的 MDST 中也不能选？然而事实却非常巧，注意到环 $C$ 不是一般的环，它是由边权最小的入边组成的环。我们可以证明，存在一棵 MDST，其中环 $C$ 只有一条边被替换了。

cycle-example

Fig.2. 含有 $7$ 个点的环 $C$ 示意图。其中虚线边是不在 MDST 中的边，红色是其在 MDST 中被替换为的边。上图中，从根节点 $r$ 出发，到达 $v_2$，发现 $v_2 \rightarrow v_3$ 不在树中，之后将进行边的替换。

考虑任意一棵 MDST，设其树根为 $r$，环 $C$ 上的节点依次为 $v_1,\ v_2,\ \dots,\ v_n$。从根节点 $r$ 开始，在树上向环 $C$ 行走，至少能走到环 $C$ 上的一个点，不妨设其为 $v_1$，然后检查边 $v_1 \rightarrow v_2$ 是否在 MDST 中，如果有，就沿着这条边走到 $v_2$。如果没有，那么树上就有另外一条边 $u \rightarrow v_2$。首先，我们是从根节点一路走过来，所以 $v_1$ 不会是 $v_2$ 在树上的儿子，所以将边 $u \rightarrow v_2$ 更换为 $v_1 \rightarrow v_2$ 不会导致树上出现环，保证更换后依然是一棵树。其次，$v_1 \rightarrow v_2$ 是 $v_2$ 的入边中边权最小者，所以更换后 DST 的边权之和不会变大，故其也是 MDST。之后依次操作直到检查完 $v_{n - 1} \rightarrow v_n$ 为止，这时我们就保证了环 $C$ 上 $n - 1$ 条边都在 MDST 上了。

换句话说，我们可以只用考虑删去环 $C$ 的一条边的情况。想象一下，相当于环 $C$ 只有一条入边。这又与 DST 有相似之处。考虑将环 $C$ 缩成一个点，在得到的新图 $G'$ 中，图 $G'$ 中的一个 DST 可以对应我们所需要的考虑的一个 DST。这启发着我们进行一次递归的操作：假定原来我们选择了环 $C$ 中所有的边，但由于 DST 定义的要求，我们需要从中替换掉一条边 $e_1$，换成环 $C$ 外的一条边 $e_2$，此时边权之和会多增加 $w(e_2) - w(e_1)$。所以，将环 $C$ 缩为一个点 $c$ 时，设环 $C$ 中进入点 $x$ 的边为 $\mathrm{in}(x)$，对图 $G$ 中的所有边 $e:\ u \rightarrow v$ 作如下处理：

如果 $u,\ v \notin C$，即环外一条边，该边保持不变。
如果 $u,\ v \in C$，即内接在环上的一条边，将这条边删去。
如果 $u \in C$ 而 $v \notin C$，相当于从环 $C$ 出发的边，则将 $u$ 改为 $c$。
否则就是进入环 $C$ 的边，此时将 $v$ 改为 $c$，且边权变为 $w(e) - w(\mathrm{in}(v))$。

在得到的新图 $G'$ 中计算 MDST，得到 $T'$，根据 $T'$ 进入 $c$ 的边的 “前身” 就可以知道环 $C$ 中应该抛弃哪一条边了。将原图 $G$ 中的自环删去后，每次这样的操作至少可以减少一个点，所以总的时间复杂度为 $\mathrm O(VE)$。

快速实现

我们知道，无向图中最小生成树的时间复杂度取决与排序的复杂度，即 $\mathrm O(E \log E)$ 或比这更好的 $\mathrm O(E + V \log V)$。相比之下，之前的算法实在是太慢了。于是伟大的 Tarjan 老爷子 [3] 就出现了。Tarjan 在 1977 年提出了一个时间复杂度为 $\mathrm O(E \log V)$ 的实现，他将上述算法进行了调整，改成了一个迭代式的过程。算法开始时，选取图中任意一个点 $x_0$。想象一下这棵树从 $x_0$ 开始不断生长，每次从最末端 $x_{i-1}$ 找到一条还未使用过的 $x_{i-1}$ 的入边 $e:\ x_i → x_{i - 1}$，要求 $w(e)$ 是 $x_{i-1}$ 剩下入边的边权最小者。如果 $x_i$ 已经出现在之前的迭代中，那么意味着此时出现了一个环。按照之前算法的理论，我们可以将这个环缩起来。因此我们新建一个节点表示这个环，于是这个节点会将环上的所有点的入边都收集起来（注意每个点剩下的入边的边权要减去环上入边的边权），这里可以使用可并堆实现。之后将新建的节点放入末尾继续操作。如果原图是强连通的，那么最后只会剩下一个点，否则的话我们可以强行将所有点连成一个环，环上的边权为 $+\infin$，这样图就强连通了。上述算法实际上生成了一棵 contraction 树，树上的叶子是图的原始节点，此外每个非叶子节点都表示一个环，如下图所示：

tree-example

Fig.3. 左边是一个 $4$ 个点的强连通图，右边是算法完成后所给出的树结构。首先将环 $1 \rightarrow 2 \rightarrow 3 \rightarrow 1$ 缩为了点 $5$，然后将环 $5 \rightarrow 4 \rightarrow 5$ 缩为了点 $6$。这棵树展示了环与环之间嵌套的关系。

得到这棵树之后，我们就可以从任意合法的根节点开始展开整个 MDST 了。首先对于原图中的树根 $r$，在 contraction 树上从叶子 $r$ 到根的每个环都会被展开，并且起点为 $r$ 以及其祖先。另外由于每个环只会删掉一条边，因此所有被展开的环上的其它的点都可以递归地展开，直到所有叶子均被展开过一次为止，这个过程是线性的。~~我实现了朴素的 O(VE) 算法和 Tarjan 的快速算法，用 POJ 3164 测试了下，如果细节上有问题的可以参考一下：~~由于有人提出我之前写的 $\mathrm O(E \log V)$ 的版本 TLE 了，我自己也觉得写得比较丑 QAQ，所以最近又重写了一遍，这次是通过的 LOJ #140：提交记录 #578170。代码里用的是并查集和左偏树，常数似乎有点大，实测随机数据下在 $5×10^5$ 级别才跑赢了 LOJ 上的 rank1 QAQ

~~O(VE) 版本、O(E \log V) 版本~~

另外，我是看的 Uri Zwick 教授 [4] 的讲稿写的算法，里面的实现部分写的比较详细。

参考资料

[1]. Chu, Y. J.; Liu, T. H. (1965), On the Shortest Arborescence of a Directed Graph, Science Sinica, 14: 1396–1400
[2]. Edmonds, J. (1967), Optimum Branchings, J. Res. Nat. Bur. Standards, 71B: 233–240, doi:10.6028/jres.071b.032
[3]. R.E. Tarjan. (1977), Finding optimum branchings, Networks, 7:25–35
[4]. Uri Zwick. (2013), Directed Minimum Spanning Trees, Lecture notes on “Analysis of Algorithms”
[5]. H.N. Gabow, Z. Galil, T.H. Spencer, and R.E. Tarjan. (1986), Efficient algorithms for finding minimum spanning trees in undirected and directed graphs, Combinatorica, 6:109–122

最小树形图

问题引入

算法流程

快速实现

相关问题

参考资料