Spanning Tree

程度★ 難度★

Spanning Tree

中譯「生成樹」,從一張圖上分離出一棵包含圖上所有點的樹,便是這張圖的生成樹。一張圖的生成樹可能會有很多種。

生成樹也可以有權重。當圖上每條邊都有權重時,生成樹的權重為樹上每條邊的權重總和。

Minimum Spanning Tree(MST)

中譯「最小生成樹」。權重最小的生成樹就是最小生成樹。一張圖的最小生成樹可能會有很多種。

無向圖的最小生成樹亦有人稱Minimum Cost Spanning Tree,中譯「最小成本生成樹」。有向圖的最小生成樹亦有人稱Minimum Arborescence、Optimum Branchings,中文網路上有人稱呼為「最小樹形圖」。

延伸閱讀:Spanning Forest

當一張圖是完全連通的時候,必然有生成樹。當一張圖有部份不連通的時候,則沒有生成樹,但還是會有許多棵「生成子樹」所構成的「生成森林」。就宛如DFS tree與DFS forest的關係一樣。

延伸閱讀:經典生成樹問題

Minimum (Cost) Spanning Tree (P)
權重最小的生成樹。

Minimum Bottleneck Spanning Tree (P)
權重最大的邊,使其權重最小的生成樹。
【註:此處Bottleneck定義為權重最大的邊。】

Minimum Diameter Spanning Tree (P)
直徑最短的生成樹。

Maximum Leaf Spanning Tree (NP-hard)
葉子最多的生成樹。

Minimum Degree Spanning Tree (NP-hard)
度數最多的點,使其度數最少的生成樹。

Minimum Routing (Cost) Spanning Tree (NP-hard)
所有兩點之間路徑,權重總和最小的生成樹。

Minimum Ratio Spanning Tree (NP-hard)
有兩種權重,分開計算。兩種權重比值最小的生成樹。
Minimum k-Spanning Tree (NP-hard)
權重最小的生成子樹,生成子樹剛好是k個點。

Steiner Tree (NP-hard)
權重最小的生成子樹,生成子樹剛好是給定的k個點。
DFS Tree (P)
使用 Depth-first Search 找到的無向(有向)生成樹。

BFS Tree (P)
使用 Breadth-first Search 找到的無向(有向)生成樹。

Shortest Path Tree (P)
樹根到樹上各點都是最短路徑的無向(有向)生成樹。

Minimum Cut Tree (P)
任意兩點間路徑的瓶頸,形成兩點間最小割的無向生成樹。

Minimum Spanning Tree: Prim's Algorithm

程度★ 難度★★

用途

求出無向圖的其中一棵最小(大)生成樹。

演算法

和Dijkstra's Algorithm的概念相同,請參考「Shortest Path: Dijkstra's Algorithm」。

主要的差異是:Dijkstra's Algorithm屢次找不在樹上、離根最近的點,Prim's Algorithm屢次找不在樹上、離樹最近的點。

另外一個差異是:最短路徑樹會有特定起點,而最小生成樹可以選定任何一點作為樹根。

時間複雜度

圖的資料結構為adjacency matrix的話,便是O(V^2);圖的資料結構為adjacency lists的話,還是O(V^2)。

© 2010 tkcn. All rights reserved.

UVa 10034 10147 10307 10397 10600 10842

Minimum Spanning Tree: Kruskal's Algorithm

程度★ 難度★★

用途

求出無向圖的其中一棵最小(大)生成樹。若是圖不連通,則是求出其中一叢最小(大)生成森林。

演算法

一、兩棵MST,要合併成一棵MST時,以兩棵MST之間權重最小的邊進行連結,當然會是最好的。

二、三棵MST,要合併成一棵MST時,先連結其中兩棵連結權重最小的MST,然後才連結第三棵,總是比較好。

三、一個單獨的點,可以視作一棵MST。

由以上三點,可以歸納出一個greedy方法:以權重最小的邊連結各棵MST,一定比較好。

一、一開始圖上每一個點,各自是一棵最小生成子樹MSS。
二、將圖上所有邊依照權重大小,由小到大排序。
三、依序嘗試這些邊作為MST上的邊,直到完成MST。
 甲、每次選中的邊都必須是目前權重最小的邊:
   排序過就沒問題了。
 乙、每次選中的邊都必須是連接兩棵MSS的邊:
   如果目前選到的這條邊,會讓目前的MSS產生環,則捨棄。

每次選中的邊,都是MST上的邊。沒有選中的邊,不論這張圖以後又增加了多少邊,絕不會成為MST上的邊。

時間複雜度

排序圖上所有邊需時O(ElogE)。逐條邊建立MST,並且判斷環,可以利用「Disjoint Sets」,需時O(E*α(E))。故整體的時間複雜度為O(ElogE)。

迴圈的部份也可以寫成這樣。

UVa 908 10369 10462 10807

Minimum Spanning Tree: Borůvka's Algorithm

程度★ 難度★★

用途

求出無向圖的其中一棵最小(大)生成樹。若是圖不連通,則是求出其中一叢最小(大)生成森林。

演算法

換湯不換藥,與Kruskal's Algorithm理念相同,只是Borůvka一次選許多條邊。

一、一開始圖上每一個點,各自是一棵最小生成子樹MSS。
二、重複以下步驟,直到形成最小生成樹(森林):
 甲、每棵MSS同時找權重最小的聯外邊
   (即是MSS與MSS之間的邊,而不是MSS之內的邊),
   與其他MSS相互連接,成為更大棵的MSS。
   這個動作在無向圖中絕對不會形成環。

時間複雜度

每個步驟中,每棵MSS同時各自找權重最小的聯外邊,用各棵MSS的樹根進行Graph Traversal即可解決,MSS之內的邊會拜訪一次,MSS之間的邊會拜訪兩次,圖上各點拜訪一次至兩次。整體算起來,每個步驟所需時間,介於一到二次Graph Traversal之間。

每棵MSS相互連接,最差的情況是兩兩互接,MSS總數量僅下降一半,所以運氣不好時需要logV個步驟。

故總時間複雜度為O(logV)次Graph Traversal的時間。當圖上的邊為隨機分布時,時間複雜度是一次Graph Traversal的時間。

Directed Minimum Spanning Tree

程度★★ 難度★★★

前情提要

直接套用無向圖的演算法,會發現邊的方向亂七八糟,無法形成有向樹。

在無向圖當中,兩棵MST,要合併成一棵MST時,以兩棵MST之間權重最小的邊進行連結,會是最好的。但是在有向圖當中,連接兩棵有向樹,不一定會形成有向樹。

想法

http://www.ce.rit.edu/~sjyeec/dmst.html

生成樹的基本概念是:連接圖上各點的樹。從這個概念下手,引用先前Borůvka's Algorithm的概念,然後考慮邊的方向性,就想到兩個粗糙的演算法:

有向圖上,每一個點,如果要被連接到,都要至少有一條出邊,除了樹葉以外。
每一個點,找權重最小的出邊,會比較好。
有向圖上,每一個點,如果要被連接到,都要剛好有一條入邊,除了樹根以外。
每一個點,找權重最小的入邊,會比較好。

入邊只需要用到一條,樹根也只有一個,所以從入邊下手是比較容易的。樹根是個例外;我們可以暫且假定我們已經知道最小生成樹的樹根是哪個點,就不必顧慮例外,事情就更好辦了。

檢驗想法

緊接著,我們要審視這個想法還有沒有例外。

運氣好的時候,每個點權重最小的入邊,剛好形成一棵生成樹,那麼這一定是最小生成樹。

運氣普通的時候,依照Kruskal's Algorithm的經驗,每個點權重最小的入邊,很有可能形成環。

水母(沒有正式名稱,因為像水母就把它叫做水母)

由於每個點僅有一條入邊,一旦入邊們形成環,此環一定只有多餘出邊,沒有多餘入邊──形成一個像是太陽、或者說是水母的圖。水母可以看做是很多棵樹,然後用一只環串起樹根。

把水母改裝成最小生成樹

每個點權重最小的入邊,一般狀況下可能會形成許多隻水母。最小生成樹不得有環,所以水母是不合格的。

水母是權重最小的連接方式,最小生成樹的權重一定是略高、等高於水母。如此便產生一個策略:嘗試拆除水母的某一條邊,並且更改為另一條邊。雖然很可能增加整體權重,但是也有機會成為最小生成樹了。

一、更改水母腳的邊:
  不但增加整體權重,而且水母環仍舊存在。之後沒有更好。
二、更改水母環的邊:
 甲、新邊是自身水母環的弦:形成一個更小的水母環。之後沒有更好。
 乙、新邊是由自身水母腳連來:形成一個更大的水母環。
 丙、新邊是由其他水母連來:自身水母環消失,變成其他水母的腳。

乙、原本水母環上的邊,之後仍可更改,所以先改後改都沒差,所以先行更改整體權重增加最少的邊,一定比較好。

丙、既然水母環會消失,更改整體權重增加最少的邊,顯然比較好。

結論:只需要更改水母環的邊,而且要讓整體權重增加最少。

演算法:給定樹根的有向最小生成樹(Chu-Liu/Edmonds Algorithm)

把進入水母環的邊,全部看過一遍,就能找到權重增加最少的新邊。另外,把看過的新邊,直接修改成權重增加量,並且收縮水母環;如此一來,只要是看過的新邊,就不用看第二遍了,可以降低時間複雜度。

一、刪去所有自己連向自己的邊。
二、移除樹根的全部入邊。
三、判斷樹根能不能連到圖上各個點,否則生成樹不存在。
四、重複以下步驟,直到形成生成樹為止:
 甲、每一個點,找出權重最小的入邊。O(E)
 乙、找出所有水母。如果沒有水母就表示目前已是最小生成樹。O(V)
 丙、調整進入水母環的邊的權重。O(E)
   w(a, x) -= w(å, x),
   x是水母環上一點。
   åx是x點的最小入邊,也是水母環上的邊。
   ax為其他地方連入x點的邊。
 丁、收縮水母環成為一點。O(E)

時間複雜度:給定樹根的有向最小生成樹

最糟的情況是每個步驟中剛好產生一直水母環有兩個點的水母,水母環進行收縮後,整張圖只減少一個點。所以最多收縮V-1次水母環。每次皆以Graph Traversal找出每個點的最小入邊,因此整體的時間複雜度為O(VE)。

採用更困難的實作方式,時間複雜度還可以達到O(V^2)、O(ElogV)、O(E+VlogV)。實作方式是一直線地往回找入邊,每當形成環,就調整權重並縮環。粗略的時間複雜度分析如下:

一、每個點最多走一次。O(V)
二、最多縮環V-1次(兩點縮成一點),收縮之後出現的新點,最多走V-1次。O(V)
三、縮環時,環上的點會額外重覆走一次。由一與二可知道是O(2V)。
四、由一可知,每些點對應的入邊,最多都被掃過一次。O(E)
  由二可知,每些點對應的入邊,最多都被掃過一次。O(E)
  由三可知,也是一樣。O(2E)
五、縮環採用Disjoint-set Forest,時間複雜度為O(α(E))。
  由三可知,可以降低成常數。

實作:給定樹根的有向最小生成樹

O(VE)的實作。

UVa 11183

演算法:有向最小生成樹

一、額外建立一個點,作為樹根。
二、額外建立樹根到圖上各點的邊,權重設定為非常大的值。
三、求出給定樹根的最小生成樹。
  如果用到兩條以上的新邊,則生成樹不存在。

無向生成樹 v.s. 有向生成樹

根據Kruskal's Algorithm提到的最小生成樹相連性質,可以知道連接多隻水母,就和連接多棵最小生成樹的道理是一樣的,以權重小的邊來連接是最好的。唯一不同的是,Kruskal's Algorithm一旦發現造成環的邊,就直接捨棄;Chu-Liu/Edmonds Algorithm則是留下造成環的邊(形成水母),並且嘗試各種打開環的方式:有時候增大水母環,有時候兩隻水母連接成為一隻水母。

Minimum Bottleneck Spanning Tree

程度★★ 難度★

註記

一張圖上、一棵生成樹上、一條路徑上,權重最小的邊,稱作「瓶頸」。

然而,為了前後文連貫,此處將定義更改為權重最大的邊。古早人也是如此定義。

Minimum Bottleneck Spanning Tree

一張無向圖的所有生成樹當中,權重最大的邊(瓶頸),其權重最小的生成樹,稱作「最小瓶頸生成樹」,可能有許多棵。

一個簡單的方式,是以最小生成樹MST,作為最小瓶頸生成樹MBST。

Kruskal's Algorithm造就MST的最後一條邊,就是瓶頸。

證明

既然膽敢宣稱MST是MBST,那麼也許MST與MBST當中有些相近的性質。有時不妨率由舊章,以現有的MST性質,推定未知的MBST性質。大膽假設、小心求證,不然只怕是東施效顰。

MST有著一個關鍵性質:以權重最小的邊,連接兩棵MST,可以構成一棵MST。依樣畫葫蘆,MBST或許也有著一個關鍵性質:以權重最小的邊,連接兩棵MBST,可以構成一棵MBST。

此處用中文囉哩囉嗦證明之。若用數學式子,也許只消兩行:

甲、連接的邊,權重大於等於原本兩棵MBST的瓶頸權重,則會成為新樹的瓶頸。由於選擇了權重最小的邊當作連接的邊,連接的邊又是新樹的瓶頸,新樹的瓶頸權重當然也最小──新樹是一棵MBST。

乙、連接的邊,權重小於原本兩棵MBST的瓶頸權重,則不會成為新樹的瓶頸。新樹的瓶頸由原本兩棵MBST的瓶頸二選一,選權重大的那個成為新樹的瓶頸。因為原本兩棵MBST的瓶頸權重已經最小了,新樹的瓶頸權重當然也最小──新樹是一棵MBST。

新性質是正確的!由於MST和MDST都可以用權重最小的邊構造而得,因此在每一種MST演算法當中,每個步驟的MST也隨時是MBST。

儘管MST一定是MBST,但是小心MBST不見得是MST。儘管兩棵MBST以權重最小的邊相連,一定是一棵MBST,但是一棵MBST移除權重最大的邊,不見得是兩棵MBST。

演算法

事實上MBST有一個O(V+E)的演算法。

一、二分搜尋法,搜尋圖上所有邊的權重,找出MBST的瓶頸。
  二分時,採用O(N)的中位數演算法。
二、每枚舉一個瓶頸,權重小於等於瓶頸的邊,皆可作為生成樹。
 甲、掃描一次,找出權重小於等於瓶頸的邊。
 乙、Graph Traversal,判斷圖上各點是否連通。
   若連通,則此瓶頸定可形成生成樹。反之則無法形成生成樹。
 丙、連通的點,合併為一點。以後就不需要重新遍歷了。
三、若要構造生成樹,在乙步驟,去掉形成環的邊(back edge)即可。
  MST與MBST相異之處就在於:
  MBST可以去掉環上任意一條邊,MST必須去掉環上權重最大的邊。

最小生成樹與 v.s. 最小割樹

最小生成樹:任意兩點之間的路徑,最寬的邊盡量窄。
最小割樹:任意兩點之間的所有通道,最寬的切面盡量窄。

UVa 11603 10816 ICPC 4848

延伸閱讀:Minimum Bottleneck Path

一張無向圖上,兩點之間的所有路徑當中,瓶頸權重最小的一條路徑,稱作「最小瓶頸路徑」,可能有許多條。

最小生成樹上的所有路徑,都是原圖的最小瓶頸路徑。證明方式同前,只是把生成樹改成了路徑。

如果需要所有兩點之間的最小瓶頸路徑的其中一個瓶頸,則可以使用DP:從長度為一的最小瓶頸路徑開始,逐步推導出更長的最小瓶頸路徑。O(V^2)時間建表、O(1)時間查詢。

亦可利用「Lowest Common Ancestor」。O(VlogV)時間建表、O(logV)時間查詢。

有向圖的情況,就請讀者自行研究了。最簡單的作法是修改最短路徑演算法。

UVa 11354

延伸閱讀:Second-best Minimum Spanning Tree

一張無向圖,權重最接近最小生成樹的另一棵生成樹,稱作「次小生成樹」。有可能與最小生成樹權重相等。

一、先求出一棵最小生成樹。
二、求出樹上所有兩點ij之間,權重最大的邊(瓶頸)。記為E(i,j)。
  (恰好是所有兩點間最小瓶頸路徑。)
三、窮舉每一條不在最小生成樹上的邊pq:
 甲、把邊pq添加到最小生成樹上,勢必形成環。
 乙、然後拆除邊E(p,q),勢必又形成樹,此樹權重已然盡量少。
 丙、記下此樹。
四、剛剛得到的E-(V-1)棵樹之中,權重最小者便是次小生成樹。

一與二各有數種演算法,時間複雜度也跟著改變。

UVa 10462

Minimum Diameter Spanning Tree

程度★★ 難度★

最小直徑生成樹

一張無向圖的所有生成樹當中,直徑最小的生成樹,可能有許多棵。

目前尚未有直接的演算法。目前是以絕對中心當作起點的最短路徑樹SPT,作為最小直徑生成樹MDST。關於絕對中心與最短路徑樹,可參考「Center, Absolute Center」。

證明(Hassin & Tamir, 1995)

證明很簡單。在原論文中,證明過程可以寫成五行數學式子,閒來無事不妨朝聖一下。以下則是講得詳細一點:

甲、絕對中心的偏心距是最小的,位於SPT的直徑中央。半徑(偏心距)最短,所以直徑也是最短。把直徑拉成一直線來看,就清楚多了。

d(c, x) = d(c, y)

因為 d(c, x) 會盡量小,所以 2 * d(c, x) = d(c, x) + d(c, y) 也會盡量小。

乙、絕對中心的SPT上面隨便一條路徑,都小於等於直徑長度。把路徑藉由絕對中心切成兩段,就清楚多了。

  d(p, q)
= d(c, p) + d(c, q)
≤ d(c, x) + d(c, y)   切成兩條,分別PK。
  d(i, j)
≤ d(c, i) + d(c, j)   切成兩條,分別PK。
≤ d(c, y) + d(c, y)

最短路徑樹不見得是最小直徑生成樹

各位也可以思考一下,為什麼絕對中心的SPT才是MDST,而一般中心的SPT並不見得是MDST。

G:
    0
   /|\
  / | 1
 /  |  \
4---3---2---5

MDST:
    0
    |
    | 1
    |  \
4---3---2---5

SPT, source is 0:
    0
   /|\
  / | 1
 /  |  \
4   3   2---5

SPT, source is 1:
    0
   /|\
  / | 1
 /  |  \
4   3   2---5

SPT, source is 2:
    0
     \
      1
       \
4---3---2---5

SPT, source is 3:
    0
    |\
    | 1
    |
4---3---2---5

SPT, source is 4:
    0
   / \
  /   1
 /
4---3---2---5

SPT, source is 5:
    0
     \
      1
       \
4---3---2---5

可以看到MDST的直徑長度是3,而SPT的直徑長度都是4和5。
也就是說,一般中心的SPT不一定就是MDST。

UVa 10805

最小直徑最小成本生成樹

要找到一棵生成樹,要同時滿足直徑與權重最小,已經被證明是NP-Complete問題。

Minimum Ratio Spanning Tree

程度★★ 難度★

用途

求出一張圖的其中一棵最小(大)比率生成樹。

演算法

等同於最小比率環演算法原理。

一、設定一比率r後,把原圖轉換成新圖,除法轉換成差值。
二、新圖上一棵權重為零的生成樹,就是原圖上一棵比率為r的生成樹。
  新圖上一只零環,就是原圖上一只比率為r的環。
三、當新圖上有一棵負權重的生成樹,表示這棵樹比率比r小:
 甲、比率設更小,設成r'之後,
   這棵樹就可以變成零權重生成樹,就是原圖上比率為r'的生成樹。
   找到了一棵比率更小的生成樹。
 乙、至於要找一棵負權重的生成樹,直接找最小生成樹就行了。

時間複雜度

求O(logR)次的最小生成樹時間。

其他Spanning Tree

程度★★ 難度★

Minimum k-Spanning Tree

k-Spanning Tree是一棵剛好有k個點的生成子樹。求出權重最小的、剛好有k個點的生成子樹,是NPC問題。

Steiner Tree

在一張無向圖上選定k個點,然後用圖上的邊連接這k個點,選到的邊的總權重越小越好。

為了減少權重,當然要儘可能的去掉多餘的邊,所以這張子圖一定不會出現環,這張子圖會是一棵樹。

要求出Steiner Tree是NPC問題。

特殊情況:
當k = 1時,Steiner Tree就是一個點。
當k = 2時,Steiner Tree就是此兩點間最短路徑。
當k = V時,Steiner Tree就是最小生成樹。

http://www.prefield.com/algorithm/dp/steiner_tree.html

Degree-Constrained Minimum Spanning Tree

每個點限制連接邊數上限的最小生成樹。是NPC問題。當上限規定為兩條邊時,會成為Hamilton Path。

UVa 10605

Count Spanning Trees

程度★★★ 難度★★★

Matrix Tree Theorem

Laplacian matrix的任意一個cofactor,其絕對值大小就是各種生成樹的總數目。

證明:不要問,很恐怖。

UVa 10766 SPOJ 2670