-
1 # 葉成流
-
2 # 機械視角
AI已經輕鬆攻克雙陸棋、國際跳棋、國際象棋、圍棋等棋類遊戲了,但至今為止(2019/08/16)還未有戰勝職業麻將選手的AI釋出,那麼為什麼小小的麻將那麼難攻克呢?
遊戲複雜度與遊戲難度並不等價遊戲難度除了與遊戲本身的複雜度有關以外,還與戰略等多種要素相關,也就是說,數學上更復雜的遊戲,玩起來不一定更難。
根據資訊的暴露程度將遊戲分為兩大類:完美資訊遊戲和不完美資訊遊戲。圍棋、象棋等棋類遊戲,對局雙方可以看到局面的所有資訊,屬於完美資訊遊戲;而撲克、橋牌、麻將等遊戲,雖然每個參與者都能看到對手打過的牌,但並不知道對手的手牌和遊戲的底牌,也就是說各個對局者所掌握的資訊是不對稱的,因此屬於不完美資訊遊戲。
完美資訊遊戲和不完美資訊遊戲難度的衡量指標通常是有區別的。對於完美資訊遊戲,通常遊戲的複雜度就決定了難度,可以用狀態空間複雜度和遊戲樹複雜度對其難度進行衡量;而對於不完美資訊遊戲,隱藏資訊對於遊戲的難度影響很大,可以用資訊集數目和資訊集平均大小對其難度進行衡量。
井字棋的遊戲樹複雜度為10^5 (即4^9≈10^5),國際象棋是10^123 (即35^80≈10^123),而圍棋是10^360 (即250^150≈10^360)。在傳統的完美資訊棋牌遊戲中,圍棋不管從狀態空間複雜度,還是遊戲樹複雜度上都遠遠領先其他棋牌類遊戲。2017年,AlphaZero 利用 MCTS 和深度強化學習,成功解決了包括圍棋在內的多個完美資訊遊戲。目前,學術界研究的熱點則轉向不完美資訊遊戲和即時策略遊戲等。
但在不完美資訊遊戲中,由於資訊是不完全(例如撲克和麻將中對手的手牌和遊戲剩餘的底牌都是未知的),因此對於參與者來說許多不同的遊戲狀態看起來是無法區分的。比如在撲克遊戲中,自己拿了兩張 A,對方拿了不同的牌對應不同的狀態;但是從自己的視角看,這些狀態其實是不可區分的。我們把每組這種無法區分的遊戲狀態稱為一個資訊集。對於不完美資訊遊戲而言,合理的遊戲策略應該建立在資訊集而不是遊戲狀態之上,因為我們依賴未知資訊來細粒度出招是沒有意義的。相應地,當我們衡量不完美資訊遊戲的難度的時候,也應該依據資訊集的數目,而不是遊戲狀態空間的大小。資訊集的數目通常小於狀態空間的數目。
除了資訊集的數目,還有一個重要的指標:資訊集的平均大小,即在資訊集中平均有多少不可區分的遊戲狀態。以兩人德州撲克為例,假定我們的手牌是 AA,考慮對手的手牌為 AK 或者 AQ 兩種不同情況。因為資訊不完全,我們無法區分當前局勢到底處在哪個狀態,因此會把兩種情況都歸到同一個資訊集。在兩人德州撲克中,資訊集的大小最多為1326(從52張牌中選擇2張:C_52^2),也就是約為10^3。容易看出,資訊集的數目反映了不完美資訊遊戲中所有可能的決策節點的數目,而資訊集的平均大小則反映了遊戲中每個局面背後隱藏資訊的數量。顯然,資訊集平均大小越大,其中包含的未知資訊就越多,因此決策的難度就越高。事實上,資訊集的平均大小直接影響採用搜尋演算法的可行性:當對手的隱藏狀態非常多時,傳統的搜尋演算法基本上是無從下手的。因此資訊集的平均大小也可以作為遊戲難度的衡量指標。
那麼根據上面兩個指標來看,麻將的難度到底有多大呢?
每一局麻將結束的時候,底下有14張牌不會被用到,所以不考慮吃碰槓的情況下,每一局至多會進行17.5輪(136減去13x4共52張手牌再減去14張底牌,總共剩70張牌,每一輪出4張)。與橋牌類似,依然按照遊戲輪次來計算。第一輪,每個玩家只能看到自己的13張牌,因此第一輪資訊集數目為C_136^13(為了計算方便,不考慮重複手牌)。第二輪,由於第一輪每個玩家各出一張牌,一副麻將總共有34種不同的牌,所以第一輪出的四張牌所有可能的情況至多為34^4,因此第二輪資訊集數目為C_136^13 ∙34^4。以此類推,第18輪資訊集數目為C_136^13 ∙34^68。總的資訊集數目為各輪資訊集的和,即C_136^13 (1+34^4+⋯+34^68)≈7×10^121。
第一輪,除去自己13張手牌,總共剩餘123張牌,每位對手13張牌,所以每個資訊集大小為C_123^13 C_110^13 C_97^13(為了計算方便,不考慮重複手牌)。第二輪,除去自己13張手牌,以及第一輪出的四張牌,總共剩餘119張牌,因此每個資訊集大小為C_119^13 C_106^13 C_93^13。以此類推,第18輪,每個資訊集大小為C_55^13 C_42^13 C_29^13。對每一輪的資訊集大小求平均,得到麻將的資訊集平均大小≈1.07×10^48。
[1]L.V. Allis, Searching for solutions in games and artificial intelligence, Ph.D.Thesis, University of Limburg, Maastricht, 1994.
[2]van den Herik, H., Uiterwijk, J. W. & van Rijswijck, J. Games solved: now and in the future. Artif. Intell. 134, 277–311 (2002).
[3]Game Complexity I: State-Space & Game-Tree Complexities
https://www.pipmodern.com/feed/state-space-game-tree-complexity
[4]Game Complexity III: Artificial Intelligence
https://www.pipmodern.com/feed/complexity-artificial-intelligence
[5]M. Johanson, Measuring the size of large no-limit poker games, Technical Report TR13-01, Department of Computing Science, University of Alberta (2013).
[6]Wiki: Game complexity
https://en.wikipedia.org/wiki/Game_complexity
-
3 # 葉成流
在某些純邏輯方面無疑會超過人類,但是也正是邏輯的過於正確毫無偏差的發展模式,會導致某些領域也許永遠比不過人類吧。
但是我覺得如果以宇宙發展過程,談智慧這樣東西,真的不能以人類角度判斷成果,嗯,就是這樣。
-
4 # 機械視角
AI已經輕鬆攻克雙陸棋、國際跳棋、國際象棋、圍棋等棋類遊戲了,但至今為止(2019/08/16)還未有戰勝職業麻將選手的AI釋出,那麼為什麼小小的麻將那麼難攻克呢?
遊戲複雜度與遊戲難度並不等價遊戲難度除了與遊戲本身的複雜度有關以外,還與戰略等多種要素相關,也就是說,數學上更復雜的遊戲,玩起來不一定更難。
根據資訊的暴露程度將遊戲分為兩大類:完美資訊遊戲和不完美資訊遊戲。圍棋、象棋等棋類遊戲,對局雙方可以看到局面的所有資訊,屬於完美資訊遊戲;而撲克、橋牌、麻將等遊戲,雖然每個參與者都能看到對手打過的牌,但並不知道對手的手牌和遊戲的底牌,也就是說各個對局者所掌握的資訊是不對稱的,因此屬於不完美資訊遊戲。
完美資訊遊戲和不完美資訊遊戲難度的衡量指標通常是有區別的。對於完美資訊遊戲,通常遊戲的複雜度就決定了難度,可以用狀態空間複雜度和遊戲樹複雜度對其難度進行衡量;而對於不完美資訊遊戲,隱藏資訊對於遊戲的難度影響很大,可以用資訊集數目和資訊集平均大小對其難度進行衡量。
井字棋的遊戲樹複雜度為10^5 (即4^9≈10^5),國際象棋是10^123 (即35^80≈10^123),而圍棋是10^360 (即250^150≈10^360)。在傳統的完美資訊棋牌遊戲中,圍棋不管從狀態空間複雜度,還是遊戲樹複雜度上都遠遠領先其他棋牌類遊戲。2017年,AlphaZero 利用 MCTS 和深度強化學習,成功解決了包括圍棋在內的多個完美資訊遊戲。目前,學術界研究的熱點則轉向不完美資訊遊戲和即時策略遊戲等。
但在不完美資訊遊戲中,由於資訊是不完全(例如撲克和麻將中對手的手牌和遊戲剩餘的底牌都是未知的),因此對於參與者來說許多不同的遊戲狀態看起來是無法區分的。比如在撲克遊戲中,自己拿了兩張 A,對方拿了不同的牌對應不同的狀態;但是從自己的視角看,這些狀態其實是不可區分的。我們把每組這種無法區分的遊戲狀態稱為一個資訊集。對於不完美資訊遊戲而言,合理的遊戲策略應該建立在資訊集而不是遊戲狀態之上,因為我們依賴未知資訊來細粒度出招是沒有意義的。相應地,當我們衡量不完美資訊遊戲的難度的時候,也應該依據資訊集的數目,而不是遊戲狀態空間的大小。資訊集的數目通常小於狀態空間的數目。
除了資訊集的數目,還有一個重要的指標:資訊集的平均大小,即在資訊集中平均有多少不可區分的遊戲狀態。以兩人德州撲克為例,假定我們的手牌是 AA,考慮對手的手牌為 AK 或者 AQ 兩種不同情況。因為資訊不完全,我們無法區分當前局勢到底處在哪個狀態,因此會把兩種情況都歸到同一個資訊集。在兩人德州撲克中,資訊集的大小最多為1326(從52張牌中選擇2張:C_52^2),也就是約為10^3。容易看出,資訊集的數目反映了不完美資訊遊戲中所有可能的決策節點的數目,而資訊集的平均大小則反映了遊戲中每個局面背後隱藏資訊的數量。顯然,資訊集平均大小越大,其中包含的未知資訊就越多,因此決策的難度就越高。事實上,資訊集的平均大小直接影響採用搜尋演算法的可行性:當對手的隱藏狀態非常多時,傳統的搜尋演算法基本上是無從下手的。因此資訊集的平均大小也可以作為遊戲難度的衡量指標。
那麼根據上面兩個指標來看,麻將的難度到底有多大呢?
每一局麻將結束的時候,底下有14張牌不會被用到,所以不考慮吃碰槓的情況下,每一局至多會進行17.5輪(136減去13x4共52張手牌再減去14張底牌,總共剩70張牌,每一輪出4張)。與橋牌類似,依然按照遊戲輪次來計算。第一輪,每個玩家只能看到自己的13張牌,因此第一輪資訊集數目為C_136^13(為了計算方便,不考慮重複手牌)。第二輪,由於第一輪每個玩家各出一張牌,一副麻將總共有34種不同的牌,所以第一輪出的四張牌所有可能的情況至多為34^4,因此第二輪資訊集數目為C_136^13 ∙34^4。以此類推,第18輪資訊集數目為C_136^13 ∙34^68。總的資訊集數目為各輪資訊集的和,即C_136^13 (1+34^4+⋯+34^68)≈7×10^121。
第一輪,除去自己13張手牌,總共剩餘123張牌,每位對手13張牌,所以每個資訊集大小為C_123^13 C_110^13 C_97^13(為了計算方便,不考慮重複手牌)。第二輪,除去自己13張手牌,以及第一輪出的四張牌,總共剩餘119張牌,因此每個資訊集大小為C_119^13 C_106^13 C_93^13。以此類推,第18輪,每個資訊集大小為C_55^13 C_42^13 C_29^13。對每一輪的資訊集大小求平均,得到麻將的資訊集平均大小≈1.07×10^48。
[1]L.V. Allis, Searching for solutions in games and artificial intelligence, Ph.D.Thesis, University of Limburg, Maastricht, 1994.
[2]van den Herik, H., Uiterwijk, J. W. & van Rijswijck, J. Games solved: now and in the future. Artif. Intell. 134, 277–311 (2002).
[3]Game Complexity I: State-Space & Game-Tree Complexities
https://www.pipmodern.com/feed/state-space-game-tree-complexity
[4]Game Complexity III: Artificial Intelligence
https://www.pipmodern.com/feed/complexity-artificial-intelligence
[5]M. Johanson, Measuring the size of large no-limit poker games, Technical Report TR13-01, Department of Computing Science, University of Alberta (2013).
[6]Wiki: Game complexity
https://en.wikipedia.org/wiki/Game_complexity
回覆列表
在某些純邏輯方面無疑會超過人類,但是也正是邏輯的過於正確毫無偏差的發展模式,會導致某些領域也許永遠比不過人類吧。
但是我覺得如果以宇宙發展過程,談智慧這樣東西,真的不能以人類角度判斷成果,嗯,就是這樣。