Deepmind2017年12月6日發表了新論文,宣佈AlphaZero (更通用的程式)學習24小時擊敗了三個世界冠軍級的程式 (圍棋, 象棋,將棋)。這對棋類運動將產生什麼影響?
回覆列表
-
1 # 風雲學會陳經
-
2 # 奇襲象棋與兵法
當圍棋被Alpha Zero成功解決後,設想之中,它對其他幾大棋類也一定可以如法炮製,勢必如履平地一般。
人類的工具在革命,交流的方式在革命,棋類必須也進行一場革命。棋類或許只有向不完全資訊方向發展,人類可能才有的玩!本人發明的奇襲象棋就屬於這類,無論未來AI如何進步,下奇襲象棋也不可能不出錯誤,從而不可能完全戰勝人類。奇襲象棋可以成為機器和人之間一個平臺,因為在它之上,機器和人一樣都會犯錯誤,也都有勝利的機會。並且,非常有可能的是,之前的AI並不能獨立(需要人機)下奇襲象棋,而Alph Zero能否會下還不得而知。
-
3 # kiki宅急便
比較期待是否有一天,正如柯潔對戰阿爾法狗一般,今年橫空出世的日本天才將棋手藤井聰太也會迎戰人工智慧。
在今年選出的日本十大流行語大獎中,將棋職業四段的藤井聰太榮獲評委特別大獎。
2016年年底,年僅14歲的中學生藤井成為日本將棋史上最年輕的職業棋手。而這還不是他創造的唯一記錄。
從出道以來,藤井聰太一一打敗對手,完成29連勝,一舉打破有史以來連勝最多的記錄,不僅驚動將棋屆,也引起全日本社會的關注。不僅少兒將棋班爆滿,將棋的銷售也一路攀升。
關於人工智慧進軍將棋領域,其實在NHK拍攝的關於藤井聰太的紀錄片中也有提及。據悉,包括藤井聰太在內的不少棋手正在利用人工智慧不斷地提高自己的棋藝。
如果AI機器人和日本將棋手交手,結果又會是怎樣的呢?kiki醬也會持續關注的。
Deepmind又發AI新論文了,這次的目標是國際象棋和日本將棋!
上次Deepmind讓AlphaGo Zero在圍棋上從零開始學習,短時間就訓練成功棋力驚人。但是圍棋規則是很簡單的,Deepmind這次把這個技術用到了國際像棋和日本將棋這兩種規則很複雜的棋類上。結果證明,從零開始學習對於複雜規則的棋類也是通用的,而且比圍棋花更少的時間就能訓練成功。
Chess就是國際象棋,Shogi是日本將棋,都和中國象棋有些類似,兵種很多,每個兵種有各自的行棋規則。從規則複雜度來說,比圍棋繁瑣多了。但是從搜尋 狀態空間看,比圍棋又少多了,國際象棋是10^46次方,圍棋是10^171。
國際象棋AI之前就已經遠遠高於人類棋手的實力了,實力最強最有名的程式之一是Stockfish。新的程式是AlphaZero(注意不是AlphaGo Zero, Go是圍棋的英文名)。下面是AlphaZero的具體戰績。
可以看出,Stockfish無論先走後走,都勝不了AlphaZero。雖然100局裡和了72局,但是通常國際象棋頂級AI大戰100局90局會和掉。AlphaZero勝了28局,而且一局沒輸,實力應該是比Stockfish強不少。和這麼多,主要是國際象棋容易和棋,非常可能兩個上帝下就是和局。
AlphaZero對日本將棋程式Elmo的優勢更大,100局是90勝2和8負。但是也輸過,這個特點有些異常。AlphaZero訓練一天,就能比之前訓練三天的20 blocks的AlphaGo Zero強,100局是60勝40負,但這個進展並不是太讓人吃驚,應該只是訓練速度快了,棋力增強到沒有多少,更強的是訓練40天的40 blocks的AlphaGo Zero。
這是訓練花的時間,4個小時後(對應300K的訓練步數),AlphaZero就戰勝了Stockfish。2小時後(對應110K的訓練步數),AlphaZero就戰勝了Elmo。訓練8小時戰勝AlphaGo Lee,24小時超過AlphaGo Zero。
當然訓練花的時間長短,和訓練時用的機器有關。AlphaZero用了5000個TPU(相當於5萬個GPU)用於生成對局,這是非常驚人的數字,一般公司肯定搞不了。如果只有10個GPU,那可能要2年才能自學習訓練出一個國際象棋程式。
以前人們用”人工程式設計加專家知識“的辦法,已經打敗了人類棋類高手。如國際象棋、日本將棋,都是人寫了很多程式碼的,也需要專業棋手來幫忙,有時還有好幾個G的開局庫,研發時間也很長。而且這種“人工程式設計加專家知識”的辦法,還解決不了圍棋。
Deepmind用機器學習的辦法,在圍棋上取得了突破。這篇文章回頭證明,用機器學習的辦法,可以用更簡單的辦法解決其它棋類。程式設計任務很簡單,訓練起來也很快,這個開發思想完全是革命性的。當然它需要很多GPU硬體,只有大公司能搞。
國際象棋在世界上的影響比圍棋要大不少,更為普及。Stockfish也是國際象棋愛好者最喜歡的AI。這次Stockfish這麼容易就被打敗了,對國際象棋界也會有不小的衝擊。許多國際象棋AI開發者要想新的辦法開發了。