回覆列表
-
1 # 量子貓
-
2 # 柳牧山
那是因為谷歌擁有強大的算力,用了5000個TPU花了40天就訓練出了無敵的AlphaZero。
據Leela的作者估計,用同樣的演算法要在一臺普通的電腦上訓練出同樣水平的圍棋AI,需要1700年。
-
3 # 塵微金
人類的感覺和智慧其實並不強大,肉身的能力是上帝對人類的束縛,而人類的慾望卻沒有天際,於是,人工智慧誕生了,這是一個新的開始,因為,人類從此走上了“上帝之路”,是否會受到天罰就不得而知了。但願這個世界能和平,幸福。
Alphago zero無師自通秒殺前代AlphaGo
在去年的10月18日,AI領域的明星公司DEEP Mind就公佈了圍棋AI程式AlphaGo 其實呢,早在2015年該公司所推出的第一代AlphaGo就曾因擊敗了當時蟬聯三屆歐洲圍棋冠軍的樊麾而一戰成名,之後更是以4:1戰勝李世石,3:0戰勝柯潔,確立了他的棋王地位,儘管AlphaGo的棋弈已經如此高超,但與後來公佈的AlphaGo zero相比卻是被秒殺的水平
Alphago Zero僅僅經過40天的訓練,就在於Alphago Zero的一百局對弈中贏了89次
那麼Alphago Zero為什麼只進化了40天呢?有趣的是,不同於上一代,AlphaGo是透過大量學習人類高手的對弈棋局來實現自我訓練
而AlphaGo zero是以強化學習演算法為基礎,透過總結3000萬次與自己博弈的過程中的經驗而問鼎圍棋世界之巔,換句話說,AlphaGo zero完全是靠自己一個人無師自通地成為了新一代棋王!徹底捨棄了傳統AI訓練中AI演算法對資料集的依賴
除了更改訓練方式,AlphaGo zero還在神經網路構建上舍棄了之前策略網路和價值網路並行的計算方式,成功將“落子位置策略演算”和“對應策略勝率計算”融為一體,進一步最大化利用了現有算力。
DeepMind將AlphaGo zero中所利用的技術應用到了谷歌資料中心中,實際能耗比提升了約15%
AlphaGo zero又應用到蛋白質摺疊機制等生物密碼的破譯研究中。