muzero發明人？

首頁>Club>2021-04-13 16:56

muzero發明人？

4

回覆列表

1 # 使用者5037697747765

當初谷歌DeepMind的阿爾法狗橫空出世，使人類領教到了現代AI的恐怖潛力。從那時起，每隔幾個月DeepMind就會推出一篇重磅論文，從阿爾法狗到阿爾法零，進步之速令觀者咋舌。

或許正是因為DeepMind的AI技術階段性突破頻繁，逐漸令大眾產生了審美疲勞。幾天前，谷歌又搞出了一個MuZero，而關心者人數就已不及當初。MuZero，它壓根不知道什麼圍棋！就是在棋盤上胡亂擺放棋子，工程師在幾個節點稍微誘導一下，使它產生偏向性。最終，MuZero發明了圍棋！
除了發明圍棋外，它還以更快的速度發展出更加高明的棋理。它是AI世界中的圍棋創造者。

直觀上，MuZero具有內部驅動力——精確設計遊戲規則的動力。

正如DeepMind研究人員所解釋的那樣，強化學習的一種形式——模型是MuZero和AlphaZero的核心技術，其中的獎勵系統將AI帶向目標。MuZero與阿爾法零對弈，前者的搜尋步數更少卻更加精妙，因為它對圍棋的理解更深。它不僅比阿爾法零更強大，而且在架構上更簡單，更高效。

DeepMind認為，現實生活中的許多問題(如股票，軍事行動)都沒有明確的規則，或者規則隨時變動。所以，需要未來的決策AI自行摸索。這就是他們的研發方向。

相關內容

∧ 中秋節和大豐收的關聯？

∨ 白色衣服帶有些紅色圖案，脫色怎麼處理？

熱門排行