首頁>Club>
1
回覆列表
  • 1 # 使用者5037697747765

    當初谷歌DeepMind的阿爾法狗橫空出世,使人類領教到了現代AI的恐怖潛力。從那時起,每隔幾個月DeepMind就會推出一篇重磅論文,從阿爾法狗到阿爾法零,進步之速令觀者咋舌。

    或許正是因為DeepMind的AI技術階段性突破頻繁,逐漸令大眾產生了審美疲勞。幾天前,谷歌又搞出了一個MuZero,而關心者人數就已不及當初。MuZero,它壓根不知道什麼圍棋!就是在棋盤上胡亂擺放棋子,工程師在幾個節點稍微誘導一下,使它產生偏向性。最終,MuZero發明了圍棋!

    除了發明圍棋外,它還以更快的速度發展出更加高明的棋理。它是AI世界中的圍棋創造者。

    直觀上,MuZero具有內部驅動力——精確設計遊戲規則的動力。

    正如DeepMind研究人員所解釋的那樣,強化學習的一種形式——模型是MuZero和AlphaZero的核心技術,其中的獎勵系統將AI帶向目標。MuZero與阿爾法零對弈,前者的搜尋步數更少卻更加精妙,因為它對圍棋的理解更深。它不僅比阿爾法零更強大,而且在架構上更簡單,更高效。

    DeepMind認為,現實生活中的許多問題(如股票,軍事行動)都沒有明確的規則,或者規則隨時變動。所以,需要未來的決策AI自行摸索。這就是他們的研發方向。

  • 中秋節和大豐收的關聯?
  • 白色衣服帶有些紅色圖案,脫色怎麼處理?