回覆列表
-
1 # 春天的水分子
-
2 # 你看我獨角獸嗎
我來通俗解釋下這次AlphaGo發展的情況,很明顯地是AlphaGo Zero現在不需要人類棋譜就可以自我學習到戰勝人類的地步,這是之前幾代Alpha都不能比擬的一種境界。這麼說吧,這有點像自我領悟到九陽神功而之前學人類都是門派武功而已。
從模型結構來看,AlphaGo Zero 只使用圍棋棋盤上的黑子和白子作為輸入,而上一版本的AlphaGo的輸入包含了少量人工設計的特徵。它只用了一個神經網路,而不是像之前的兩個。以前的AlphaGo使用一個“策略網路”(policy network)來選擇下一個落子位置和一個“價值網路”(value network)來預測遊戲的贏家。這些在最新版本中是聯合進行的,這使得它能夠更有效地進行訓練和評估,而且它不使用“走子演算”(rollout)——這是其他圍棋程式使用的快速、隨機遊戲,用來預測哪一方將從當前的棋局中獲勝,是用高質量的神經網路來評估落子位置。
從以上看Zero實際上是大大減小的模型的複雜度,而圍棋的結構非常適配CNN,所以出現了這麼好的效果,正所謂“大道至簡”。從某種意義上說人類應該要學習下Zero的走法,再結合我們自己的優勢取突破新的境界。
按多位專家的意見,零狗(AlphaGo Zero)從人工智慧技術創新的角度,並沒有實質性的突破進展。但這不妨礙它是一個里程碑式的成就。雖然基本上是現有技術的運用,但這個工作完成得非常乾淨漂亮。從零開始不依賴於人類的知識,三天超越人類3000年的積累,就憑這個示範就足以寫入人類的歷史。效率的提升和能耗的大幅降低,也令人印象非常深刻。與阿狗第一次突破相比,這次的成就在示範效應,對人類的啟迪上,以及應用上,或許還有過之。