回覆列表
-
1 # 神之一手
-
2 # 南粵鄉情
首先人工智慧技術它是可以模擬人的思維,人想到的它可能也會想到。當你落子的時候,ai可以根據你的落子模擬出成千上萬種方法,或者你下一步的時候,它能模擬接下來你可能走的第n步。與此同時它也在思考著它接下來的落子的最佳方案。假設最後獲勝的是ai,你的每①步都在它掌握中。所以它就可以算出它這一步下在棋盤任一個位置的勝率是多少(以它模擬出來最佳方案為基礎,即它獲勝的落子線路)。假設你最終的落子位置與它模擬出來的方案不同,它又可以根據你的方案重新模擬一個新方案。從而計算出如果按現在這一步的走法,它在其盤上任一位置落子的勝率。人的智慧是無限的,但我們開發出來的腦功能是有限。
-
3 # 公司技術-呂鍇
阿爾法狗首先是,透過訓練好的神經網路權重檔案,快速得到當前局勢自己的贏棋機率(權重檔案相當於人類的第一棋感)。之後再透過最高分值落子點,重複代入變化圖向後推導,贏棋的變化加一分反之減一分,以此類推改變當前點的贏棋機率,這相當於人類圍棋中的計算能力,用以即時修正最佳落子點。
權重檔案是AI核心靈魂部分,相當於用窮舉法培養電腦的棋感和經驗值,主要是以逐級提高後的棋譜,做為代入值,以人臉圖形識別技術為基礎訓練權重檔案。谷歌認為訓練層數應該最終在150層左右,他們訓練到40層就停止了訓練。
圍棋AI和人類一樣,面對一個局面,要決定下一手時,要向後推算很多步,算是對棋局的一種“模擬預演”。比如AlphaGo在序盤的時候,計算一個定式變化,動輒每個變化都是向後百餘步。
這種推演是樹狀的,比如下一手有10種可行的下法。每一種下法,都向後大量推演變化,得到海量的“預演”棋局,然後對每個“預演圖”進行形勢判斷,再統計該下法變化出的所有“預演圖”,勝多少敗多少,然後就得出了這一手的勝率。
大多數時候,AI“腦海中”計算的“預演圖”,也不會直接算到最終。比如上圖就是中國AI絕藝對某局面給出的一個變化圖,當然後面還算了大量的圖,然後才統計出了這個圖的勝率。
然後怎麼確定下一步呢?
下一手有10種下法,得出每一種下法的勝率以後,比較哪個迭代勝率最高、變化最多,就確定了下一步怎麼下。
比如這是經過神經網路升級後的Zen7,給出了四種下一步的可選點,還給出了每一種的勝率和迭代變化量。
但AI也不是絕對的選擇勝率最高,首先是會選擇迭代變化量最多的下法,當然這個下法一般勝率都是最高的,但也不絕對。
所以有時候,也會有面對57%和56%勝率的兩種下法,AI選擇了56%這種可能,因為後者迭代的變化量更多。但是在媒體宣傳裡,為了方便大家理解,都只說取勝率最高的。
一個模型是有上限的,並不是無限計算就會無限提高。
比如Zen7大概迭代變化到100萬的量別,水平也就到頂了。而AlphaGo,每步棋迭代的變化量是個比這還要高出很多量級的天文數字。但是具體數字和量級,不方便在公開場合講(谷歌啥都要保密)。