回覆列表
  • 1 # Hello world1

    阿爾法圍棋(AlphaGo)是一款圍棋人工智慧程式。這個程式利用“價值網路”去計算局面,用“策略網路”去選擇下子。 阿爾法圍棋(AlphaGo)是透過兩個不同神經網路“大腦”合作來改進下棋。這些大腦是多層神經網路跟那些Google圖片搜尋引擎識別圖片在結構上是相似的。它們從多層啟發式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網路處理圖片一樣。經過過濾,13 個完全連線的神經網路層產生對它們看到的局面判斷。這些層能夠做分類和邏輯推理。

      

    這些網路透過反覆訓練來檢查結果,再去校對調整引數,去讓下次執行更好。這個處理器有大量的隨機性元素,所以人們是不可能精確知道網路是如何“思考”的,但更多的訓練後能讓它進化到更好。

    第一大腦:落子選擇器 (Move Picker)

    阿爾法圍棋(AlphaGo)的第一個神經網路大腦是“監督學習的策略網路(Policy Network)” ,觀察棋盤佈局企圖找到最佳的下一步。事實上,它預測每一個合法下一步的最佳機率,那麼最前面猜測的就是那個機率最高的。這可以理解成“落子選擇器”。

    第二大腦:棋局評估器 (Position Evaluator)

    阿爾法圍棋(AlphaGo)的第二個大腦相對於落子選擇器是回答另一個問題。不是去猜測具體下一步,它預測每一個棋手贏棋的可能,再給定棋子位置情況下。這“局面評估器”就是“價值網路(Value Network)”,透過整體局面判斷來輔助落子選擇器。這個判斷僅僅是大概的,但對於閱讀速度提高很有幫助。透過分類潛在的未來局面的“好”與“壞”,AlphaGo能夠決定是否透過特殊變種去深入閱讀。如果局面評估器說這個特殊變種不行,那麼AI就跳過閱讀在這一條線上的任何更多落子。

  • 中秋節和大豐收的關聯?
  • 剛生下小羊每噸多少奶?