-
21 # 忙碌1623808
-
22 # 黃作夢
阿爾法狗自己跟自己對決,這就是養蠱啊。最新的蠱王已經出來了,開發阿爾狗的英國“深度思維”(Deepmind)公司10月18日在《自然》(Nature)上發表論文,介紹了新一代的“阿爾法狗-零”(Alphago Zero)。
論文連結見:https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
那些艱深晦澀的學術名詞咱們就不管了,反正他們把阿爾法狗分成了四個階段:第一個是戰勝樊麾的那個,叫“阿爾法狗-樊”(AlphaGo Fan);第二個是戰勝李世石的那個,叫“阿爾法狗-李”(AlphaGo Lee);第三個是曾以Master名稱出來將一眾人類高手打得找不著北,並戰勝了現世界排名第一的柯潔那個,叫“阿爾法狗-大師”(AlphaGo Master)。
現在最新一代的“阿爾法狗-零”,為什麼叫“零”呢?因為研究人員強調它是從零開始學圍棋,之前幾代都還是要先輸入一點人類摸索到的圍棋知識,而“阿爾法狗-零”是完全從頭開始,只讓它認棋盤和棋子,然後就自己摸索去吧。
“深度思維”公司說,這個“阿爾法狗-零”就是靠自己和自己下,憑藉強大的人工智慧演算法,很快就成長為阿爾狗中的“蠱王”。從它開始接觸圍棋,只用了3天,就可以戰勝“阿爾狗-李”,並且戰績是100比0;而只過了40天,它就超越了“阿爾法狗-大師”。要知道在今年5月,“阿爾法狗-大師”就已經展示出了人類棋手完全不能企及的水平,它不僅贏了柯潔,多名有世界冠軍頭銜的頂尖棋手聯手大戰也中盤告負,遭遇完敗。
所以兩個阿爾狗彼此對決,它們誰勝誰負我不知道,在棋盤上反正是狗贏人負。不過在棋盤之外,如果狗鏈拴得好,阿爾狗今後也許能憑其智慧幫人類解決一些問題,我們也可以自我安慰說贏在棋盤外。
-
23 # 開天行道
阿爾法狗的深度學習。其中一個環節就是自己和自己下。兩個阿爾法狗下,勝負取決於他們學習的深度。深度學習的演算法有bug。假如深度學習是在鋪路。它鋪的不是又直又平的柏油路。想象一輛慢慢向前移動的“噴石車”,這個車,屁股後面吸各種各樣的碎石,然後從正前方將碎石噴出,碎石亂七八糟的在前面鋪了一條石子路。這條石子路是一個混沌之路,中間會有坑。一旦車走到坑裡就會發生混亂。阿爾法狗和人下棋時,曾經有幾次像發了神經一樣亂走,這就是踩到坑裡了。
回覆列表
我有一個問題,狗下的是我們認為的圍棋嗎?它知道這是圍棋嗎?圍棋應該是哲學吧!不只是勝負!
加一點,它知道黑白的意思嗎?為什麼棋子是圓的而棋盤是方的。什麼是道?如果只是勝負,我們和野獸有何區別?