首頁>Club>
9
回覆列表
  • 1 # 白冀楚233

    文無第一,武無第二,阿爾法狗雖然打敗了目前的圍棋大師,但比分差距很小,人類也會不斷進步,如果阿爾法狗的系統不升級,它遲早會被人類天才打敗,它是目前的圍棋之神,但不是永遠的,而且會還有更強大的計算機出現,所有的巔峰都不是永久的

  • 2 # 特斯拉神話

    個人認為阿爾法狗就是圍棋之神。他的能力是人類無所匹及的。如果是人,他就不可能完美。

    阿爾法狗舊版演算法原理

    Alphago的原理並非基於窮舉,而是基於兩個神經網路所一起作用作出的決策。神經網路如果簡單來看,可以算作是人類對於神經系統的一種模擬。定義好神經元的數量和層級,初始化權重和偏移,並透過訓練資料對其進行訓練。即觀察它的輸出和預期結果之間的差異,並改進網路本身的引數等。之後神經網路就可以提高自己在解決問題時的表現。

    這很類似人類神經系統能夠從不斷輸入的外界資料和反饋中提高自己的表現,比如學會手握住東西、學會走路、學會說話一樣。Alphago採用兩個神經網路、一個叫作價值網路,另一個是策略網路。兩個網路共同決定了它的決策。而它最初的設計。而它最初的訓練資料,則是人類對局中海量的圍棋棋譜。Alphago透過學習棋譜到達比較高的水平,之後在進行自我對弈。並用3000萬盤自我對弈棋譜來進行訓練,就如同一個可以左右互搏的大師,上下數千萬局不會疲勞,並最終獲得了提升。而人類終其一生也就數千盤棋,是無法望其相背的。

    阿爾法圍棋系統主要由幾個部分組成為:

    策略網路(Policy Network),給定當前局面,預測並採樣下一步的走棋;

    快速走子(Fast rollout),目標和策略網路一樣,但在適當犧牲走棋質量的條件下,速度要比策略網路快1000倍;

    價值網路(Value Network),給定當前局面,估計是白勝概率大還是黑勝概率大;

    蒙特卡洛樹搜尋(Monte Carlo Tree Search)。

    把以上這三個部分連起來,形成一個完整的系統。

    不過這件事,並沒有走向終點。因為就算是戰勝了所有人類選手。Alphago最早仍然是基於人類對於圍棋的理解而訓練。也就是說人類其實用之前所積累的智慧給了Alphago關鍵性的智慧。

    阿爾法狗新版演算法原

    很快,AlphaGo Zero來了,在2017年10月19這天,Alphago zero釋出了,他融合了價值網路和策略網路。只所以叫zero,因為這是一個從零開始的人工智慧。它不需要任何人類棋譜的輸入,完全靠自我對弈進行訓練。而且因為演算法的最佳化,它的效率高得驚人。

    最早的時候,它就如同一個普通的圍棋初學者,比如在3小時的時候幾乎是亂下,十幾個小時後,他就學會了一些簡單的招式。隨後就學會了更多的圍棋知識。而經過72小時的訓練,這個不需要人格化人類棋譜輸入的AI,經過大約500萬局對局。已經達到餓了擊敗李現石Alphago的程度,也就是達到了人類最頂級高手的程度。也就是說,人類數千年的圍棋知識,人工智慧3天已經走過了。40天的訓練後,Alphago zero已經可以完全戰勝對戰柯潔的Alphago master。也就是接近無人望其項背的圍棋之神。這個版本的zero對初版的對初版的對局是100:0勝,對柯潔版的比分是89:11勝,令人讚歎不已。

    AlphaGoZero使用新的強化學習方法,讓自己變成了老師。系統一開始甚至並不知道什麼是圍棋,只是從單一神經網路開始,透過神經網路強大的搜尋演算法,進行了自我對弈。隨著自我博弈的增加,神經網路逐漸調整,提升預測下一步的能力,最終贏得比賽。更為厲害的是,隨著訓練的深入,阿爾法圍棋團隊發現,AlphaGoZero還獨立發現了遊戲規則,並走出了新策略,為圍棋這項古老遊戲帶來了新的見解。

    AlphaGoZero並不使用快速、隨機的走子方法。在此前的版本中,AlphaGo用的是快速走子方法,來預測哪個玩家會從當前的局面中贏得比賽。相反,新版本依靠地是其高質量的神經網路來評估下棋的局勢。

    總結

    無論人類有多勤奮!跟機器比起來不值一提。

    無論人類有多聰明。始終打敗不了機器的勤奮!

    無論人類有多完美。他還是有無數瑕疵的。

    但是機器永遠會保持完美,聰明,勤奮!

  • 3 # 空想千年

    這麼說吧,第一隻狗狗是和李世石比賽時的狗,第二隻狗是60:0勝人類棋手的AlphoGo Master,第三隻狗是和柯潔比賽時的狗,現在的AlphaGo Zero是隻藏獒,它100比0碾壓了AlphoGo Lee和AlphoGo Master。簡直駭人聽聞。在2017年,深度學習和人工智慧都取得了驚人的進步,尤其DeepMind的AlphaGo系列,令人記憶猶新。其中,AlphaGo Zero這個版本更是取得了驚人的突破:三天內透過自我對抗賽,超過了AlphaGo 的實力,贏得了100場比賽的全勝;21天內達到AlphaGo Master的水平,並在40天內超過了所有舊版本。知名計算機科學研究員Xavier Amatrain稱它比“機器學習”中“過去5年的成果加起來都重要”。

    圍棋之神和人工智慧相比,我認為圍棋之神更厲害,因為他接近於宗教信仰中的上帝,藤澤秀行說過,圍棋有100我只知其六,一開始都以為老先生謙虛呢,現在回頭看吧,實話實說嘍。

    人工智慧AlphaGo Zero已經很厲害了,但和我們心目中理想化狀態的圍棋之神,還是有微小差距的。

    以前曾經設想過範西屏和吳清源來一盤如何如何,或者施定庵和李昌鎬比較一下怎樣怎樣,回想一番挺可笑的。現在是圍棋之神和AlphaGo Zero下一局吧,說過了還很期待的樣子。

  • 4 # 至臻571

    說實話,現代的圍棋本來就走錯了路,以前的圍棋是棋如人生,現在的圍棋是應試考試。人生機器怎麼能算清?考試你能考過機器?

  • 5 # 凝瓊

    問題有點多而且複雜,拿了張草稿紙寫了寫才算想明白了些…

    先說說貼目吧,圍棋由於符合策梅洛定理中的規定條件,無論貼目是多少:

    “要麼黑方有必勝之策略、要麼白方有必勝之策略、要麼雙方也有必不敗之策略”。

    只要對圍棋和圍棋ai有些瞭解的人來說,很輕易可以發現在貼目為6.5時,黑棋優勢,貼目為7.5時,白棋優勢。而這點優勢如果交由圍棋之神掌控,那就是勝勢,即便對手也是圍棋之神。因為在正常情況下,只要貼目不為正數,就不會有平局出現

    那這就存在一個問題:如果貼目為7時會怎麼樣?

    剛開始我也被這個問題困擾了一會,後來突然轉念一想:在貼整數目的情況下,雙方最接近的情況也就是贏或輸對方1目。舉個例子:假如你執黑棋先行,需要貼給對方7目整,如果你能贏對手1目,那麼即使你在貼7.5的情況下也能贏0.5目;而如果你輸對手恰好一目,那麼即使你少貼0.5目你也照輸不誤。因此:

    圍棋在某個整數貼目下雙方都是有“必不敗策略”的,而目前來看很可能是7目。但可能雙方中有一方必勝策略可能要多於對方,可能有一方只有很少甚至只有一種“必不敗策略”,不過對於參透了一切變化的圍棋之神來說,貼7目,無論執黑或執白就已立於不敗之地…

    另外,由於圍棋雙方目數總和一定是361目,因此,在貼偶整數目的情況下,一定不會有平局出現(除非出現有眼雙活的特殊情況)

    不過,這其中還有個非常重要的點需要指出:以上都是建立在常規規則之下的分析,即平局只發生在雙方終局之後目數完全相同的情況下。而圍棋還有“三劫迴圈”,“四劫迴圈”,“多劫迴圈”的局面,這種情況下是會判處無勝負(可以理解為平局)的,那會不會出現形勢不利的一方去努力形成複雜的無勝負局面來形成平局?暫時不得而知,這好像得看目前圍棋ai對無勝負局面的理解以及目前圍棋ai勝率中是否完全考慮了無勝負這種情況。。。

    我說說我對於“有某一最優解的圍棋局面具備的特徵”這一問題的看法:

    除去一些顯而易見的,一眼就能看出最優解的局面(比如兩條貫穿全盤的大龍對殺,僅一氣之差),其他的貌似走哪都行,你去問不同的職業棋手,會得到與之棋風大致相匹配的答案,去問ai勝率也只浮動1個百分點以內的局面,以目前人類的技術水平來說,很難找到真正的最優解。即使你拿著頂級ai讓他就對著這一張圖使勁訓練,得到了精確到小說點後幾十位的勝率,發現其中某個點應該更好。那最多也只是目前人類的技術水平下的最佳,是否能得到ai的認可尤未可知。因此目前來看是否有最佳解的局面之間還有很大的一段未知地帶,也不用說是否能有人給出有唯一最優解圍棋局面的特徵了。。。

    圍棋之神是必然不可能有認輸功能的,也完全不需要一個函式或者模組去判斷是否需要認輸。因為它參透了圍棋的所有變化,也只知道圍棋的所有變化。這麼說的原因是圍棋之神的勝率只有100%(必勝)與0%(必不勝即輸或平)兩種,而這種勝率是建立在對方也是圍棋之神的情況下才有意義的,且如果真的對手是另一個圍棋之神,那必敗的一方開局認輸,貼7目整的棋局雙方隨便走一走一平局收尾也是合情合理。但如果他的對手是你我凡夫俗子,抑或是絕藝、AlphaGo這種頂級ai(其實在圍棋之神眼裡並沒有什麼區別),那它就不能再在開局自認為必敗時認輸,因為它的對手實力遠遜於它,這樣做很不合理。

    因此我們的圍棋之神需要選擇一種最佳下法繼續棋局。在此指出題主一處錯誤,此時圍棋之神不應該是採用“雙方理想情況下,子差最小”的下法,而應該採用“儘量將局面導向混沌,即最複雜的下法”,不過如何定義“最複雜的下法”還有待考究,但一定不等同於題主所說子差最小。原因就在於圍棋只有勝或負兩種情況(不考慮平),輸半目與全盤沒有活棋並沒有區別(當然面子上過不去),比賽的獎金不會因為你只輸了半目而多分你一點,所以在劣勢局面下,釋放勝負手是唯一的選擇(總好過安樂死)。所以圍棋之神也需要在開局自認為必敗的情況下釋放它自認為的“勝負手”,儘可能讓局面變得複雜。

    再回答題主比較關心的一點:圍棋之神究竟能讓AlphaGo幾個子?

    由於圍棋之神現在並不存在,AlphaGo也已退役,所以拿其他對局來進行參考:

    最近一次人類與ai的正式對局應該是去年年底李世石的退役三番棋,與南韓本土ai韓豆的受2子、分先的對局。

    李世石引退賽第一局三番棋中最大的亮點應該就是第一局李世石的黑76天外飛仙

    神之一飛這一步不僅當場擊潰韓豆,就連絕藝、星陣等其他頂級ai也都沒有看到。

    圖1圖1:韓豆當時應該只看到了黑1大吃的手段,所以提前用白 與黑棋做了交換。

    圖2圖2:白棋如果打完想要壓出,黑4可以與白5交換,然後吃掉中腹棋筋。

    圖3圖3:如果白棋打完粘上,黑4與白5交換後,有黑10位妙手,恰好能夠將白棋棋筋吃住,白不行。

    圖4圖4:白1最強應對

  • 中秋節和大豐收的關聯?
  • 為什麼感覺生活這麼難啊?