回覆列表
  • 1 # 九月1020

    看到其他回答說了很多理論,這裡先拿出這次比賽的幾局實戰來複盤,方便大家理解AI玩牌和人類思維到底有什麼不同。

    首先明確一下,這次比賽和常規的德州撲克6人局、9人局不同,是人類和AI 1V1單挑。

    第一局 人類贏了

    盲注200。人類玩家Kim這局是莊家,手裡的牌是黑桃7和紅桃9,AI拿到一對8。

    未翻牌階段Kim直接下注274。Libratus跟。

    首三張公共牌是:黑桃6,紅桃5,黑桃4。Kim這時手裡已經拿到雙頭順+後門花,機器下注274,Kim跟。

    第四張牌:紅桃8。AI拿到3個8,下注274。而Kim這裡已經是一個Nuts順,只輸後門花,直接下注3151。Libratus的選擇是繼續跟。

    最後一張River card:黑桃9。這意味著,牌局有可能出現“同花”。AI直接下重注15000,演一手同花。Kim有點猶豫,但還是Hero call跟進開牌,最終贏得了牌局。顯然剛才電腦是在詐唬。

    第二局 AI贏了

    同時進行的另一場牌局,人類高手Jason Les當時以一對10開局,一張方片一張紅桃。翻牌後,首三張公共牌是:K、9、4,其中有兩張梅花。Jason下注繼續。在這種局面下,AI按理說應該希望再出一張梅花,湊成一個同花。 第四張公共牌,發出一張5,不是梅花。當時,兩邊都已經看牌。最後一張公共牌,是一張Q,也不是梅花。然後,人工智慧突然壓上了所有的籌碼。

    面對這個局面,Les選擇不跟。人工智慧贏下一手。

    總結來說: Libratus經常特別激進的下注,下注的額度遠遠超過底池裡的額度。“其實人類並不這樣,通常不會為了贏一點錢,冒著輸掉很多錢的風險”,撲克高手Doug Polk說,“但人工智慧沒有這種心理,它只看怎麼玩更好”。

    Libratus AI是如何確立自己玩牌的策略的?

    眾所周知,研發Libratus的卡內基梅隆大學,其Computer Science專業堪稱全球最好。具體倒這次AI演算法的研發上,Libratus和Google的阿爾法狗有所不同。下面引用 《連線》雜誌的一段描述:

    Libratus就沒有使用神經網路。它主要靠的是強化學習,這是人工智慧的一種,一種極其強除錯錯的方法。其實質就是自己跟自己玩大量的遊戲。Google的DeepMind實驗室利用強化學習來開發AlphaGo,這套系統攻克圍棋的時間比預期早了10年,但這兩套系統之間有一個關鍵的不同。AlphaGo是透過分析人類玩家的3000萬份棋譜來學習遊戲的,然後才透過自己跟自己下棋來改進自己的技能。相對而言,Libratus卻是從零開始學的。

    再來看Libratus的系統構成:

    Libratus依靠了3套不同的系統的協作: 透過一種名為反事實遺憾最小化(counterfactual regret minimization)的演算法,它先是隨機地玩,然後最終在經過幾個月的訓練以及玩了上萬億手撲克之後,它也達到了能挑戰最好人類玩家的高度,不僅如此,它的玩法還是人類所不能的——它下注的範圍要大得多,而且會對這些賭注隨機化,這樣對手就更難猜自己手上都有什麼牌了。跟導師Tuomas Sandholm一起開發了這套系統的CMU研究生Noam Brown說:“我們只是向AI描述了這個遊戲,但沒有告訴它怎麼玩。它完全是獨立於人的玩法形成自己的策略的,而且它的玩法跟人的玩法會非常不一樣。” 但這只是第一階段。在匹茲堡的比賽期間,第二套系統會分析遊戲狀態並聚焦於第一套系統的注意力。這套系統屬於一種“殘局解算器(end-game solver)”,上週一Sandholm 和Brown發表的論文詳細描述了它的細節。在第二套系統的幫助下,第一套系統再也不需要像過去那樣跑完所有可能的場景了。它可以只試探其中的一些場景。也就是說,Libratus不僅僅是在在比賽前學習,而且還能在比賽中學到東西。 光靠這兩套系統就已經很有效率了。但Kim等其他玩家仍然能夠找出機器玩法的一些模式然後設法加以利用。為此,Brown和Sandholm開發了第三套系統。每天晚上Brown都會跑一個演算法來識別出那些模式然後從策略中剔除掉。他說:“一個晚上它就能計算完然後在次日把一切準備就緒。”

    以上其實可以看到,Libratus主要依靠自己的近乎無限的計算量,透過無數盤德州撲克對決,把自己培養成能夠面對各種複雜牌局都能提供最優解,換言之,Libratus本身就變成了德州撲克對決的最優演算法集。

    這樣的能力,想想還是挺可怕的,因為其意味著可以複用到基本所有行業,人工智慧可以靠自己和自己玩,憑藉自身的計算能力就形成對絕大多數人類決策的碾壓。

  • 2 # 傑豹2

    更強的記憶,更好的邏輯思維,更優秀的學習能力,不受情緒困擾,不被勞乏拖累,這就是人工智慧相對於我們一般人類所具有的優勢。具有如此巨大的優勢 戰勝頂尖棋手那是很自然的。隨著人工智慧的發展,人類的很多崗位會被人工智慧取代,工廠,商店,銀行,醫院,交通,家政甚至安保軍事等等領域都會越來越多的出現人工智慧的身影。人類將把更多的精力用到發明創造和探索未來,還有就是發展文化藝術,享受人生上。哈哈,羨慕啊!

  • 中秋節和大豐收的關聯?
  • 玉米鬚子有哪些用途?