清徵江湖第十九期：區塊鏈與博弈論：對抗與統一

首頁>科技>清徵江湖2020-12-24 11:00

清徵江湖第十九期：區塊鏈與博弈論：對抗與統一

清：大家好，我是朱清。

徵：大家好，我是李徵光。

徵：非常高興又與大家見面了，無論你是新朋友還是老朋友，相信都能夠在我們的節目中得到收穫。

清：首先我們還是給新朋友介紹一下自己，我是朱清，是鏈博科技的創始人，鏈博科技是業內一家領先的區塊鏈及大資料解決方案服務商。

清：我們也將結合我們自身在區塊鏈行業的從業經歷，和大家一起來看現在最新，最熱的尖端概念。

徵：所以如果你對新鮮事物和商業感興趣的話，那接下來的四十分鐘，肯定不容錯過。

清：我們在之前的節目中，探討過這麼幾個話題：區塊鏈、央行數字貨幣、新基建、比特幣、大資料、Defi等，上一期我們探討了P2P與Defi的相似之處和不同之處（簡單回顧上一期內容）。

徵：今天我們來和大家一起做一做思維體操，來聊一個邏輯性很強的話題：博弈論。其實在咱們的生活中也是處處充滿博弈的，所以博弈論是一門非常有意義的學科，可能有很多聽眾在大學的時候也多多少少接觸過一點。

清：提到博弈論，可能很多聽眾第一個會聯想到的概念就是囚徒困境哈。雖然這個名詞已經非常深入人心了，但是為了照顧一些還不是很瞭解的觀眾，以及為了方便我們在這個話題上繼續延展，我們還是把囚徒困境的意義簡單回顧一下。

徵：說兩個囚犯被抓住以後分開審訊。每個囚犯都可以選擇招供或者不招供。如果兩個囚犯都不招供的話，由於缺乏證據，只能每個人判5年；如果兩個囚犯都招供的話，證據齊全，每個人會判8年；如果一個囚犯招供，另一個囚犯不招供的話，那麼招供的那個囚犯可以當汙點證人，只判3年，而不招供的那個證據確鑿還拒不招供，會判10年。

清：那麼這兩個囚犯會怎麼做呢？很顯然，兩個人都不招供的話，共同利益是最高的，兩人刑期加一起只會有10年，在經濟學上我們說達到了帕累托最優。但是事實情況卻並非如此。

徵：好比說A和B就是那兩個囚犯，那麼A會怎麼思考呢？無非有兩種情況。第一種情況，B不招供，那麼此時如果A招供，A的刑期是3年，如果A不招供，A的刑期是5年，那A肯定選擇招供；第二種情況，B招供，如果A招供，A的刑期是8年，如果A不招供，A的刑期是10年。所以，無論B是否招供，對於A來說，招供都是最合理的。

清：在A這樣想的同時，B也是這樣想的。所以最後的結果就是，A和B都招供了，大家都被判8年，總刑期16年，是三種情況裡總刑期最長的。

徵：所以我們就發現，明明兩個人可以都只判5年的，但是結果卻是大家都判了8年。囚徒困境的這個例子是博弈論最廣為人知，也是最簡單的一個案例，但是卻很能說明為什麼“缺乏信任”這件事能夠對我們產生負面影響。

清：當然我們要說明一下，罪犯因為囚徒困境招供是我們願意看到的，但是囚徒困境並不是專門來為難罪犯的，我們在生活中很多時候都會被類似於囚徒困境的情況困擾，因此破除囚徒困境是可以增加社會效率的，並不是為了讓罪犯能夠抵抗審訊，囚徒困境只是一種博弈論情境的總稱而已。

徵：說清楚了這一點，我們就可以來審視一下囚徒困境的幾個關鍵點。囚徒困境只是一個簡單的模擬，事實情況要複雜的多，因此我們不能拘泥於細枝末節，而是把關鍵點提煉出來，才能真正更好地理解。

清：首先，囚徒困境是建立在理性經濟人假設上的，也就是囚犯一定會為了減少刑期而出賣隊友。但是實際情況會有些不一樣，因為人與人之間都多多少少有一些感情和聯絡，因此存在程度不等的信任，那麼囚徒困境是否能夠解決，實際上就在於兩人之間的信任是否能夠抵抗住相應的利益。

徵：當然在這裡，還有一個非常重要的因素，那就是囚犯無法得知隊友的選擇。這會放大兩個人之間的不信任。舉個例子，我可能是信任朱清的，但是我會想，朱清是不是信任我呢？如果她不信任我，她不就會出賣我嗎？即使她也信任我，那她知不知道我也信任她呢？如果她不知道我信任她，她是不是會覺得我可能出賣她，從而搶先一步出賣我呢？

清：這個邏輯可以無限地延伸下去，從而持續放大兩人之間的不信任，這個就非常像《三體》裡面的猜疑鏈了。

徵：那麼看過《三體》的觀眾可能會記得，消解猜疑鏈的方式就是交流。三體裡猜疑鏈無法消解的原因是在宇宙尺度上資訊傳播的速度上限光速決定了資訊無法及時傳遞，但是我們在地球上是不需要擔心這個問題的。

清：比如有一部以囚徒困境為題材的短片裡，罪犯破除囚徒困境的方法就是他們在警察中有一個臥底，這個臥底會持續給兩個罪犯暗中傳遞訊息，這樣雙方都會知道對方還沒有出賣自己，於是猜疑鏈就被打破了。

徵：那麼我們需要思考，交流的本質是什麼？其實很簡單，交流的本質就是對於資訊不對稱的消解。透過交流，我們可以獲得更多的對方的資訊，從而建立起對對方的信任。

清：因此，至此我們總結出破除囚徒困境的第1個關鍵點：交流，其實質是破除資訊不對稱。

徵：博弈論裡面還有非常重要的一點，也就是博弈是一次性博弈還是重複博弈。囚徒困境我們一般來說是一次性博弈，因為博弈之後，兩個罪犯至少要在監獄裡呆幾年，以後再接觸的可能性也比較小。但是在現實生活中，我們遇到的博弈更多是重複博弈，也就是博弈過程會多次進行，如果你第一次就背叛了對方，那麼第二次就會失去對方的信任。

清：商業行為中這一點是很常見的，如果你在一次生意中背叛了合作伙伴，也許能夠得到暫時的收益，但是肯定會失去對方的信任，從而在遠期上造成更多的損失。

徵：從這樣看來，似乎現實生活天然就不利於囚徒困境的產生，畢竟我們大多數人都有自己的比較常規的圈子，重複博弈佔了大多數。但是事實上，有幾點原因使得生活中雖然大部分都是重複博弈，但是背叛行為也屢見不鮮。

清：第一點就是，“背叛”行為對方未必能夠發覺。我們前面舉的例子裡，囚犯可以透過自己最後被判的刑期，輕鬆判斷出隊友是否背叛了自己，但是實際上在現實生活中，很多背叛行為我們是難以發覺的，或者一時之間難以發覺。舉個最簡單的例子，你在跟朋友打麻將的過程中偷偷出老千，只要你的技術夠好，你的朋友也是發現不了的，這時候就算重複博弈再多次，就算打他十圈八圈，也不會失去對方的信任，當然前提是你不能把把都胡清一色自摸三家哈。

徵：要不然就算你不是出老千的，你的朋友也肯定不願意跟你打麻將了。說回正題，第二點就是，生活中仍然有很多情況是可以刻意製造一次性博弈的。按照常規來說，我們都喜歡和熟悉的人合作，因為可以免去很多建立信任的步驟，所以我們都傾向於重複博弈。但是如果一個人專門透過背叛來獲益，那麼這個人一定會刻意選擇一次性博弈，第一次跟A合作，第二次跟B合作，第三次跟C合作，每次都是一次性博弈，那麼他就根本不會考慮背叛會影響以後的合作。

清：那麼我們要對抗囚徒困境，其實就是要擴充套件重複博弈。第一，要讓背叛行為公諸天下；第二，要讓侷限性的博弈行為變成共享性的博弈行為。第一點可能比較好理解，那麼第二點，什麼叫做共享性的博弈行為，其實很簡單，就是讓博弈中雙方的必要資訊共享化。舉個例子，A跟B的博弈過程中，雙方是否有背叛行為，相關的資訊其他人都可以查閱，從而把A和B的博弈行為變成一個公共的歷史行為，把一次性博弈變成重複博弈。

徵：說白了就類似於一個徵信機制，把少數人的歷史信用變成大眾的歷史信用。那麼這就是我們總結的第二個關鍵點：重複，也就是重複博弈，透過重複博弈來建立共享性的歷史信用。

清：當然，在實際生活當中，全世界的人都處在博弈的大環境之中，而且每個人都有自己的行動策略。比如，有的人天生願意信任他人，對誰都持合作態度；有的人“人不犯我，我不犯人”，在對方也合作的情況下會一直合作，但一旦對方採取欺騙態度，也會立即對對方採取欺騙並不再回頭；有的人陰險狡詐，碰到誰都是欺騙與背叛。

徵：當然，每個人的行動策略也並非固定不變的，而是很可能根據過去自己採取的策略以及得到的結果而進行調整。

清：我們知道集體行為和個體行為的邏輯往往存在著非常大的區別，那麼如果我們站在整體的角度上來看，要消滅囚徒困境，我們還應該有什麼樣的關鍵點？

徵：首先，我們需要做非零和的博弈。也就是說，博弈雙方能夠雙贏，而不是一方贏，一方輸。從整體的角度來看，零和博弈是不能大面積建立起合作的，反而一定會催生背叛與欺騙。

清：因此，在合作之前，我們就應該考慮，這次合作是不是一個雙贏的合作？如果不是，而是零和的，這個合作是一定不能長久的。

徵：其次就是適當的寬容。在實際生活中，還存在一定機率的誤會，可能會導致合作的失敗。這個時候，如果將這一部分也納入到歷史信用中，是不利於合作關係的建立的。從個體角度來講，這種低機率的誤會可能影響不大，但是從整體角度來看，適當寬容的策略更有利於信任關係的建立。

清：關於信任關係的建立，尤其是從整體角度來看，有一個叫做“信任的進化”的小遊戲進行了非常有意思的模擬。這個小遊戲設計了大概十幾種不同策略的參與者，然後模擬了一個由這些參與者組成的一個幾十人的小型社會，讓這些參與者兩兩之間進行博弈。根據博弈的獲利結果，會有一部分博弈輸掉的參與者改變策略，變成其他型別的參與者。如此迴圈，最後就只會剩下一種策略的參與者。

徵：當然，由於初始引數的設定不同，最後的結果也會有所不同，但是大部分情況下，勝利的策略叫做“復讀機”，也就是重複上一輪對方的策略。也就是說，如果對方合作，我就合作，如果對方欺騙，我就欺騙。

清：但是當遊戲加入了一種新策略後，我們會發現這種新策略更有生命力。這種新策略就是，如果對方上一輪合作，那我就合作；直到對方連續兩輪欺騙，我才會選擇欺騙。可以看到這種新策略比起復讀機，增加了一點寬容度，從而取得了更好的效果。這就是合理寬容的力量。

清：好，那麼到此為止，我們已經分析了破解囚徒困境的幾個關鍵點，現在我們可以來看看，區塊鏈怎麼應用到博弈論當中去。

徵：首先我們知道，破解囚徒困境的第一個關鍵點是交流。在現實生活中，我們雖然並不像罪犯一樣被關在牢房裡無法相互交流，但是仍然有很多因素對於我們的交流進行阻礙。這些阻礙因素可能是情感因素，也可能是獲取資訊的渠道不同，也可能是知識結構的差異，總之人們在交流的過程當中，往往存在著非常多的壁壘。

清：那麼在這一點上，區塊鏈實際上起到的是一個促進交流的作用。我們前面說了，交流的本質實際上是達成資訊對稱的一個過程，而區塊鏈顯然可以加速這一過程。

徵：當然，這並不代表著我們要交換所有的資訊，而是隻需要把與合作相關的資訊進行對稱就可以了。區塊鏈絕對不代表著完全的透明，而是精確的具有相關性的透明。

清：第二個關鍵點是重複博弈，那麼區塊鏈雖然不能直接把一次性博弈變成重複博弈，但是卻可以幫助我們把一次性博弈變成共享性的重複博弈。換句話說，增加歷史信用的真實性。

徵：最後一個關鍵點，雙贏和寬容，區塊鏈並不能把一個原本零和的博弈變成非零和，而如何保持合理的寬容度，也是區塊鏈系統所需要考慮的問題。我們知道，區塊鏈系統裡的資訊是一旦上鍊就不可修改的，但是我們的實際生活中總是充滿意外的。比如一個區塊鏈的版權系統，如果抄襲者更瞭解區塊鏈，把抄襲的作品搶先上傳上鍊，這反而會成為不利於原創者的證據，這就是一個系統寬容度的缺乏。

清：這就好比從比特幣被髮明以來，無數人在各種情況下丟失了他們的私鑰，但卻無法找回。這是目前的區塊鏈系統缺乏寬容度的一個表現，也成為了區塊鏈系統向普通人傳播的一個阻礙。不過，這種意外的寬容度實際上是可以以一定的形式設計在系統本身之中的，也就是說，在區塊鏈系統設計的一開始，就應該考慮一定的寬容度問題。

徵：在我們以囚徒困境的幾個關鍵點為基準，將區塊鏈技術進行代入之後就可以發現，區塊鏈技術可以很好地促進交流，幫助重複博弈的建立，從而消解囚徒困境，大大提高我們整個社會的合作效率。同時，我們也可以從中看到現有區塊鏈系統的一些侷限，而這些侷限也正是區塊鏈技術的改進方向。

徵：關於這一點我們認為，區塊鏈並不能改變博弈論的根本邏輯。且不論成熟的區塊鏈基礎設施建設還需要非常長的時間，就算我們已經有了成熟完善的區塊鏈基礎設施，也不代表資訊不對稱就能完全消解，也不代表區塊鏈能夠模擬所有的情況。

清：可以預見，完善的區塊鏈系統雖然能夠大大提高社會的公平和透明水平，但是人類社會中的背叛和欺騙仍然會長期且頻繁地存在。在通往一個公平、透明的大同世界的道路上，區塊鏈可以起到非常重要的作用，但區塊鏈技術絕無可能憑一己之力達到這樣的目標。

徵：總結一下，我們今天透過博弈論的視角，分析了區塊鏈技術如何在博弈論體系中幫助我們消解囚徒困境，提高社會合作效率。

清：其中我們指出了囚徒困境的幾個關鍵點，分別是交流、重複博弈、雙贏與寬容。

徵：最後我們分析了區塊鏈技術如何促進交流，幫助共享性重複博弈的建立，以及應該如何改善自身的寬容性問題。

清：最後我們也說明，區塊鏈技術雖然可以起到很多作用，但是並不能解決一切問題，對此我們需要理性看待。

徵：再見！

最新評論

∧ 整治雙十一購物亂象，國家再次出手！該跟這些套路說再見了

∨ 這次我站隊小米！華為排行榜強行抹掉小米，格局太小

熱門排行

劇多

清徵江湖 第十九期：區塊鏈與博弈論：對抗與統一

清徵江湖第十九期：區塊鏈與博弈論：對抗與統一