回覆列表
  • 1 # 使用者8756900464918

    用博弈論來教你做出最佳選擇首先建立博弈模型如下如果去食堂早,有熱飯吃收益+1,人少不擠,收益+1,因此有熱飯吃且人少不擠的收益就是2了。如上圖所示,A選擇早去,如果B也選擇早去,那麼A有熱飯吃,但人多(因為B也選擇這個時候去了),所以此時A的收益是1,如果B選擇晚去,那麼A不僅有熱飯吃,而且人還少(因為B沒去),此時收益是2。反之對於B得情況也是如此,就得到上面的博弈模型,下面來分析這個模型。 如果B選擇早去,早去和晚去都是A的優勢策略,因為此時對於A來說,不管選擇早去還是晚去,他的收益都是1 ;如果B選擇晚去,那麼A有絕對優勢策略,既選擇早去,此時早去的收益是2比晚去的收益0要大。如下圖中標黃部分所示:根據對稱性,B的策略選擇如下圖中標黃部分所示:將兩張圖合併可以看出標黃部分即是博弈的納什均衡,根據博弈論原理,博弈的最後結果會趨向於納什均衡,至於為什麼會這樣可以參見我另外一個回答:中國的勸酒文化背後的邏輯是什麼? - EnJoyDJ 的回答,那裡對於納什均衡有比較詳細的描述。那麼問題來了,這裡有三個納什均衡,到底會趨向於哪一個均衡點呢?貌似我選擇早去和晚去都可以。下面要引入混合納什均衡的概念,上面說的納什均衡是純策略的納什均衡,下面是混合策略的納什均衡,接下來有點可能會有點難以理解。假設B選擇早去的機率是P,那麼選擇晚去的機率則是1-P,如下圖所示那麼對於A來說,選擇早去的可能的收益是1*P+2*(1-P)=2-P,選擇晚去的可能的收益是1*P+0*(1-P)=P,再混合納什均衡中有個很重要的定理:B的策略選擇會使得A選擇早去和選擇晚去的收益相等,即2-P=P。試想一下,如果2-P>P,那麼A選擇早去的收益比選擇晚去的收益大,那麼A就肯定會選擇早去,即把劣勢策略晚去排除掉了,那麼就變成純策略了,要想讓A保持一定機率會選擇晚去,那麼就必須讓早去和晚去的收益是一樣的,即2-P=P。再比如從甲乙兩個人裡面選身高最高的人,如果明知道甲比乙高,那我肯定不會選擇乙,只有當甲和乙是一樣高的情況下我才有一定的機率選擇乙。然後根據2-P=P,可以解得P=1,即B有1的機率選擇早去,0的機率選擇晚去的情況下,A才有一定機率選擇早去,一定機率選擇晚去,即混合了早去和晚去這兩個策略,而不是純粹只選擇一個策略。到底A選擇早去的機率和選擇晚去的機率各式多少呢?那就要從B的收益上來考慮。假設A選擇早去的機率是Q,那麼選擇晚去的機率則是1-Q,如下圖所示那麼對於B來說,選擇早去的可能的收益是1*Q+2*(1-Q)=2-Q,選擇晚去的可能的收益是1*Q+0*(1-Q)=Q,同理可得2-Q=Q,解得Q=1。最後可得A的混合策略是P(早去,晚去)=(1,0),B的混合策略是Q(早去,晚去)=(1,0)。所以根據博弈論原理分析,最後的結論是,你應該選擇早點去食堂吃飯,去得越早收益越大,也就是說如果可以的話你應該選擇食堂一開門,你第一個到。這裡可能對於混合策略的納什均衡有點難以理解,如果需要深究的話可以去自己看看博弈論的書自學。如果不需要深究的話,從上面的回答便可以看到如何用博弈論的知識來做出去食堂吃飯的最佳選擇。其實從簡單的角度再來理解一下,假設你就是A,其它人是B,如果你選擇早去,不管別人選擇早去還是晚去,你的收益都是大於或等於1的,如果你選擇晚去,你的收益是大於或等於0的,很明顯選擇早去你的收益要大。再簡單地講,你選擇早去你至少會有熱飯吃,有時候碰巧別人晚去了,此時你不僅有熱飯吃,而且你人還少。如果你晚去了,頂多是人少,但有時候萬一別人也晚去了,此時不僅人多,而且還沒有熱飯吃了。

  • 中秋節和大豐收的關聯?
  • TS憾負estar後,主教練凱凱發文檢討:“我第5、6局的BP問題太大”,真的是他的問題嗎?