用案例來解釋,我想最直接,我最早接觸的也是這個。 在博弈論中一個最著名的的事例就是“囚徒困境”:兩個共同作案的偷竊的小偷被警察逮住,在警察局單獨關押,如果一方與警察合作,招認並工人出自己與對方以前所做的違法的事情,而對方不招認,招認方將不受重刑,無罪釋放,另一方則會被判重刑10年,如果對方都與警察合作共同招認,則各判刑5年,而如果雙方均不承認,因進查詢不到其他證明他們以前違法的證據,則只能對他們的小偷行為進行懲戒,各判刑3個月。這兩個小偷將做如何選擇?在這個困境中囚徒最後結果是當場釋放還是被判(10年、5年、3個月),這不僅曲解解決於該囚徒的決定而且還取決與另一個囚徒的決定。囚徒困境的支付矩陣為:甲 乙 招認 不招認招認 各判刑5年 甲:判刑10 年 乙:當場釋放不招認 甲:當場釋放 乙:判刑10年 各判刑3個月其實在這個囚徒困境中,兩個囚徒均招認是一個穩定的結果,這個共同“招認”也是他們選者中存在的唯一的納什均衡。
用案例來解釋,我想最直接,我最早接觸的也是這個。 在博弈論中一個最著名的的事例就是“囚徒困境”:兩個共同作案的偷竊的小偷被警察逮住,在警察局單獨關押,如果一方與警察合作,招認並工人出自己與對方以前所做的違法的事情,而對方不招認,招認方將不受重刑,無罪釋放,另一方則會被判重刑10年,如果對方都與警察合作共同招認,則各判刑5年,而如果雙方均不承認,因進查詢不到其他證明他們以前違法的證據,則只能對他們的小偷行為進行懲戒,各判刑3個月。這兩個小偷將做如何選擇?在這個困境中囚徒最後結果是當場釋放還是被判(10年、5年、3個月),這不僅曲解解決於該囚徒的決定而且還取決與另一個囚徒的決定。囚徒困境的支付矩陣為:甲 乙 招認 不招認招認 各判刑5年 甲:判刑10 年 乙:當場釋放不招認 甲:當場釋放 乙:判刑10年 各判刑3個月其實在這個囚徒困境中,兩個囚徒均招認是一個穩定的結果,這個共同“招認”也是他們選者中存在的唯一的納什均衡。