假設有n個局中人參與博弈,如果某情況下無一參與者可以獨自行動而增加收益(即為了自身利益的最大化,沒有任何單獨的一方願意改變其策略的[1]),則此策略組合被稱為納什均衡
納什均衡
。所有局中人策略構成一個策略組合(Strategy Profile)。納什均衡,從實質上說,是一種非合作博弈狀態。
子博弈:一個擴充套件式表示博弈的子博弈G是由一個單結資訊集x開始的與所有該決策結的後續結(包括終點結)組成的能自成一個博弈的原博弈的一部分。
對於擴充套件式博弈的策略組合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的納什均衡;它在每一個子博弈上也都構成納什均衡,則它是一個子博弈精煉納什均衡。
博弈論專家常常使用“序慣理性”(Sequential rationality):指不論過去發生了什麼,參與人應該在博弈的每個時點上最最佳化自己的策略。子博弈精練納什均衡所要求的正是參與人應該是序慣理性的。對於有限完美資訊博弈,逆向歸納法是求解子博弈精煉納什均衡的最簡便的方法。因為有限完美資訊博弈的每一個決策結都開始一個子博弈。求解方法: 最後一個結點上的子博弈(納什均衡)→倒數第二個(納什均衡) → ······ → 初始結點上的子博弈(納什均衡)。
納什均衡(Nash Equilibrium)和子博弈完美納什均衡(Subgame perfect Nash equilibrium)所反映的博弈都包括了一個基本假設:即博弈的結構、博弈的規則、所有局中人的策略空間和支付函式(payoffs)都是共同知識(common knowledge)。滿足這樣一個假設的博弈稱為“完全資訊博弈”(games of complete information)。但在現實生活中這一假設往往得不到滿足。在非合作博弈論中,局中人對博弈的結構以及其他局中人的特徵並沒有準確的知識的情況叫“不完全資訊博弈”(games of incomplete information)。在1967年以前,博弈論專家對不完全資訊博弈是束手無策的。 Harsanyi(1967—1968)的貢獻解決了這個問題,填補了博弈論乃至經濟學的一大空白,他也因此而獲得了諾貝爾經濟獎。John C.Harsanyi引入了一個虛擬的局中人——自然(nature)。與一般的局中人不同,“自然”沒有自己的支付和目標函式,即所有結果對它而言是無差異的。自然首先行動,決定局中人的特徵。被選擇的局中人知道自己的真實特徵,而其他局中人並不清楚這個被選擇的局中人的真實特徵,僅知道各種可能特徵的機率分佈。另外,被選擇的局中人也知道其他局中人心目中的這個分佈函式,也就是說,分佈函式是一種共同知識(common knowledge)。John C.Harsanyi的這項工作被為“Harsanyi轉移”(the Harsanyi transformation),透過這個轉換,John C. Harsanyi把“不完全資訊博弈”轉換成“完全但不完善資訊博弈”(complete but imperfect information)。這裡“完全但不完美資訊” 指的是,自然作出了它的選擇,但其他局中人並不知道它人具體選擇是什麼,僅知道各種選擇的機率分佈。這樣一來,不完全資訊博弈就變得可以進行分析了。在這個基礎上,John C.Harsanyi定義了貝葉斯納什均衡(Bayesian-Nash equilibrium)。
精煉貝葉斯均衡是完全資訊動態博弈的子博弈精煉納什均衡與不完全資訊靜態均衡的貝葉斯(納什)均衡的結合。有些書上或論文中也寫成精煉貝葉斯納什均衡。
具體來說,精煉貝葉斯均衡是所有參與人策略和信念的一種結合。它滿足如下條件:第一,在給定每個參與人有關其他參與人型別的信念的條件下,該參與人的戰略選擇是最優的。第二,每個參與人關於其他參與人所屬型別的信念,但是使用貝葉斯法則從所觀察到的行為中獲得的。
完美貝葉斯納什均衡的要點是在於當事人要根本所觀察到的他人的行為來修正自己的有關後者特徵的“信念”(主觀機率),並由此選擇自己的行動。完美貝葉斯納什均衡是所有局中人策略和信念的一種結合,它滿足如下條件:(a)給定每個局中人關於其他局中人特徵的機率分佈的資訊,他的策略選擇應該在每一個子博弈都構成貝葉斯均衡,也就是說,給定每個人有關其他人特徵的資訊的情況下,他的策略等待是最優的;(b)每個人有關他人特徵的信念都是使用貝葉斯法則從所觀察到的行為中獲得的。
假設有n個局中人參與博弈,如果某情況下無一參與者可以獨自行動而增加收益(即為了自身利益的最大化,沒有任何單獨的一方願意改變其策略的[1]),則此策略組合被稱為納什均衡
納什均衡
。所有局中人策略構成一個策略組合(Strategy Profile)。納什均衡,從實質上說,是一種非合作博弈狀態。
子博弈:一個擴充套件式表示博弈的子博弈G是由一個單結資訊集x開始的與所有該決策結的後續結(包括終點結)組成的能自成一個博弈的原博弈的一部分。
對於擴充套件式博弈的策略組合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的納什均衡;它在每一個子博弈上也都構成納什均衡,則它是一個子博弈精煉納什均衡。
博弈論專家常常使用“序慣理性”(Sequential rationality):指不論過去發生了什麼,參與人應該在博弈的每個時點上最最佳化自己的策略。子博弈精練納什均衡所要求的正是參與人應該是序慣理性的。對於有限完美資訊博弈,逆向歸納法是求解子博弈精煉納什均衡的最簡便的方法。因為有限完美資訊博弈的每一個決策結都開始一個子博弈。求解方法: 最後一個結點上的子博弈(納什均衡)→倒數第二個(納什均衡) → ······ → 初始結點上的子博弈(納什均衡)。
納什均衡(Nash Equilibrium)和子博弈完美納什均衡(Subgame perfect Nash equilibrium)所反映的博弈都包括了一個基本假設:即博弈的結構、博弈的規則、所有局中人的策略空間和支付函式(payoffs)都是共同知識(common knowledge)。滿足這樣一個假設的博弈稱為“完全資訊博弈”(games of complete information)。但在現實生活中這一假設往往得不到滿足。在非合作博弈論中,局中人對博弈的結構以及其他局中人的特徵並沒有準確的知識的情況叫“不完全資訊博弈”(games of incomplete information)。在1967年以前,博弈論專家對不完全資訊博弈是束手無策的。 Harsanyi(1967—1968)的貢獻解決了這個問題,填補了博弈論乃至經濟學的一大空白,他也因此而獲得了諾貝爾經濟獎。John C.Harsanyi引入了一個虛擬的局中人——自然(nature)。與一般的局中人不同,“自然”沒有自己的支付和目標函式,即所有結果對它而言是無差異的。自然首先行動,決定局中人的特徵。被選擇的局中人知道自己的真實特徵,而其他局中人並不清楚這個被選擇的局中人的真實特徵,僅知道各種可能特徵的機率分佈。另外,被選擇的局中人也知道其他局中人心目中的這個分佈函式,也就是說,分佈函式是一種共同知識(common knowledge)。John C.Harsanyi的這項工作被為“Harsanyi轉移”(the Harsanyi transformation),透過這個轉換,John C. Harsanyi把“不完全資訊博弈”轉換成“完全但不完善資訊博弈”(complete but imperfect information)。這裡“完全但不完美資訊” 指的是,自然作出了它的選擇,但其他局中人並不知道它人具體選擇是什麼,僅知道各種選擇的機率分佈。這樣一來,不完全資訊博弈就變得可以進行分析了。在這個基礎上,John C.Harsanyi定義了貝葉斯納什均衡(Bayesian-Nash equilibrium)。
精煉貝葉斯均衡是完全資訊動態博弈的子博弈精煉納什均衡與不完全資訊靜態均衡的貝葉斯(納什)均衡的結合。有些書上或論文中也寫成精煉貝葉斯納什均衡。
具體來說,精煉貝葉斯均衡是所有參與人策略和信念的一種結合。它滿足如下條件:第一,在給定每個參與人有關其他參與人型別的信念的條件下,該參與人的戰略選擇是最優的。第二,每個參與人關於其他參與人所屬型別的信念,但是使用貝葉斯法則從所觀察到的行為中獲得的。
完美貝葉斯納什均衡的要點是在於當事人要根本所觀察到的他人的行為來修正自己的有關後者特徵的“信念”(主觀機率),並由此選擇自己的行動。完美貝葉斯納什均衡是所有局中人策略和信念的一種結合,它滿足如下條件:(a)給定每個局中人關於其他局中人特徵的機率分佈的資訊,他的策略選擇應該在每一個子博弈都構成貝葉斯均衡,也就是說,給定每個人有關其他人特徵的資訊的情況下,他的策略等待是最優的;(b)每個人有關他人特徵的信念都是使用貝葉斯法則從所觀察到的行為中獲得的。