博弈論又被稱為對策論(GamesTheory),是研究具有鬥爭或競爭性質現象的理論和方法,它既是現代數學的一個新分支,也是運籌學的一個重要學科。博弈要素(1)局中人:在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為“兩人博弈”,而多於兩個局中人的博弈稱為“多人博弈”。(2)策略:一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全域性籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。(3)得失:一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全域性中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的“得失”是全體局中人所取定的一組策略的函式,通常稱為支付(payoff)函式。(4)對於博弈參與者來說,存在著一博弈結果(5)博弈涉及到均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,它是一穩定的博弈結果。納什均衡(NashEquilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。納什均衡點存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人零和博弈中,當局中人A採取其最優策略a*,局中人B也採取其最優策略b*,如果局中人仍採取b*,而局中人A卻採取另一種策略a,那麼局中人A的支付不會超過他採取原來的策略a*的支付。這一結果對局中人B亦是如此。這樣,“均衡偶”的明確定義為:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱之為均衡偶,對任一策略a(屬於策略集A)和策略b(屬於策略集B),總有:偶對(a,b*)≤偶對(a*,b*)≤偶對(a*,b)。對於非零和博弈也有如下定義:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱為非零和博弈的均衡偶,對任一策略a(屬於策略集A)和策略b(屬於策略集B),總有:對局中人A的偶對(a,b*)≤偶對(a*,b*);對局中人B的偶對(a*,b)≤偶對(a*,b*)。有了上述定義,就立即得到納什定理:任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。納什定理的嚴格證明要用到不動點理論,不動點理論是經濟均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價於找到博弈的不動點。納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結構裡尋找比較有意義的結果。但納什均衡點定義只侷限於任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點”。塞爾頓(R·Selten)在多個均衡中剔除一些按照一定規則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。博弈的型別(1)合作博弈——研究人們達成合作時如何分配合作得到的收益,即收益分配問題。(2)非合作博弈——研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。(3)完全資訊不完全資訊博弈:參與者對所有參與者的策略空間及策略組合下的支付有充瞭解稱為完全資訊;反之,則稱為不完全資訊。(4)靜態博弈和動態博弈靜態博弈:指參與者同時採取行動,或者儘管有先後順序,但後行動者不知道先行動者的策略。動態博弈:指雙方的的行動有先後順序並且後行動者可以知道先行動者的策略。財產分配問題和夏普里值(Shapleyvalue)考慮這樣一個合作博弈:a、b、c、投票決定如何分配100萬,他們分別擁有50%、40%、10%的權力,規則規定,當超過50%的票認可了某種方案時才能透過。那麼如何分配才是合理的呢?按票力分配,a50萬、b40萬、c10萬c向a提出:a70萬、b0、c30萬b向a提出:a80萬、b20萬、c0……權力指數:每個決策者在決策時的權力體現在他在形成的獲勝聯盟中的“關鍵加入者”的個數,這個“關鍵加入者”的個數就被稱為權利指數。夏普里值:在各種可能的聯盟次序下,參與者對聯盟的邊際貢獻之和除以各種可能的聯盟組合。次序abcacbbacbcacabcba關鍵加入者acacab由此計算出a,b,c的夏普里值分別為4/6,1/6,1/6所以a,b,c應分別獲得100萬的2/3,1/6,1/6。
博弈論又被稱為對策論(GamesTheory),是研究具有鬥爭或競爭性質現象的理論和方法,它既是現代數學的一個新分支,也是運籌學的一個重要學科。博弈要素(1)局中人:在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為“兩人博弈”,而多於兩個局中人的博弈稱為“多人博弈”。(2)策略:一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全域性籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。(3)得失:一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全域性中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的“得失”是全體局中人所取定的一組策略的函式,通常稱為支付(payoff)函式。(4)對於博弈參與者來說,存在著一博弈結果(5)博弈涉及到均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,它是一穩定的博弈結果。納什均衡(NashEquilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。納什均衡點存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人零和博弈中,當局中人A採取其最優策略a*,局中人B也採取其最優策略b*,如果局中人仍採取b*,而局中人A卻採取另一種策略a,那麼局中人A的支付不會超過他採取原來的策略a*的支付。這一結果對局中人B亦是如此。這樣,“均衡偶”的明確定義為:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱之為均衡偶,對任一策略a(屬於策略集A)和策略b(屬於策略集B),總有:偶對(a,b*)≤偶對(a*,b*)≤偶對(a*,b)。對於非零和博弈也有如下定義:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱為非零和博弈的均衡偶,對任一策略a(屬於策略集A)和策略b(屬於策略集B),總有:對局中人A的偶對(a,b*)≤偶對(a*,b*);對局中人B的偶對(a*,b)≤偶對(a*,b*)。有了上述定義,就立即得到納什定理:任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。納什定理的嚴格證明要用到不動點理論,不動點理論是經濟均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價於找到博弈的不動點。納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結構裡尋找比較有意義的結果。但納什均衡點定義只侷限於任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點”。塞爾頓(R·Selten)在多個均衡中剔除一些按照一定規則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。博弈的型別(1)合作博弈——研究人們達成合作時如何分配合作得到的收益,即收益分配問題。(2)非合作博弈——研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。(3)完全資訊不完全資訊博弈:參與者對所有參與者的策略空間及策略組合下的支付有充瞭解稱為完全資訊;反之,則稱為不完全資訊。(4)靜態博弈和動態博弈靜態博弈:指參與者同時採取行動,或者儘管有先後順序,但後行動者不知道先行動者的策略。動態博弈:指雙方的的行動有先後順序並且後行動者可以知道先行動者的策略。財產分配問題和夏普里值(Shapleyvalue)考慮這樣一個合作博弈:a、b、c、投票決定如何分配100萬,他們分別擁有50%、40%、10%的權力,規則規定,當超過50%的票認可了某種方案時才能透過。那麼如何分配才是合理的呢?按票力分配,a50萬、b40萬、c10萬c向a提出:a70萬、b0、c30萬b向a提出:a80萬、b20萬、c0……權力指數:每個決策者在決策時的權力體現在他在形成的獲勝聯盟中的“關鍵加入者”的個數,這個“關鍵加入者”的個數就被稱為權利指數。夏普里值:在各種可能的聯盟次序下,參與者對聯盟的邊際貢獻之和除以各種可能的聯盟組合。次序abcacbbacbcacabcba關鍵加入者acacab由此計算出a,b,c的夏普里值分別為4/6,1/6,1/6所以a,b,c應分別獲得100萬的2/3,1/6,1/6。