博弈論(Game Theory),有時也稱為對策論,或者賽局理論,是研究具有鬥爭或競爭性 質現象的理論和方法,它是應用數學的一個分支,既是現代數學的一個新分支,也是運籌學的一個重要學科。目前在生物學、經濟學、國際關係學、計算機科學、 政治學、軍事戰略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構(遊戲或者博弈(Game))間的相互作用,是研究具有鬥爭或競爭性質現象的數學理論和方法,也是運籌學的一個重要學科。 博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的最佳化策略。 表面上不同的相互作用可能表現出相似的激勵結構(incentive structure),所以他們是同一個遊戲的特例。其中一個有名有趣的應用例子是囚徒困境悖論(Prisoner"s dilemma)。 具有競爭或對抗性質的行為成為博弈行為。在這類行為中,參加鬥爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,併力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行為中鬥爭各方是否存在著最合理的行為方案,以及如何找到這個合理的行為方案的數學理論和方法。 生物學家使用博弈理論來理解和預測進化論的某些結果。例如:John Maynard Smith 和George R. Price 在1973年發表於Nature上的論文中提出的“evolutionarily stable strategy”的這個概念就是使用了博弈理論。還可以參見演化博弈理論(evolutionary game theory)和行為生態學(behavioral ecology)。 博弈論也應用於數學的其他分支,如機率、統計和線性規劃等。博弈論思想古已有之,中國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論專著。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展,正式發展成一門學科則是在20世紀初。 對於博弈論的研究,開始於策墨洛(Zermelo,1913)、波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928),後來由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)首次對其系統化和形式化(參照Myerson, 1991)。隨後約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。此外,塞爾頓、哈桑尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的的學科。 當代博弈論的“三大家”和“四君子” "三大家" 包括約翰·福布斯·納什、約翰·C·海薩尼以及萊因哈德·澤爾騰。這三人同時因為他們對博弈論的突出貢獻而獲得1994年的瑞典銀行經濟學獎(也稱諾貝爾經濟學獎)。 "四君子" 包括羅伯特·J·奧曼、肯·賓摩爾、戴維·克瑞普斯以及阿里爾·魯賓斯坦。 博弈要素: (1)局中人(players):在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為“兩人博弈”,而多於兩個局中人的博弈稱為 “多人博弈”。 (2)策略(strategiges):一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全域性籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。 (3)得失(payoffs):一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全域性中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的“得失”是全體局中人所取定的一組策略的函式,通常稱為支付(payoff)函式。 (4)次序(orders):各博弈方的決策有先後之分,且一個博弈方要作不止一次的決策選擇,就出現了次序問題;其他要素相同次序不同,博弈就不同。 (5)博弈涉及到均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,它是一穩定的博弈結果。 納什均衡(Nash Equilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。納什均衡點存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人零和博弈中,當局中人A採取其最優策略a*,局中人B也採取其最優策略b*,如果局中人仍採取b*,而局中人A卻採取另一種策略a,那麼局中人A的支付不會超過他採取原來的策略a*的支付。這一結果對局中人B亦是如此。 這樣,“均衡偶”的明確定義為:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱之為均衡偶,對任一策略a(屬於策略集A)和策略b(屬於策略集B),總有:偶對(a, b*)≤偶對(a*,b*)≤偶對(a*,b)。 對於非零和博弈也有如下定義:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱為非零和博弈的均衡偶,對任一策略a(屬於策略集A)和策略 b(屬於策略集B),總有:對局中人A的偶對(a, b*) ≤偶對(a*,b*);對局中人B的偶對(a*,b)≤偶對(a*,b*)。 有了上述定義,就立即得到納什定理: 任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。 納什定理的嚴格證明要用到不動點理論,不動點理論是經濟均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價於找到博弈的不動點。 納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結構裡尋找比較有意義的結果。 但納什均衡點定義只侷限於任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點”。 塞爾頓(R·Selten)在多個均衡中剔除一些按照一定規則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。
博弈論(Game Theory),有時也稱為對策論,或者賽局理論,是研究具有鬥爭或競爭性 質現象的理論和方法,它是應用數學的一個分支,既是現代數學的一個新分支,也是運籌學的一個重要學科。目前在生物學、經濟學、國際關係學、計算機科學、 政治學、軍事戰略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構(遊戲或者博弈(Game))間的相互作用,是研究具有鬥爭或競爭性質現象的數學理論和方法,也是運籌學的一個重要學科。 博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的最佳化策略。 表面上不同的相互作用可能表現出相似的激勵結構(incentive structure),所以他們是同一個遊戲的特例。其中一個有名有趣的應用例子是囚徒困境悖論(Prisoner"s dilemma)。 具有競爭或對抗性質的行為成為博弈行為。在這類行為中,參加鬥爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,併力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行為中鬥爭各方是否存在著最合理的行為方案,以及如何找到這個合理的行為方案的數學理論和方法。 生物學家使用博弈理論來理解和預測進化論的某些結果。例如:John Maynard Smith 和George R. Price 在1973年發表於Nature上的論文中提出的“evolutionarily stable strategy”的這個概念就是使用了博弈理論。還可以參見演化博弈理論(evolutionary game theory)和行為生態學(behavioral ecology)。 博弈論也應用於數學的其他分支,如機率、統計和線性規劃等。博弈論思想古已有之,中國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論專著。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展,正式發展成一門學科則是在20世紀初。 對於博弈論的研究,開始於策墨洛(Zermelo,1913)、波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928),後來由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)首次對其系統化和形式化(參照Myerson, 1991)。隨後約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。此外,塞爾頓、哈桑尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的的學科。 當代博弈論的“三大家”和“四君子” "三大家" 包括約翰·福布斯·納什、約翰·C·海薩尼以及萊因哈德·澤爾騰。這三人同時因為他們對博弈論的突出貢獻而獲得1994年的瑞典銀行經濟學獎(也稱諾貝爾經濟學獎)。 "四君子" 包括羅伯特·J·奧曼、肯·賓摩爾、戴維·克瑞普斯以及阿里爾·魯賓斯坦。 博弈要素: (1)局中人(players):在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為“兩人博弈”,而多於兩個局中人的博弈稱為 “多人博弈”。 (2)策略(strategiges):一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全域性籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。 (3)得失(payoffs):一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全域性中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的“得失”是全體局中人所取定的一組策略的函式,通常稱為支付(payoff)函式。 (4)次序(orders):各博弈方的決策有先後之分,且一個博弈方要作不止一次的決策選擇,就出現了次序問題;其他要素相同次序不同,博弈就不同。 (5)博弈涉及到均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,它是一穩定的博弈結果。 納什均衡(Nash Equilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。納什均衡點存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人零和博弈中,當局中人A採取其最優策略a*,局中人B也採取其最優策略b*,如果局中人仍採取b*,而局中人A卻採取另一種策略a,那麼局中人A的支付不會超過他採取原來的策略a*的支付。這一結果對局中人B亦是如此。 這樣,“均衡偶”的明確定義為:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱之為均衡偶,對任一策略a(屬於策略集A)和策略b(屬於策略集B),總有:偶對(a, b*)≤偶對(a*,b*)≤偶對(a*,b)。 對於非零和博弈也有如下定義:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱為非零和博弈的均衡偶,對任一策略a(屬於策略集A)和策略 b(屬於策略集B),總有:對局中人A的偶對(a, b*) ≤偶對(a*,b*);對局中人B的偶對(a*,b)≤偶對(a*,b*)。 有了上述定義,就立即得到納什定理: 任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。 納什定理的嚴格證明要用到不動點理論,不動點理論是經濟均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價於找到博弈的不動點。 納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結構裡尋找比較有意義的結果。 但納什均衡點定義只侷限於任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點”。 塞爾頓(R·Selten)在多個均衡中剔除一些按照一定規則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。