大數定理是一條什麼樣的定理？

首頁>Club>2021-02-17 12:47

大數定理是一條什麼樣的定理？

回覆列表

1 # 使用者9584878753389

大數定律又稱大數法則、大數率。在一個隨機事件中，隨著試驗次數的增加，事件發生的頻率趨於一個穩定值；同時，在對物理量的測量實踐中，測定值的算術平均也具有穩定性。機率論歷史上第一個極限定理屬於伯努利，後人稱之為“大數定律”。機率論中討論隨機變數序列的算術平均值向常數收斂的定律。機率論與數理統計學的基本定律之一。又稱弱大數理論。大數定律(law of large numbers)，是一類描述當試驗次數很大時所呈現的機率性質的定律。　　有些隨機事件無規律可循，但不少卻是有規律的，這些“有規律的隨機事件”在大量重複出現的條件下，往往呈現幾乎必然的統計特性，這個規律就是大數定律。　　通俗地說，這個定理就是，在試驗不變的條件下，重複試驗多次，隨機事件的頻率近似於它的機率。比如，我們向上拋一枚硬幣，硬幣落下後哪一面朝上本來是偶然的，但當我們上拋硬幣的次數足夠多後，達到上萬次甚至幾十萬幾百萬次以後，我們就會發現，硬幣每一面向上的次數約佔總次數的二分之一。這種情況下，偶然中包含著必然。必然的規律與特性在大量的樣本中得以體現。　　簡單地說，大數定理就是“當試驗次數足夠多時，事件發生的頻率無窮接近於該事件發生的機率”　　大數定理簡介　　我們知道，單憑理性計算，有限次重複博弈，是解決個體理性與集體理性之間矛盾的。無限重複又如何呢？且聽我細細道來。　　在無限重複中，行為規則可以用自動機來代表，於是不同行為規則的相爭，便成了機器與機器的角鬥。假設甲和乙玩無限重複的囚犯博弈。甲相信《美德的起源》一書作者的教導，認定仁厚忠恕既高尚又有效，於是以它為策略。乙信奉理性流氓主義，崇尚實力和實利，於是以流氓主義為策略。這樣，二人間的博弈，就可以看作恕道機器與流氓機器的爭鬥。根據上一貼中列出的框圖，我們可以推演出各個回合雙方的行為如下：第一回合，甲仁厚玩合作H，乙宰客玩欺騙D；第二回合，甲報復玩欺騙D，乙仍然宰客玩欺騙D；第三回合，甲仍報復玩欺騙D，乙發現甲並非傻客，於是玩合作H；第四回合，甲原諒乙，玩合作H；乙卻因甲上次不合作，回頭玩欺騙D宰客； …… 如此等等。採用我們上貼裡的報償表，整個結果序列如下圖所示：　　循　環　循　環　循　環　　┌───┐　┌───┐　┌───┐　　↓　↓　↓　↓　↓　↓　　　行為：甲　H　D　D　H　D　D　H　D　D　　　乙　D　D　H　D　D　H　D　D　H　　　報償：甲　0　2　6　0　2　6　0　2　6　　　乙　6　2　0　6　2　0　6　2　0　　　…… 請注意，此序列呈現一個有趣的規律：就是每三個一組，不斷迴圈重復。於是我們很容易算出，博弈各方平均每個回合的報償有多少　只要取相繼三個回合，作個簡單平均就夠了。甲得到（0＋2＋6）／ 3 ＝ 2．67，乙得到（6＋2＋0）／ 3＝2．67。顯然，兩者平分秋色，不相上下，誰也不比誰差，誰也不比誰強。　　這種迴圈重複並不是特例。可以證明，有限自動機玩無限重複博弈，其結果最終都會變成迴圈重複序列。於是，利用類似的辦法，我們可以針對上貼中列出的七種策略，算出每一對策略相博所產生的的平均報償。這些報償可以寫成一個7×7博弈矩陣，如下表所示（其中一些略去了小數，這不影響下面的討論）：　　乙　　傻客　惡棍　冷血　恕道　俠義　流氓　搖擺 ·－－－－－－－－－－－－－－－－－－－－－－－－－－－· 傻客｜4，4｜0，6｜4，4｜4，4｜4，4｜0，6｜0，6｜｜－－－＋－－－＋－－－＋－－－＋－－－＋－－－＋－－－｜惡棍｜6，0｜②，②｜2，2｜2，2｜2，2｜3，1｜2，2｜｜－－－＋－－－＋－－－＋－－－＋－－－＋－－－＋－－－｜冷血｜4，4｜2，2｜④，④｜④，④｜2，2｜3，1｜2，2｜｜－－－＋－－－＋－－－＋－－－＋－－－＋－－－＋－－－｜恕道｜4，4｜2，2｜④，④｜④，④｜3，3｜2，2｜2，2｜甲　｜－－－＋－－－＋－－－＋－－－＋－－－＋－－－＋－－－｜俠義｜4，4｜2，2｜2，2｜3，3｜2，2｜2，2｜2，2｜｜－－－＋－－－＋－－－＋－－－＋－－－＋－－－＋－－－｜流氓｜6，0｜1，3｜1，3｜2，2｜2，2｜④，④｜2，4｜｜－－－＋－－－＋－－－＋－－－＋－－－＋－－－＋－－－｜搖擺｜6，0｜2，2｜2，2｜2，2｜2，2｜4，2｜③，③｜ ·－－－－－－－－－－－－－－－－－－－－－－－－－－－·　　上面這個表裡面，有帶圈數字的格子都是平衡點。比如，乙玩惡棍策略時，甲無論玩什麼，都不比當惡棍帶來的好處更多，頂多不致受損而已。因此，甲乙雙方都當惡棍，次次都玩欺騙，便是重複囚犯博弈的平衡點之一，此時各方的報償與一次性博弈相同，都是2。　　觀察一下上面這個表，我們會發現它有多個平衡點。非重複博弈中的均衡點，惡棍對惡棍，雙方永遠玩欺騙，仍然是無限重複博弈的均衡點。無條件合作的傻客策略，仍然不是重複博弈的均衡點理性的人，決不會當傻客。更重要的是，重複博弈引進了許多新的平衡點，其中有不少平衡點，可以實現合作報償(4,4)。這包括恕道策略對恕道策略，恕道策略對冷血策略，冷血策略對冷血策略，流氓策略對流氓策略等，都可以維持雙方的合作。以流氓對流氓為例：第一回合，雙方耍流氓互宰，發現對方不是好惹的之後，雙方轉入合作心態，此後一直維持合作，這樣無限次重複，其平均報償都是4。　　事實上，存在這無窮多對有限自動機策略，可以成為無限重複博弈的平衡點，並同時實現雙方的合作。這就是有名的“大眾定理(Folk Theorem)”，又譯作“無名氏定理”。它之得名，是由於重複博弈促進合作的思想，早就有很多人提出，以致無法追溯到其原創者，於是以“無名氏”名之。　　大眾定理說明了行為規則的多樣性：有無窮多種行為規則可以支援合作行為。在正常的平衡狀態中，可觀察到的行為可以完全相同的，此即博弈雙方相互合作，不玩欺騙。但其背後的行為規則卻可能大不相同合作，可以是由於雙方都信奉仁厚的恕道主義，也可能是因為雙方都是理性流氓，還可能是因為雙方都一冷血報復作威脅。這些行為規則上的區別，在正常的平衡狀態中，是看不出來的，只有在非正常情況下，或在與外人的交往中，才會表現出來。　　為說明此點，設想有兩個相互隔離的社會：一個形成了理性流氓式的行為規則，一個形成仁厚恕道的行為規則，他們各自內部都能維持相互合作，這形成了社會的正常狀態。外人但憑觀察這兩個社會中人們的正常行為，看不出他們有什麼區別。現在假設兩個社會打破隔離，相互接觸，會產生甚麼情況？兩套行為規則間會出現激烈的衝突！初次接觸，流氓主義者將把對方當傻客，大宰其客。恕道主義者假設對方是好人，選擇合作，只是在吃了虧之後，才以回宰其客相回報。流氓主義者見對方回宰，以為對方也是跟自己一樣的流氓，於是轉向合作心態，同時預期對方也選擇合作。但恕道主義者根據“以直報怨”的原則，仍然以宰客回報對方上次的欺騙。流氓主義者一看對方不合作，怒從心起，於是報之以宰客，如此迴圈往復，雙方永遠無法達成合作。　　行為規則的衝突，類似於人文學科裡常說的文化衝突。由於行為規則反映了人們對各自行為的穩定預期，一些博弈論者把不同的行為規則解釋為不同的文化信仰，應當是不無道理的。我覺得，重複博弈理論，為我們科學理解許多文化現象，打開了大門。　　正是由於行為規則本身的多樣性和複雜性，所以我對成樸文章中過分抬高“一報還一報（tit　for　tat）”單一規則，將之推崇為美德的起源，始終抱有疑慮。

∧ 中秋節和大豐收的關聯？

∨ 天諭好玩嗎？

熱門排行

劇多

大數定理是一條什麼樣的定理？