回覆列表
  • 1 # 怡然1694568

    卡爾·皮爾遜在統計領域的貢獻

      在19世紀90年代以前,統計理論和方法的發展是很不完善的,統計資料的蒐集、整理和分析都受到很多限制.皮爾遜在生物學家高爾登 (Francis Galton,1822-1911)和韋爾頓(Weldon,1860-1906)的影響下,從九十年代初開始進軍生物統計學.他認為生物現象缺乏定量研究是不行的,決心要使進化論在一般定性敘述的基礎之上,進一步進行數量描述和定量分析.他不斷運用統計方法對生物學、遺傳學、優生學做出新的貢獻.同時,他在先輩們善於賭博機遇的機率論研究的基礎上,匯入了許多新的概念,把生物統計方法提煉成為一般處理統計資料的通用方法,發展了統計方法論,把機率論與統計學兩者溶為一爐.他被公認是“舊派理學派和描述統計學派的代表人物”,並被譽為“現代統計科學的創立者”.他在統計學方面的主要貢獻是:

      1.匯出一般化的次數曲線體系.在皮爾遜之前,人們普遍認為,幾乎所有社會現象都是接近於正態分佈的.如果所得到的統計資料呈非正態分佈則往往懷疑統計資料得不夠或有偏差;而不重視非正態分佈的研究,甚至對個別提出非正態分佈理論的人加以壓抑.皮爾遜認為,正態分佈只是一種分佈形態,他在高爾登優生學統計方法的啟示下,在1894年發表了《關於不對稱曲線的剖析》,1895年發表了《同類資料的偏斜變異》等論文,得到包括正態分佈、矩形分佈、J型分佈、U型分佈等13種曲線及其方程式.他的這一成果,打破了以往次數分佈曲線的“唯正態”觀念,推進了次數分佈曲線理論的發展和應用,為大樣本理論奠定了基礎.

      2.提出卡方(χ2)檢驗.皮爾遜認為,不管理論分佈造反得如何好,它與實際分佈之間總存在著或多或少的差異.這些差異是由於觀察次數不充分、隨機誤差太大引進的呢?還是由於所選配的理論分佈本身就與實際分佈有實質性差異?還需要用一種方法來檢驗.1900年,皮爾遜發表了一個著名的統計量,稱之為卡方(χ2),用來檢驗實際值的分佈數列與理論數列是否在合理範圍內相符合,即用以測定觀察值與期望值之間的差異顯著性.“卡方檢驗法” 提出後得到了廣泛的應用,在現代統計理論中佔有重要地位.  3.發展了相關和迴歸理論.皮爾遜推廣了高爾登的相關結論和方法,推匯出人們稱之為 “皮爾遜積動差”的公式和兩個其它相當的分工,給出了簡單的計算:說明對三個變數的一般相關理論,並且賦予多重回歸方程係數以零階相關係數的名稱.他意識到只有透過迴歸才能回答韋爾頓提出的關於出現相關器官的選擇問題,意識到要測定復回歸係數值,廣泛蒐集所有變數的基本平均數、標準差和相關的資料.他提出了淨相關、複相關、總相關、相關比等概念,發明了計算複相關和淨相關的方法及相關係數的公式.

      4.重視個體變異性的數量表現和變異資料的處理.皮爾遜認為,在各個個體之間真正變異性的概念,與在估算一個單值方面的誤差之間的機遇變異有著很大的差別.對這個觀念的強調,是他對生命瞭解的真正貢獻之一.他在1894年那篇關於不對稱次數曲線的論文中,提出了“標準差”及其符號 σ.

      5.推匯出統計學上的概差.皮爾遜推匯出他稱之為“頻率常數”的概差,並編制了各種概差計算表.這是他自己認為的最重要貢獻之一.這些概差對於先前缺乏度量的大多數統計資料的抽樣變異性,標誌著很大的進展.

      皮爾遜還發明瞭一種用於二項分佈的器械裝置.他對算術平均數、眾數、中位數之間的關係進行了深入的研究.他發現,在完全對稱分佈的資料中,算術平均數、眾數和中位數三者是重合在一起的,而當資料的分佈不對稱時,則算術平均數、眾數和中位數三點是分開的.如果這種不對稱的程度不嚴重,則三點可構成一固定關係.他還提出其它一些重要統計理論和方法,如統計假設所預計的結果、隨機移動、組間相關、四分相關以及力矩方法的應用等.

      1914年第一次世界大戰開始後,皮爾遜的研究轉向用統計來處理和完成大量與戰爭有關的特殊計算工作,為反法西斯戰爭服務.在這期間,他編輯發行了一些計算用表,以便利統計人員.戰爭結束後,他又立即回到各種統計理論方面的研究.1921年到1933年,他在倫敦大學學院應用統計系講授17、18世紀統計學史.1936年4月27日在英格蘭薩里郡的科爾德哈伯去世.

      皮爾遜的這些成就和貢獻,受到了統計學家們的推崇,使整個一代的西方的統計學家在他的影響下成長起來.皮爾遜於1896年被選為皇家學會會員,他還被選為“高爾登優生學教授”,是愛丁堡皇家學會的名譽會員、巴黎人類學會和前蘇聯人類學會的會員.

  • 中秋節和大豐收的關聯?
  • 哦香雪原文景物描寫及賞析?