-
1 # 傅渥成
-
2 # 天觀易3階控制論創新
先回答問題。樣本方差是為無偏估計總體方差而提出來的一個純統計量。從總體抽取的樣本由n個觀察值組成,顯然所由觀察值∑/n即為樣本平均數。然實驗科學家並末停止於樣本平均數,直覺告訴貧道樣本平均數只描述了樣本的一個平均水平,或者說是趨中心的狀態,而不能揭示離異程度。舉個例子,3,4和5這個樣本平均數為4。另一樣本1,4和7平均數也為4。直觀給我們的印象是後面這個樣本代表的總體離散程度顯然大於苐一樣本所代表的總體。這說明用樣本平均數不能描述一個總體,必須要有一個表示離開平均數的趨勢的統計量。苐一人選就是離差,即距離平均數之差。這個量是切題的,問題是平均數居中,各觀察值與平均數之差有正有負,而這產生一個,樣本離均差差之和為零,遊戲規則的零和問題,數學上處理這類問題是將離差,放大為方善(道人提醒世人注意,這裡順便回答一個潛在的悟空問題,為什麼不用離均差,而用方差,即方善為離均差的平方),由於在避免零和時施行丁平方處理,故需要用開方還原,道人自以為是已經尾尾道出樣本方差公式的全過程和邏輯關係。這是西方方法論最引為驕傲的觀念,而更是道人更引以自豪的強勢,因為成道以前在下野地,老炮臺,為了練出一枝之長,完全靠悟性悟透了這些統計數理邏輯思維,才得以從戈壁灘到悟出第一本油印版的在職博士論文《單一自由度方差背景的最佳化決策分析》,方差問題的關健不在計算公式,其思過半者為入統計物理,統計實驗設計聖殿的敲門磚,如楊振寧,李政道吳健雄聯手為國家爭得的一塊諾貝爾獎。
道人年輕盛氣自以為是可用古代中國傳統思維的智慧挑戰西方方法論的集大成者Fisher立於百年不敗的方差分析。這個目標一直在鼓動腦海中這初衷情結,英華人已經全盤照搬中國版小學數學。希望到初中版時能把以上道人論述方差公式用中國傳統思維版本重新寫出,作為東西方方法論之比較,
保留原叚子如下
方差公式的產生隱藏了統計設計思維的精確過程。即一個科學試驗如何比較試驗因子,方差用楊振寧理論應該屬區域性宇宙單位UOU,是為了解決從複雜試驗環境中分析各試驗因子的相對獨立效應,即科學試驗中平息因子間糾纏疊加爭議問題的方差分析,是現代實驗科學的一個里程碑,比如耍比較品種間的產量差異,為確保資料的料學性,試驗必須設重複以保證在試驗結果的可比性,科學性,可重複性。這就得用方差概念\來取代一個簡單的平均數比較,而需要引入離均善。一個離均差=觀察值一平均數,但就整體而言(∑離均差=O),即離均差的總和為零而無法承擔比較之職能,故把各均善平方,從而把負離均善變正值,為消除平方的影喲,用開方和除以自由度。自由度=n一1,減1的原因是在求平均數時用去了一個自由度,或者理解為有一個引數的約束,方差公式是初三代數,但理論解釋的邏輯關係是研究生的涵養。比如,一樣本有弓個觀察值,臺別為3,5和7,離均差為一2,0和十2離均差羊方和為8,則方善=√(8/(n一l))=2
貧道看見這個問題也就停指而閉目養神,回憶成道以前與之廝守二十多年專業,選擇這個專業自學的原因是其難度大夠刺激,一個腦袋一張紙一支筆就可以馳騁一片天地,無師自通而做出來一本統計學再職博士論文《單一自由破的方差最佳化決策分析》雄心壯志,通曉古音律三分損益五度相生,隔八夫妻中悟出西方統計設計的方法應該由東方三分損益中抽象出系統方法論,用我的頂層設計的宏觀思維模式取代西方人的統計方法,於是乎揹著一本油印版到倫敦帝國理工.,人算不如天算,公費學費不到位而成了道士.。故讀者在悟空問題依然可見道人頂層設計頭頭是道。一個自由波聯絡二個試驗,二斤試驗點將整體分三段。比較二組資料平均數,則一次對比試驗就可以去掉三分之一,則很快找到符合精確度的最佳結果,最近探索楊振寧為什麼一第論文第二年桂冠加頂,吳健雄女士設計的試驗左右對稱是否在衰變中守恆,正是頂層設計而不是西方的統計設計,她將一個系統,一切環境相同,唯一不同的是兩個計數粒子費的讀表,互為映象左右對稱,.天才的女生,如此巧奪天工的實驗構思,省了很多機率密度函式,理論曲線,顯著性標準,一個自由度,幾次重複,宇稱守恆則二表同,不守詔則二表讀不一樣。`頂層設計單一自由度的示意圖,一次減少三分之一,希望大家把這個方法論哲學\用牙各自的專業,,
回覆列表
既然是「方差」,所以很自然要計算一個「差」,然後計算一個「方」,「差」就是資料跟平均值的差,然後對它求平方。把這樣一個平方看成是與平均值之間的某種距離,然後對它求一個平均就可以了。
你可能馬上就會意識到,上面的這個說法似乎有不嚴格的地方。例如,在「樣本方差公式」裡,最引人注目的,就是這個公式裡的「平均」不是簡單去除以樣本量,而是要去除以樣本量減去1這樣一個奇怪的數字。這其實是這個問題的關鍵。
為什麼會出現這樣奇怪的情況呢?如果我就是要用資料量 n,那麼會造成怎樣的後果呢?這就要仔細來看看有關的推導了,注意看下面的一個推導(引用自維基百科):
在這個推導裡,我們就直接用的是除以 n,然而在推導下來之後我們會發現,除非是在統計估計中,估計的 X 平均跟真實的平均值完全相等時,我們才能得到正確的方差,否則,如果我們除以 n,得到的方差總比真實的方差小那麼一點點,這一點點差別就是「偏差」。使用 n-1,就意味著我們在進行的是「無偏估計」。
還有一種更直觀的理解,因為在計算方差的時候我們用到了平均值,而一旦有了平均值,原始資料的 n 個數就不再獨立了,例如我知道,兩個數字的平均值是 60,然後我又知道了其中一個數字是 58,另一個數字我不看就知道肯定是 62。如果原始資料有 n 個,在計算的時候還知道了(估計的)平均值,那麼這 n 個數據裡,真正獨立的只有 n - 1 個,所以應該用 n - 1。