方差是實際值與期望值之差平方的平均值。方差,通俗點講,就是和中心偏離的程度!用來衡量一批資料的波動大小(即這批資料偏離平均數的大小)並把它叫做這組資料的方差。記作S2。 在樣本容量相同的情況下,方差越大,說明資料的波動越大,越不穩定。標準差就是方差的平方根。方差和標準差用於不同場合,方便計算。
(標準差英文解釋)
?
方差公式
標準差公式
難點來了,總體標準差和樣本標準差的公式是有區別的,如下圖
樣本標準差公式中,分母是n-1。
為何樣本標準差的分母為何是n-1,而不是n或n-2?
我們用計算機建模,環境Anaconda(python2.7)
引數解釋:
Sigma表示總體標準差
S表示樣本標準差
ddofValue=0牨硎狙頸曜疾罘幟甘莕
ddofValue=1 表示樣本標準差分母是n-1
ddofValue=2 表示樣本標準差分母是n-2
演算法思路:
1.模擬出一個總體(服從正態分佈的1000個隨機數)
2.牬幼芴逯興婊檠?00個隨機數)
3.分別算出總體和樣本的標準差,然後相減得到distance差值
4.迴圈1000次試驗,把1000個distance相加,得到total_distance
5.在步驟3中,分別對樣本標準差的分母取n, n-1,n-2, 犠鈧盞玫絛ict_modes
觀察dict_modes,ddof1的絕對值最小3.8
方差是實際值與期望值之差平方的平均值。方差,通俗點講,就是和中心偏離的程度!用來衡量一批資料的波動大小(即這批資料偏離平均數的大小)並把它叫做這組資料的方差。記作S2。 在樣本容量相同的情況下,方差越大,說明資料的波動越大,越不穩定。標準差就是方差的平方根。方差和標準差用於不同場合,方便計算。
(標準差英文解釋)
?
方差公式
?
標準差公式
?
難點來了,總體標準差和樣本標準差的公式是有區別的,如下圖
?
樣本標準差公式中,分母是n-1。
?
為何樣本標準差的分母為何是n-1,而不是n或n-2?
我們用計算機建模,環境Anaconda(python2.7)
?
引數解釋:
Sigma表示總體標準差
S表示樣本標準差
ddofValue=0牨硎狙頸曜疾罘幟甘莕
ddofValue=1 表示樣本標準差分母是n-1
ddofValue=2 表示樣本標準差分母是n-2
演算法思路:
1.模擬出一個總體(服從正態分佈的1000個隨機數)
2.牬幼芴逯興婊檠?00個隨機數)
3.分別算出總體和樣本的標準差,然後相減得到distance差值
4.迴圈1000次試驗,把1000個distance相加,得到total_distance
5.在步驟3中,分別對樣本標準差的分母取n, n-1,n-2, 犠鈧盞玫絛ict_modes
觀察dict_modes,ddof1的絕對值最小3.8