先區別幾個概念:
1、樣本的標準偏差 ≠ 總體的標準偏差 ≠ 統計學標準偏差
2、在總體符合正態分佈的前提下:總體的標準偏差=統計學標準偏差
3、當樣本有代表性時:樣本的標準偏差≈總體的標準偏差。即,透過樣本的標準偏差可以估計總體的標準偏差。
然後要區分以上實用意義上的統計和數學意義上的統計:
要對實際情況進行數學上的統計處理,前提是符合正態分佈函式,在這個前提下可以套用正態分佈函式推匯出來的一系列公式,包括標準偏差公式。
再說直白一點:對於實際統計物件,每個個體相對於平均值的離散程度可以用s=((X樣品-X平均)^2/n)^0.5這個計算值來表示。對於正態分佈函式,σ值可以表示函式影象的半高寬度。這兩個本來沒有任何聯絡。只有當實際的統計物件的分佈符合正態函式時,這兩個才具有相等的關係。
接下來針對問題講:
標準偏差的公式是正態分佈函式推導的結果,但是有適用條件。
對於總體,也就是n無限大。這個時候用除以n的公式計算,是符合公式適用條件的。
對於樣本,n是有限值,不符合適用條件,所以不能直接套用除以n的公式。
為了能夠從有限的樣本中估算出無限的總體的標準偏差,必須使用近似計算。至於如何近似計算,理論上可以有很多種,而使用除以n-1計算的這個公式經過證明,在任何時候都是能夠得到比較接總體標準偏差的結果,這就是所說的無偏估計。用數學的說法就是:這個估計值與正值之間的誤差是收斂的。用通俗的話說,就是這個估計值比較靠譜。
數學上講,當n越大時,這個估計值就越接近真值。實際意義就是,樣本數量越大,就越能代表總體。
至於說這些公式具體的推導證明過程,其實我也忘記了。因為實際使用中基本上用不到,只用記住結果,明白意義就夠了。
先區別幾個概念:
1、樣本的標準偏差 ≠ 總體的標準偏差 ≠ 統計學標準偏差
2、在總體符合正態分佈的前提下:總體的標準偏差=統計學標準偏差
3、當樣本有代表性時:樣本的標準偏差≈總體的標準偏差。即,透過樣本的標準偏差可以估計總體的標準偏差。
然後要區分以上實用意義上的統計和數學意義上的統計:
要對實際情況進行數學上的統計處理,前提是符合正態分佈函式,在這個前提下可以套用正態分佈函式推匯出來的一系列公式,包括標準偏差公式。
再說直白一點:對於實際統計物件,每個個體相對於平均值的離散程度可以用s=((X樣品-X平均)^2/n)^0.5這個計算值來表示。對於正態分佈函式,σ值可以表示函式影象的半高寬度。這兩個本來沒有任何聯絡。只有當實際的統計物件的分佈符合正態函式時,這兩個才具有相等的關係。
接下來針對問題講:
標準偏差的公式是正態分佈函式推導的結果,但是有適用條件。
對於總體,也就是n無限大。這個時候用除以n的公式計算,是符合公式適用條件的。
對於樣本,n是有限值,不符合適用條件,所以不能直接套用除以n的公式。
為了能夠從有限的樣本中估算出無限的總體的標準偏差,必須使用近似計算。至於如何近似計算,理論上可以有很多種,而使用除以n-1計算的這個公式經過證明,在任何時候都是能夠得到比較接總體標準偏差的結果,這就是所說的無偏估計。用數學的說法就是:這個估計值與正值之間的誤差是收斂的。用通俗的話說,就是這個估計值比較靠譜。
數學上講,當n越大時,這個估計值就越接近真值。實際意義就是,樣本數量越大,就越能代表總體。
至於說這些公式具體的推導證明過程,其實我也忘記了。因為實際使用中基本上用不到,只用記住結果,明白意義就夠了。