常用統計量:
1、樣本均值:X¯=1n∑ni=1XiX¯=1n∑i=1nXi.
2、樣本方差:S2=1n−1∑ni=1(Xi−X¯)2S2=1n−1∑i=1n(Xi−X¯)2.
統計量的分佈——四大分佈:
1、正態分佈:
X∼N(μ,σ2)X∼N(μ,σ2), 期望:EX=μEX=μ, 方差:DX=σ2DX=σ2, 標準化:X−μσ2∼N(0,1)X−μσ2∼N(0,1).
2、χ2χ2分佈:
若X1,X2,...Xn∼N(0,1)X1,X2,...Xn∼N(0,1),則
X=∑i=1nX2i∼χ2(n),自由度為n
X=∑i=1nXi2∼χ2(n),自由度為n
EX=n,DX=2n
χ2χ2分佈標題
3、t分佈(學生分佈):
若X∼N(0,1)X∼N(0,1),若Y∼χ2(n)Y∼χ2(n),且X,YX,Y相互獨立:
t=XYn−−√∼t(n),自由度為n.
t=XYn∼t(n),自由度為n.
t分佈
4、F分佈:
若X∼χ2(n1)X∼χ2(n1),若Y∼χ2(n2)Y∼χ2(n2),且X,YX,Y相互獨立:
F=X/n1Y/n2∼F(n1,n2)自由度n1,n2.
F分佈
上αα分位數:
P(U≥uα)=αP(U≥uα)=α,uαuα為上αα分位數.
透過查表可得到αα(機率密度函式的面積)對應的uαuα(分位值)的值.
上αα分位數
置信度(置信水平)、置信區間:
P(|X¯−μ|<δ)=1−α,1−αP(|X¯−μ|<δ)=1−α,1−α為置信度, αα為顯著性水平,人為選取.
大樣本情況下, 由中心極限定理可知:
不論Xi∼iidF(μ,σ2)(任意分佈)Xi∼iidF(μ,σ2)(任意分佈),有
∑i=1nXi∼n→∞N(nμ,nσ2)
X¯X¯與S2S2相互獨立, 且EX¯=μ,DX¯=1nσ2,ES2=σ2EX¯=μ,DX¯=1nσ2,ES2=σ2.
下面就可以根據樣本統計量得到關於被估計引數測量值的分佈情況:
S2=1n−1∑i=1n(Xi−X¯)2
(n−1)S2σ2=∑i=1n(Xi−X¯σ)2∼χ2(n−1)
X¯−μS/n−−√=X¯−μσ/nS/σ=X¯−μσ/n√(n−1)S2/σ2n−1−−−−−−−−√∼t(n−1).
X¯−μS/n=X¯−μσ/nS/σ=X¯−μσ/n(n−1)S2/σ2n−1∼t(n−1).
到此, 得到了t分佈, t分佈為已知分佈, 置信區間自然唾手可得:
P(∣∣∣X¯−μS/n−−√∣∣∣<δS/n−−√)=1−α
P(|X¯−μS/n|<δS/n)=1−α
P(|t|<tα2(n−1))=1−α
δ=tα2(n−1)S/n−−√
δ=tα2(n−1)S/n
樣本均值X¯=μX¯=μ的機率為0, 但μμ落在會以置信度1−α1−α為機率落在置信區間(X¯−δ,X¯+δ)(X¯−δ,X¯+δ)上.
常用統計量:
1、樣本均值:X¯=1n∑ni=1XiX¯=1n∑i=1nXi.
2、樣本方差:S2=1n−1∑ni=1(Xi−X¯)2S2=1n−1∑i=1n(Xi−X¯)2.
統計量的分佈——四大分佈:
1、正態分佈:
X∼N(μ,σ2)X∼N(μ,σ2), 期望:EX=μEX=μ, 方差:DX=σ2DX=σ2, 標準化:X−μσ2∼N(0,1)X−μσ2∼N(0,1).
2、χ2χ2分佈:
若X1,X2,...Xn∼N(0,1)X1,X2,...Xn∼N(0,1),則
X=∑i=1nX2i∼χ2(n),自由度為n
X=∑i=1nXi2∼χ2(n),自由度為n
EX=n,DX=2n
EX=n,DX=2n
χ2χ2分佈標題
3、t分佈(學生分佈):
若X∼N(0,1)X∼N(0,1),若Y∼χ2(n)Y∼χ2(n),且X,YX,Y相互獨立:
t=XYn−−√∼t(n),自由度為n.
t=XYn∼t(n),自由度為n.
t分佈
4、F分佈:
若X∼χ2(n1)X∼χ2(n1),若Y∼χ2(n2)Y∼χ2(n2),且X,YX,Y相互獨立:
F=X/n1Y/n2∼F(n1,n2)自由度n1,n2.
F=X/n1Y/n2∼F(n1,n2)自由度n1,n2.
F分佈
上αα分位數:
P(U≥uα)=αP(U≥uα)=α,uαuα為上αα分位數.
透過查表可得到αα(機率密度函式的面積)對應的uαuα(分位值)的值.
上αα分位數
置信度(置信水平)、置信區間:
P(|X¯−μ|<δ)=1−α,1−αP(|X¯−μ|<δ)=1−α,1−α為置信度, αα為顯著性水平,人為選取.
大樣本情況下, 由中心極限定理可知:
不論Xi∼iidF(μ,σ2)(任意分佈)Xi∼iidF(μ,σ2)(任意分佈),有
∑i=1nXi∼n→∞N(nμ,nσ2)
∑i=1nXi∼n→∞N(nμ,nσ2)
X¯X¯與S2S2相互獨立, 且EX¯=μ,DX¯=1nσ2,ES2=σ2EX¯=μ,DX¯=1nσ2,ES2=σ2.
下面就可以根據樣本統計量得到關於被估計引數測量值的分佈情況:
S2=1n−1∑i=1n(Xi−X¯)2
S2=1n−1∑i=1n(Xi−X¯)2
(n−1)S2σ2=∑i=1n(Xi−X¯σ)2∼χ2(n−1)
(n−1)S2σ2=∑i=1n(Xi−X¯σ)2∼χ2(n−1)
X¯−μS/n−−√=X¯−μσ/nS/σ=X¯−μσ/n√(n−1)S2/σ2n−1−−−−−−−−√∼t(n−1).
X¯−μS/n=X¯−μσ/nS/σ=X¯−μσ/n(n−1)S2/σ2n−1∼t(n−1).
到此, 得到了t分佈, t分佈為已知分佈, 置信區間自然唾手可得:
P(∣∣∣X¯−μS/n−−√∣∣∣<δS/n−−√)=1−α
P(|X¯−μS/n|<δS/n)=1−α
P(|t|<tα2(n−1))=1−α
P(|t|<tα2(n−1))=1−α
δ=tα2(n−1)S/n−−√
δ=tα2(n−1)S/n
樣本均值X¯=μX¯=μ的機率為0, 但μμ落在會以置信度1−α1−α為機率落在置信區間(X¯−δ,X¯+δ)(X¯−δ,X¯+δ)上.