回覆列表
  • 1 # 手機使用者86481032040

    結論:區間估計和假設檢驗有極大的相似性,因為他們都是基於樞軸量(Pivot)的統計推斷。兩者的區別在於解決的問題不相同。

    先舉個例子,假設樣本服從正態分佈 ,而方差 已知。考慮關於均值的假設檢驗問題: 。則顯著性水平為 下的拒絕域為 . 因此,接受域為 . 而置信水平為 的置信區間為 。

    乍看之下,統計推斷中的接受域似乎就是置信區間。而且在其他的例子中,這種規律依然存在。這並不是純粹的巧合,我們稱之為區間估計和假設檢驗的二重性(Duality)。存在這種相似性的原因是因為他們都是基於相同的出發點——樞軸量。

    相似性:

    我們先回憶一下兩者的定義。(為簡化起見,以下只對連續型變數考慮。)

    區間估計是找到一個隨機的區間,使得區間包含真實引數的機率等於一個固定的值 ,我們稱這個值為置信水平。假設檢驗是去判斷某個假設是否真實,使得在原假設真實的情況下,犯錯的機率等於一個固定的值 ,我們稱之為顯著性水平。

    由於被估計或被推斷的引數是未知的,如上面例子中的均值 ,因此我們必須找到一個變數,使得他的分佈已知。我們稱這種變數叫做樞軸量。舉例而言,對於上面的例子,我們可以選取變數 為樞軸量,而其分佈已知為標準正態分佈。

    在樞軸量的基礎下,如果我們想進行區間估計,即找到一個區間使得區間包含真實引數的機率等於 ,我們可以限制 ;如果我們想進行統計推斷,即在原假設真實的情況下,犯錯的機率等於 ,我們可以限制 .因此,兩者求解出來的應該是等價的。

    更一般的而言,對於任意的區間估計及假設檢驗問題,置信水平為 的區間估計和顯著性水平為 的統計推斷等價。而這種等價正是基於兩者有相同的出發點——樞軸量。

    區別:

    兩者的最大區別在於解決問題的不相同。相比於區間估計,統計推斷對引數有一定的假設,即除非在資料及其不可能在原假設中發生時時,傾向於不拒絕原假設。這個性質使得統計推斷對於引數有傾向性。然而區間估計並沒有作出任何假設,它只是計算了一個隨機區間。在資料量極少或樣本的方差巨大的時候,或許假設推斷會聲稱自己的原假設正確,如 ,但區間估計則會給出一個很大的範圍,如 。

    再出一個我常常問的面試題吧:

    假設有兩個機器隨機獨立的生成1或0,即Bernoulli分佈 。機器A以10%的機率生成1,而機器B以20%的機率生成1。請設計一個實驗,要求分辨資料是從機器A生成的還是機器B生成的(檢測方法,樣本數量,如何改進)。

    Hint:做假設檢驗的小夥伴都被拒了噢( >﹏<。)~

  • 中秋節和大豐收的關聯?
  • 黑色素沉著是怎麼回事,要做些什麼事情才會改善?