區間表示方法，和與並的區別？

首頁>Club>2021-04-01 18:55

區間表示方法，和與並的區別？

回覆列表

1 # 手機使用者86481032040

結論：區間估計和假設檢驗有極大的相似性，因為他們都是基於樞軸量(Pivot)的統計推斷。兩者的區別在於解決的問題不相同。

先舉個例子，假設樣本服從正態分佈，而方差已知。考慮關於均值的假設檢驗問題：。則顯著性水平為下的拒絕域為 . 因此，接受域為 . 而置信水平為的置信區間為。

乍看之下，統計推斷中的接受域似乎就是置信區間。而且在其他的例子中，這種規律依然存在。這並不是純粹的巧合，我們稱之為區間估計和假設檢驗的二重性(Duality)。存在這種相似性的原因是因為他們都是基於相同的出發點——樞軸量。
相似性：
我們先回憶一下兩者的定義。（為簡化起見，以下只對連續型變數考慮。）

區間估計是找到一個隨機的區間，使得區間包含真實引數的機率等於一個固定的值，我們稱這個值為置信水平。假設檢驗是去判斷某個假設是否真實，使得在原假設真實的情況下，犯錯的機率等於一個固定的值，我們稱之為顯著性水平。

由於被估計或被推斷的引數是未知的，如上面例子中的均值，因此我們必須找到一個變數，使得他的分佈已知。我們稱這種變數叫做樞軸量。舉例而言，對於上面的例子，我們可以選取變數為樞軸量，而其分佈已知為標準正態分佈。

在樞軸量的基礎下，如果我們想進行區間估計，即找到一個區間使得區間包含真實引數的機率等於，我們可以限制 ;如果我們想進行統計推斷，即在原假設真實的情況下，犯錯的機率等於，我們可以限制 .因此，兩者求解出來的應該是等價的。
更一般的而言，對於任意的區間估計及假設檢驗問題，置信水平為的區間估計和顯著性水平為的統計推斷等價。而這種等價正是基於兩者有相同的出發點——樞軸量。
區別：
兩者的最大區別在於解決問題的不相同。相比於區間估計，統計推斷對引數有一定的假設，即除非在資料及其不可能在原假設中發生時時，傾向於不拒絕原假設。這個性質使得統計推斷對於引數有傾向性。然而區間估計並沒有作出任何假設，它只是計算了一個隨機區間。在資料量極少或樣本的方差巨大的時候，或許假設推斷會聲稱自己的原假設正確，如，但區間估計則會給出一個很大的範圍，如。
再出一個我常常問的面試題吧：
假設有兩個機器隨機獨立的生成1或0，即Bernoulli分佈。機器A以10%的機率生成1，而機器B以20%的機率生成1。請設計一個實驗，要求分辨資料是從機器A生成的還是機器B生成的（檢測方法，樣本數量，如何改進）。
Hint：做假設檢驗的小夥伴都被拒了噢( >﹏<。)～

∧ 中秋節和大豐收的關聯？

∨ 黑色素沉著是怎麼回事，要做些什麼事情才會改善？

熱門排行

劇多

區間表示方法，和與並的區別？