我試著把我的理解用通俗的語言表達出來。
1.為什麼有統計學?就是因為我們沒有辦法窮盡所有的資料,只能從整體中取出部分,透過研究部分來推測整體。從部分推斷整體,包含著兩個基本思想,一是帶有機率性質的反證法,一是小機率事件。
2.所謂反證法是指,先建立兩個命題,在假設檢驗中叫做假設(hypothesis),一個叫H0,表示原假設(null hypothesis),一個叫H1代表備擇假設或對立假設(alternative hypothesis)。那怎麼確定H0和H1呢?
思考的邏輯是:為了檢驗H0是否正確,先假定它正確。如果樣本的觀測值得出一個與H0應有的結果完全矛盾的結果,我們就“不能接受(拒絕)H0”,轉而接受H1的假設。如果沒有出現矛盾的結果,注意,這時我們不能斷定“接受(不拒絕)H0",我們只能說,沒有足夠的證據證明H0是錯誤的,這時是不能肯定H0是一定正確的。這裡有點繞,如果理解了這點,下面就好說了。
出於以上的情況。H0,H1是不對等的,不能隨意交換的。在一般情況下H0要取那個在實踐中受到保護 、不證自明、要有足夠的證據才能否定它的等等諸如此類的命題。我們把相等的、無差別的、等號成立的結論作為H0,將待證明的、不相等的、有差別的命題作為H1。所以在具體統計中的引數檢驗,H0一定是等於,H1則是大於、小於或者不相等。
用一個不是十分恰當的比喻,H0的設定就類似於審判中的無罪推定,法官審案的時候,總是先假設嫌疑人是一個無罪之人,然後看看檢方的證據是否充分來推翻無罪的假設(H0),從而接受H1,判定嫌疑人有罪。如果找不到足夠的證據來證明嫌疑人有罪,那隻能接受H0(無罪),宣佈嫌疑人清白,即使可能他真的犯了法。反之,我們不能一開始就假設一個嫌疑人有罪,那就亂了。
3.我們解釋了H0的選定原則,那什麼就叫“有足夠的證據”,這就是統計推論的第二個原則:小機率事件。根據常識,在假定H0成立的情況下,小機率的事件幾乎不會發生,如果發生了,很大的可能性就是H0的假設不成立。小機率小到多少,這就是“P值"乾的活了。那有沒有小機率發生了H0卻是正確的誤殺情況呢?當然有,這又是所謂的“α錯誤”和“β錯誤”了。這裡不再羅嗦了。
我試著把我的理解用通俗的語言表達出來。
1.為什麼有統計學?就是因為我們沒有辦法窮盡所有的資料,只能從整體中取出部分,透過研究部分來推測整體。從部分推斷整體,包含著兩個基本思想,一是帶有機率性質的反證法,一是小機率事件。
2.所謂反證法是指,先建立兩個命題,在假設檢驗中叫做假設(hypothesis),一個叫H0,表示原假設(null hypothesis),一個叫H1代表備擇假設或對立假設(alternative hypothesis)。那怎麼確定H0和H1呢?
思考的邏輯是:為了檢驗H0是否正確,先假定它正確。如果樣本的觀測值得出一個與H0應有的結果完全矛盾的結果,我們就“不能接受(拒絕)H0”,轉而接受H1的假設。如果沒有出現矛盾的結果,注意,這時我們不能斷定“接受(不拒絕)H0",我們只能說,沒有足夠的證據證明H0是錯誤的,這時是不能肯定H0是一定正確的。這裡有點繞,如果理解了這點,下面就好說了。
出於以上的情況。H0,H1是不對等的,不能隨意交換的。在一般情況下H0要取那個在實踐中受到保護 、不證自明、要有足夠的證據才能否定它的等等諸如此類的命題。我們把相等的、無差別的、等號成立的結論作為H0,將待證明的、不相等的、有差別的命題作為H1。所以在具體統計中的引數檢驗,H0一定是等於,H1則是大於、小於或者不相等。
用一個不是十分恰當的比喻,H0的設定就類似於審判中的無罪推定,法官審案的時候,總是先假設嫌疑人是一個無罪之人,然後看看檢方的證據是否充分來推翻無罪的假設(H0),從而接受H1,判定嫌疑人有罪。如果找不到足夠的證據來證明嫌疑人有罪,那隻能接受H0(無罪),宣佈嫌疑人清白,即使可能他真的犯了法。反之,我們不能一開始就假設一個嫌疑人有罪,那就亂了。
3.我們解釋了H0的選定原則,那什麼就叫“有足夠的證據”,這就是統計推論的第二個原則:小機率事件。根據常識,在假定H0成立的情況下,小機率的事件幾乎不會發生,如果發生了,很大的可能性就是H0的假設不成立。小機率小到多少,這就是“P值"乾的活了。那有沒有小機率發生了H0卻是正確的誤殺情況呢?當然有,這又是所謂的“α錯誤”和“β錯誤”了。這裡不再羅嗦了。