t檢驗線上性迴歸中的應用
不僅僅比較兩組資料的均值,t檢驗主要利用t分佈檢驗某一樣本統計量是否與總體引數相等,其形式為:無效假設H0:樣本統計量=總體引數,如果在單樣本t檢驗中,樣本統計量是樣本均值,總體引數是總體均值,因此它要檢驗的是樣本均值與總體均值是否相等,再如在兩獨立樣本t檢驗中,樣本統計量是兩組均值差,總體引數是兩總體均值差,因此它要檢驗的是兩樣本均值差與兩總體均值差是否相等,而線上性迴歸中 ,我們需要檢驗的是迴歸係數是否為0,因為如果迴歸係數為0,則說明自變數對因變數毫無影響,因此它也是樣本統計量=總體引數的形式。
t檢驗的替代——Wilcoxon秩和檢驗
當資料嚴重偏離正態性時,t檢驗已經很難以反映資料的實際情況,所以此時往往採用Wilcoxon秩和檢驗。
Wilcoxon不是對原始資料進行分析,而是將原始資料進行排序,以其秩次進行 分析,這樣可以避免嚴重偏態問題,然而儘管能夠糾正偏態問題,秩和檢驗會損失一部分資訊,只有當資料不滿足正態性時,秩和檢驗的效率才遠遠高於t檢驗。
Wilcoxon秩和檢驗的思想是,假定有兩組例數分別為n1和n2,首先將兩組資料混合後排序,每個數值都有相同的機會排序為1,2,…,n1+n2,不難理解,如果來各組資料來自相同 的 總體,那麼理論上兩組資料排序後秩次之和應該相等,都等於(1+2+…+n1+n2)/2,當然,由於抽樣誤差的存在,兩組資料排序後的之和不可能正好都等於(1+2+…+n1+n2)/2,但肯定應該相差不大,如果差別太大,那就說明一開始的假設可能就有問題。
Ref: 《白話統計》馮國雙著