1.問題的提出: 在實踐中我們常常遇到以下一些資料,如需比較患者和正常人的血鐵蛋白、血鉛值、不同藥物的溶解時間、實驗鼠發癌後的生存日數、護理效果評分等,這類資料有如下特點: (1)資料的總體分佈型別未知;或 (2)資料分佈型別已知,但不符合正態分佈;或 (3)某些變數可能無法精確測量。 對於此類資料,除了進行變數變換或t’檢驗外,可採用非引數統計方法。 2.引數統計與非引數統計的區別: 引數統計:即總體分佈型別已知,用樣本指標對總體引數進行推斷或作假設檢驗的統計分析方法。 非引數統計:即不考慮總體分佈型別是否已知,不比較總體引數,只比較總體分佈的位置是否相同的統計方法。 下面我們將介紹非引數統計中一種常用的檢驗方法--秩和檢驗,其中“秩”又稱等級、即按資料大小排定的次序號。上述次序號的和稱“秩和”,秩和檢驗就是用秩和作為統計量進行假設檢驗的方法。 二、 不同設計和資料型別的秩和檢驗 1.配對比較的資料: 對配對比較的資料應採用符合秩和檢驗(Sighed rank test),其基本思想是:若檢驗假設成立,則差值的總體分佈應是對稱的,故正負秩和相差不應懸殊。檢驗的基本步驟為: (1)建立假設; H0:差值的總體中位數為0; H1:差值的總體中位數不為0;檢驗水準為0.05。 (2)算出各對值的代數差; (3)根據差值的絕對值大小編秩; (4)將秩次冠以正負號,計算正、負秩和; (5)用不為“0”的對子數n及T(任取T+或T-)查檢驗界值表得到P值作出判斷。 應注意的是當n>25時,可用正態近似法計算u值進行u檢驗,當相同秩次較多時u值需進行校正。 2. 兩樣本成組比較: 兩樣本成組資料的比較應用Wilcoxon秩和檢驗,其基本思想是:若檢驗假設成立,則兩組的秩和不應相差太大。其基本步驟是: (1)建立假設; H0:比較兩組的總體分佈相同; H1:比較兩組的總體分佈位置不同;檢驗水準為0.05。 (2)兩組混合編秩; (3)求樣本數最小組的秩和作為檢驗統計量T; (4)以樣本含量較小組的個體數n1、兩組樣本含量之差n2-n1及T值查檢驗界值表; (5)根據P值作出統計結論。 同樣應注意的是,當樣本含量較大時,應用正態近似法作u檢驗;當相同秩次較多時,應用校正公式計算u值。 3.多個樣本比較: 多個樣本比較的秩和檢驗可用Kruskal-Wallis法,其基本步驟為: (1)建立假設; H0:比較各組總體分佈相同; H1:比較各組總體分佈位置不同或不全相同;檢驗水準為0.05。 (2)多組混合編秩; (3)計算各組秩和Ri; (4)利用Ri計算出檢驗統計量H; (5)查H界值表或利用卡方值確定機率大小。 應注意的是當相同秩次較多時,應計算校正Hc 4.按等級分組資料或頻數表資料: 這類資料的特點是無原始值,只知其所在組段,故應用該組段秩次的平均值作為其秩次,在此基礎上計算秩和並進行假設檢驗,其步驟與兩組或多組比較秩和檢驗相同。需注意的是由於樣本含量較多,相同秩次也較多,應用校正後的u值和H值。 三、小結 1.多個樣本兩兩比較的秩和檢驗 同樣的,多個樣本組比較的秩和檢驗,如拒絕H0,只說明比較各組的總體分佈位置不同或不全相同,應在此基礎上進行兩兩比較,常用Nemenyi法。 2.秩和檢驗的優缺點 秩和檢驗的優點是(1)不受總體分佈限制,適用面廣;(2)適用於等級資料及兩端無缺定值的資料;(3)易於理解,易於計算。缺點是符合引數檢驗的資料,用秩和檢驗,則不能充分利用資訊,檢驗效能低。 3.應用中的注意事項: (1)注意應用條件; (2)編秩時相同值要取平均秩次; (3)相同秩次較多時,統計量要校正。
1.問題的提出: 在實踐中我們常常遇到以下一些資料,如需比較患者和正常人的血鐵蛋白、血鉛值、不同藥物的溶解時間、實驗鼠發癌後的生存日數、護理效果評分等,這類資料有如下特點: (1)資料的總體分佈型別未知;或 (2)資料分佈型別已知,但不符合正態分佈;或 (3)某些變數可能無法精確測量。 對於此類資料,除了進行變數變換或t’檢驗外,可採用非引數統計方法。 2.引數統計與非引數統計的區別: 引數統計:即總體分佈型別已知,用樣本指標對總體引數進行推斷或作假設檢驗的統計分析方法。 非引數統計:即不考慮總體分佈型別是否已知,不比較總體引數,只比較總體分佈的位置是否相同的統計方法。 下面我們將介紹非引數統計中一種常用的檢驗方法--秩和檢驗,其中“秩”又稱等級、即按資料大小排定的次序號。上述次序號的和稱“秩和”,秩和檢驗就是用秩和作為統計量進行假設檢驗的方法。 二、 不同設計和資料型別的秩和檢驗 1.配對比較的資料: 對配對比較的資料應採用符合秩和檢驗(Sighed rank test),其基本思想是:若檢驗假設成立,則差值的總體分佈應是對稱的,故正負秩和相差不應懸殊。檢驗的基本步驟為: (1)建立假設; H0:差值的總體中位數為0; H1:差值的總體中位數不為0;檢驗水準為0.05。 (2)算出各對值的代數差; (3)根據差值的絕對值大小編秩; (4)將秩次冠以正負號,計算正、負秩和; (5)用不為“0”的對子數n及T(任取T+或T-)查檢驗界值表得到P值作出判斷。 應注意的是當n>25時,可用正態近似法計算u值進行u檢驗,當相同秩次較多時u值需進行校正。 2. 兩樣本成組比較: 兩樣本成組資料的比較應用Wilcoxon秩和檢驗,其基本思想是:若檢驗假設成立,則兩組的秩和不應相差太大。其基本步驟是: (1)建立假設; H0:比較兩組的總體分佈相同; H1:比較兩組的總體分佈位置不同;檢驗水準為0.05。 (2)兩組混合編秩; (3)求樣本數最小組的秩和作為檢驗統計量T; (4)以樣本含量較小組的個體數n1、兩組樣本含量之差n2-n1及T值查檢驗界值表; (5)根據P值作出統計結論。 同樣應注意的是,當樣本含量較大時,應用正態近似法作u檢驗;當相同秩次較多時,應用校正公式計算u值。 3.多個樣本比較: 多個樣本比較的秩和檢驗可用Kruskal-Wallis法,其基本步驟為: (1)建立假設; H0:比較各組總體分佈相同; H1:比較各組總體分佈位置不同或不全相同;檢驗水準為0.05。 (2)多組混合編秩; (3)計算各組秩和Ri; (4)利用Ri計算出檢驗統計量H; (5)查H界值表或利用卡方值確定機率大小。 應注意的是當相同秩次較多時,應計算校正Hc 4.按等級分組資料或頻數表資料: 這類資料的特點是無原始值,只知其所在組段,故應用該組段秩次的平均值作為其秩次,在此基礎上計算秩和並進行假設檢驗,其步驟與兩組或多組比較秩和檢驗相同。需注意的是由於樣本含量較多,相同秩次也較多,應用校正後的u值和H值。 三、小結 1.多個樣本兩兩比較的秩和檢驗 同樣的,多個樣本組比較的秩和檢驗,如拒絕H0,只說明比較各組的總體分佈位置不同或不全相同,應在此基礎上進行兩兩比較,常用Nemenyi法。 2.秩和檢驗的優缺點 秩和檢驗的優點是(1)不受總體分佈限制,適用面廣;(2)適用於等級資料及兩端無缺定值的資料;(3)易於理解,易於計算。缺點是符合引數檢驗的資料,用秩和檢驗,則不能充分利用資訊,檢驗效能低。 3.應用中的注意事項: (1)注意應用條件; (2)編秩時相同值要取平均秩次; (3)相同秩次較多時,統計量要校正。