非引數統計是統計學的一個重要分支,它在實踐中有著廣泛的應用。所謂統計推斷,就是由樣本觀察值去了解總體,它是統計學的基本任務之一。若根據經驗或某種理論我們能在推斷之前就對總體作一些假設,則這些假設無疑有助於提高統計推斷的效率。這種情況下的統計方法稱為“引數統計”。如果我們所知很少,以致於在推斷之前不能對總體作任何假設,或僅能作一些非常一般性(例如連續分佈、對稱分佈等)的假設,這時如果仍然使用引數統計方法,其統計推斷的結果顯然是不可信的,甚至有可能是錯的。在對總體的分佈不作假設或僅作非常一般性假設條件下的統計方法稱為“非引數統計”。
由於非引數統計方法與總體究竟是什麼分佈幾乎沒有什麼關係,所以它的應用範圍很廣,它在社會學、醫學、生物學、心理學、教育學等領域都有著廣泛的應用。由於有關於總體的假設,所以引數統計的推斷方法是針對這個假設的。相對而言,非引數統計的推斷方法是很一般的,它僅應用樣本觀察值中一些非常直觀(例如次序)的資訊。所以非引數統計分析含有豐富的統計思想。
非引數統計的適用範圍
非引數統計最常用於具備下述特徵的情況:
1、待分析資料不滿足引數檢驗所要求的假定,因而無法應用引數檢驗。例如,我們曾遇到過的非正態總體小樣本,在t-檢驗法也不適用時,作為替代方法,就可以採用非引數檢驗。
2、僅由一些等級構成的資料,不能應用引數檢驗。例如,消費者可能被問及對幾種不同商標的飲料的喜歡程度,雖然,他們不能對每種商標都指定一個數字來表示他們對該商標的喜歡程度,卻能將幾種商標按喜歡的順序分成等級。這種情形也宜採用非引數檢驗。
3、所提的問題中並不包含引數,也不能用引數檢驗。例如,我們想判斷一個樣本是否為隨機樣本,採用非引數檢驗法就是適當的。
4、當我們需要迅速得出結果時,也可以不用引數統計方法而用非引數統計方法來達到目的。一般說來,非引數統計方法所要求的計算與引數統計方法相比,完成起來既快且易。有些非引數統計方法的計算,就算對統計學知識不熟練的人,也能在收集資料時及時予以完成。
非引數統計的特點
非引數統計問題中對總體分佈的假定要求的條件很寬,因而針對這種問題而構造的非引數統計方法,不致因為對總體分佈的假定不當而導致重大錯誤,所以它往往有較好的穩健性(見穩健統計),這是一個重要特點。但因為非引數統計方法需要照顧範圍很廣的分佈,在某些情況下會導致其效率的降低。不過,近代理論證明了:一些重要的非引數統計方法,當與相應的引數方法比較時,即使在最有利於後者的情況下,效率上的損失也很小。
由於非引數統計中對分佈假定要求的條件寬,因而大樣本理論(見大樣本統計)佔據了主導地位。第二次世界大戰前,非引數統計的大樣本理論已有了一些結果,從20世紀50年代直到現代,更有了顯著的進展,尤其是關於秩統計量與U統計量的大樣本理論,及基於這種理論的大樣本非引數方法,研究成果很多。
非引數統計的優缺點
非引數統計與傳統的引數統計相比,有以下優點:
1、非引數統計方法要求的假定條件比較少,因而它的適用範圍比較廣泛。
2、多數非引數統計方法要求的運算比較簡單,可以迅速完成計算取得結果,因而比較節約時間。
3、大多數非引數統計方法在直觀上比較容易理解,不需要太多的數學基礎知識和統計學知識。
4、大多數非引數統計方法可用來分析如象由等級構成的資料資料,而對計量水準較低的資料資料,引數統計方法卻不適用。
5、當推論多達3個以上時,非引數統計方法尤具優越性。
但非引數統計方法也有以下缺點:
1、由於方法簡單,用的計量水準較低,因此,如果能與引數統計方法同時使用時,就不如引數統計方法敏感。若為追求簡單而使用非引數統計方法,其檢驗功效就要差些。這就是說,在給定的顯著性水平下進行檢驗時,非引數統計方法與引數統計方法相比,第Ⅱ類錯誤的機率β要大些。
2、對於大樣本,如不採用適當的近似,計算可能變得十分複雜。
非引數統計是統計學的一個重要分支,它在實踐中有著廣泛的應用。所謂統計推斷,就是由樣本觀察值去了解總體,它是統計學的基本任務之一。若根據經驗或某種理論我們能在推斷之前就對總體作一些假設,則這些假設無疑有助於提高統計推斷的效率。這種情況下的統計方法稱為“引數統計”。如果我們所知很少,以致於在推斷之前不能對總體作任何假設,或僅能作一些非常一般性(例如連續分佈、對稱分佈等)的假設,這時如果仍然使用引數統計方法,其統計推斷的結果顯然是不可信的,甚至有可能是錯的。在對總體的分佈不作假設或僅作非常一般性假設條件下的統計方法稱為“非引數統計”。
由於非引數統計方法與總體究竟是什麼分佈幾乎沒有什麼關係,所以它的應用範圍很廣,它在社會學、醫學、生物學、心理學、教育學等領域都有著廣泛的應用。由於有關於總體的假設,所以引數統計的推斷方法是針對這個假設的。相對而言,非引數統計的推斷方法是很一般的,它僅應用樣本觀察值中一些非常直觀(例如次序)的資訊。所以非引數統計分析含有豐富的統計思想。
非引數統計的適用範圍
非引數統計最常用於具備下述特徵的情況:
1、待分析資料不滿足引數檢驗所要求的假定,因而無法應用引數檢驗。例如,我們曾遇到過的非正態總體小樣本,在t-檢驗法也不適用時,作為替代方法,就可以採用非引數檢驗。
2、僅由一些等級構成的資料,不能應用引數檢驗。例如,消費者可能被問及對幾種不同商標的飲料的喜歡程度,雖然,他們不能對每種商標都指定一個數字來表示他們對該商標的喜歡程度,卻能將幾種商標按喜歡的順序分成等級。這種情形也宜採用非引數檢驗。
3、所提的問題中並不包含引數,也不能用引數檢驗。例如,我們想判斷一個樣本是否為隨機樣本,採用非引數檢驗法就是適當的。
4、當我們需要迅速得出結果時,也可以不用引數統計方法而用非引數統計方法來達到目的。一般說來,非引數統計方法所要求的計算與引數統計方法相比,完成起來既快且易。有些非引數統計方法的計算,就算對統計學知識不熟練的人,也能在收集資料時及時予以完成。
非引數統計的特點
非引數統計問題中對總體分佈的假定要求的條件很寬,因而針對這種問題而構造的非引數統計方法,不致因為對總體分佈的假定不當而導致重大錯誤,所以它往往有較好的穩健性(見穩健統計),這是一個重要特點。但因為非引數統計方法需要照顧範圍很廣的分佈,在某些情況下會導致其效率的降低。不過,近代理論證明了:一些重要的非引數統計方法,當與相應的引數方法比較時,即使在最有利於後者的情況下,效率上的損失也很小。
由於非引數統計中對分佈假定要求的條件寬,因而大樣本理論(見大樣本統計)佔據了主導地位。第二次世界大戰前,非引數統計的大樣本理論已有了一些結果,從20世紀50年代直到現代,更有了顯著的進展,尤其是關於秩統計量與U統計量的大樣本理論,及基於這種理論的大樣本非引數方法,研究成果很多。
非引數統計的優缺點
非引數統計與傳統的引數統計相比,有以下優點:
1、非引數統計方法要求的假定條件比較少,因而它的適用範圍比較廣泛。
2、多數非引數統計方法要求的運算比較簡單,可以迅速完成計算取得結果,因而比較節約時間。
3、大多數非引數統計方法在直觀上比較容易理解,不需要太多的數學基礎知識和統計學知識。
4、大多數非引數統計方法可用來分析如象由等級構成的資料資料,而對計量水準較低的資料資料,引數統計方法卻不適用。
5、當推論多達3個以上時,非引數統計方法尤具優越性。
但非引數統計方法也有以下缺點:
1、由於方法簡單,用的計量水準較低,因此,如果能與引數統計方法同時使用時,就不如引數統計方法敏感。若為追求簡單而使用非引數統計方法,其檢驗功效就要差些。這就是說,在給定的顯著性水平下進行檢驗時,非引數統計方法與引數統計方法相比,第Ⅱ類錯誤的機率β要大些。
2、對於大樣本,如不採用適當的近似,計算可能變得十分複雜。