假設檢驗是指預先對總體引數的取值做出假定,然後用樣本資料來驗證,從而做出是接受還是拒絕的結論。
基本思路是:問題是什麼?證據是什麼?判斷依據是什麼?做出結論。
基本步驟:1、提出原假設和備擇假設
2、確定適當的檢驗統計量
3、規定顯著水平@,查出臨界值,確定拒絕域和接受域
4、計算檢驗統計量的值,做出統計決策。
其中假設檢驗的種類包括:t檢驗,Z檢驗,卡方檢驗,F檢驗,ANOVA (方差分析)等等。
方差分析又稱“ 變異數分析”,是R.A.Fisher發明的,要求比較的資料服從正態分佈,用於兩個及兩個以上 樣本均數差別的顯著性檢驗。方差分析可以用於兩樣本及以上樣本之間的比較。方差分析主要用途:①均數差別的顯著性檢驗,②分離各有關因素並估計其對總變異的作用,③分析因素間的互動作用,④方差齊性檢驗。
T檢驗主要用於樣本含量較小(例如n<30),要求比較的資料服從正態分佈, 總體標準差σ未知的 正態分佈資料。t檢驗只能用於兩樣本均數及樣本均數與總體均數之間的比較。t檢驗可用於比較男女身高是否存在差別。
Z檢驗是一般用於大樣本(即樣本容量大於30)平均值差異性檢驗的方法。它是用標準正態分佈的理論來判斷差異發生的機率,從而比較兩個平均數>平均數的差異是否顯著。
F檢驗又叫方差齊性檢驗。在兩樣本t檢驗中要用到F檢驗。從兩研究總體中隨機抽取樣本,要對這兩個樣本進行比較的時候,首先要判斷兩總體方差是否相同,即方差齊性。若兩總體方差相等,則直接用t檢驗,若不等,可採用t"檢驗或變數變換或秩和檢驗等方法。其中要判斷兩總體方差是否相等,就可以用F檢驗。簡單的說就是 檢驗兩個樣本的 方差是否有顯著性差異 這是選擇何種T檢驗(等方差雙樣本檢驗,異方差雙樣本檢驗)的前提條件。
T檢驗與 F檢驗的差異:T檢驗用來檢測資料的準確度--系統誤差;F檢驗用來檢測資料的精密度 偶然誤差。
卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,如果卡方值越大,二者偏差程度越小;反之,二者偏差越大,若兩個值完全相等時,卡方值就為0,表明理論值完全符合。其中卡方檢驗針對分類變數。
卡方檢驗就是檢驗兩個變數之間有沒有關係。以運營為例:卡方檢驗可以檢驗男性或者女性對線上買生鮮食品有沒有區別;不同城市級別的消費者對買SUV車有沒有什麼區別;如果有顯著區別的話,我們會考慮把這些變數放到模型或者分析裡去。
以下是一個假設檢驗的應用例項:
例如:某公司想從國外引進一種自動加工裝置。這種裝置的工作溫度X服從正態分佈(μ,52),廠方說它的平均工作溫度是80度。從該裝置試運轉中隨機測試16次,得到的平均工作溫度是83度。該公司考慮,樣本結果與廠方所說的是否有顯著差異?廠方的說法是否可以接受?
類似這種根據樣本觀測值來判斷一個有關總體的假設是否成立的問題,就是假設檢驗的問題。我們把任一關於單體分佈的假設,統稱為統計假設,簡稱假設。上例中,可以提出兩個假設:一個稱為原假設或零假設,記為H0:μ=80(度);另一個稱為備擇假設或對立假設,記為H1 :μ≠80(度)這樣,上述假設檢驗問題可以表示為:
H0:μ=80 H1:μ≠80
原假設與備擇假設相互對立,兩者有且只有一個正確,備擇假設的含義是,一旦否定原假設H0,備擇假設H1備你選擇。所謂假設檢驗問題就是要判斷原假設H0是否正確,決定接受還是拒絕原假設,若拒絕原假設,就接受備擇假設。
應該如何作出判斷呢?如果樣本測定的結果是100度甚至更高(或很低),我們從直觀上能感到原假設可疑而否定它,因為原假設是真實時,在一次試驗中出現了與80度相距甚遠的小機率事件幾乎是不可能的,而現在竟然出現了,當然要拒絕原假設H0。現在的問題是樣本平均工作溫度為83度,結果雖然與廠方說的80度有差異,但樣本具有隨機性,80度與83度之間的差異很可能是樣本的隨機性造成的。在這種情況下,要對原假設作出接受還是拒絕的抉擇,就必須根據研究的問題和決策條件,對樣本值與原假設的差異進行分析。若有充分理由認為這種差異並非是由偶然的隨機因素造成的,也即認為差異是顯著的,才能拒絕原假設,否則就不能拒絕原假設。假設檢驗實質上是對原假設是否正確進行檢驗,因此,檢驗過程中要使原假設得到維護,使之不輕易被否定,否定原假設必須有充分的理由;同時,當原假設被接受時,也只能認為否定它的根據不充分,而不是認為它絕對正確。
假設檢驗是指預先對總體引數的取值做出假定,然後用樣本資料來驗證,從而做出是接受還是拒絕的結論。
基本思路是:問題是什麼?證據是什麼?判斷依據是什麼?做出結論。
基本步驟:1、提出原假設和備擇假設
2、確定適當的檢驗統計量
3、規定顯著水平@,查出臨界值,確定拒絕域和接受域
4、計算檢驗統計量的值,做出統計決策。
其中假設檢驗的種類包括:t檢驗,Z檢驗,卡方檢驗,F檢驗,ANOVA (方差分析)等等。
方差分析又稱“ 變異數分析”,是R.A.Fisher發明的,要求比較的資料服從正態分佈,用於兩個及兩個以上 樣本均數差別的顯著性檢驗。方差分析可以用於兩樣本及以上樣本之間的比較。方差分析主要用途:①均數差別的顯著性檢驗,②分離各有關因素並估計其對總變異的作用,③分析因素間的互動作用,④方差齊性檢驗。
T檢驗主要用於樣本含量較小(例如n<30),要求比較的資料服從正態分佈, 總體標準差σ未知的 正態分佈資料。t檢驗只能用於兩樣本均數及樣本均數與總體均數之間的比較。t檢驗可用於比較男女身高是否存在差別。
Z檢驗是一般用於大樣本(即樣本容量大於30)平均值差異性檢驗的方法。它是用標準正態分佈的理論來判斷差異發生的機率,從而比較兩個平均數>平均數的差異是否顯著。
F檢驗又叫方差齊性檢驗。在兩樣本t檢驗中要用到F檢驗。從兩研究總體中隨機抽取樣本,要對這兩個樣本進行比較的時候,首先要判斷兩總體方差是否相同,即方差齊性。若兩總體方差相等,則直接用t檢驗,若不等,可採用t"檢驗或變數變換或秩和檢驗等方法。其中要判斷兩總體方差是否相等,就可以用F檢驗。簡單的說就是 檢驗兩個樣本的 方差是否有顯著性差異 這是選擇何種T檢驗(等方差雙樣本檢驗,異方差雙樣本檢驗)的前提條件。
T檢驗與 F檢驗的差異:T檢驗用來檢測資料的準確度--系統誤差;F檢驗用來檢測資料的精密度 偶然誤差。
卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,如果卡方值越大,二者偏差程度越小;反之,二者偏差越大,若兩個值完全相等時,卡方值就為0,表明理論值完全符合。其中卡方檢驗針對分類變數。
卡方檢驗就是檢驗兩個變數之間有沒有關係。以運營為例:卡方檢驗可以檢驗男性或者女性對線上買生鮮食品有沒有區別;不同城市級別的消費者對買SUV車有沒有什麼區別;如果有顯著區別的話,我們會考慮把這些變數放到模型或者分析裡去。
以下是一個假設檢驗的應用例項:
例如:某公司想從國外引進一種自動加工裝置。這種裝置的工作溫度X服從正態分佈(μ,52),廠方說它的平均工作溫度是80度。從該裝置試運轉中隨機測試16次,得到的平均工作溫度是83度。該公司考慮,樣本結果與廠方所說的是否有顯著差異?廠方的說法是否可以接受?
類似這種根據樣本觀測值來判斷一個有關總體的假設是否成立的問題,就是假設檢驗的問題。我們把任一關於單體分佈的假設,統稱為統計假設,簡稱假設。上例中,可以提出兩個假設:一個稱為原假設或零假設,記為H0:μ=80(度);另一個稱為備擇假設或對立假設,記為H1 :μ≠80(度)這樣,上述假設檢驗問題可以表示為:
H0:μ=80 H1:μ≠80
原假設與備擇假設相互對立,兩者有且只有一個正確,備擇假設的含義是,一旦否定原假設H0,備擇假設H1備你選擇。所謂假設檢驗問題就是要判斷原假設H0是否正確,決定接受還是拒絕原假設,若拒絕原假設,就接受備擇假設。
應該如何作出判斷呢?如果樣本測定的結果是100度甚至更高(或很低),我們從直觀上能感到原假設可疑而否定它,因為原假設是真實時,在一次試驗中出現了與80度相距甚遠的小機率事件幾乎是不可能的,而現在竟然出現了,當然要拒絕原假設H0。現在的問題是樣本平均工作溫度為83度,結果雖然與廠方說的80度有差異,但樣本具有隨機性,80度與83度之間的差異很可能是樣本的隨機性造成的。在這種情況下,要對原假設作出接受還是拒絕的抉擇,就必須根據研究的問題和決策條件,對樣本值與原假設的差異進行分析。若有充分理由認為這種差異並非是由偶然的隨機因素造成的,也即認為差異是顯著的,才能拒絕原假設,否則就不能拒絕原假設。假設檢驗實質上是對原假設是否正確進行檢驗,因此,檢驗過程中要使原假設得到維護,使之不輕易被否定,否定原假設必須有充分的理由;同時,當原假設被接受時,也只能認為否定它的根據不充分,而不是認為它絕對正確。