首頁>資訊>

什麼是卡方(Chi-square)檢驗

卡方(Chi-Square)檢驗,被譽為二十世紀科學技術所有分支中的20大發明之一,它的發明者是英國的數學家卡爾·皮爾遜(Karl Pearson)。

卡方(Chi-Square)檢驗是當影響因子(X)和結果(Y)是分類/屬性資料時的一種假設檢驗。希臘字母X或chi(發音為“kye”,與“eye”押韻)用來代表這一統計量(最後的符合是“平方”,因此稱為“卡方”。卡方檢驗是每個類別預期值和觀察值之間“差的平方”之和。卡方檢驗也是六西格瑪較常用的工具,主要應用於A階段。同T檢驗、方差分析等一樣,在六西格瑪中使用使用的頻率較高。

卡方檢驗假設的形式

用卡方檢驗獨立性,統計學家假設現實中的大多數變數都是獨立、不想關聯的。因此,

-H0:資料是獨立的(不相關的);

-Ha:資料是非獨立的(相關的)。

如果P值小於0.05,則拒絕H0。

案例分享

HR招聘專員透過物色到455個候選人,包含年長的、年輕的。想研究候年齡大小與被僱傭的關係。原始資料彙總表見圖1。

圖1

Minitab卡方檢驗的路徑很多人找不到路徑的,因為其路徑不在“質量工具”類別裡面,而在“表格”裡(參見圖3)。卡方檢驗的具體路徑為:統計 > 表格 > 相關性卡方檢驗。

1)開啟Minitab軟體,輸入相關分類資料。見圖2。

圖2

2)卡方檢驗的具體的具體路徑為:統計 > 表格 > 相關性卡方檢驗。

圖3

3)代入相關資料並確定。

圖4

注:對於列聯表資料,選擇雙因子表格中的彙總資料。

4)會話視窗輸出

圖5

解析

透過卡方檢驗會話視窗輸出, 可以看出卡方為0.007=0.004+0.001+0.002+0.000,即卡方貢獻的總和;得知DF=1,P=0.932。因此沒有證據顯示年齡大小與被僱傭的比率有關聯性。卡方的公式參見圖6。

圖6

至於卡方的計算,可以使用Minitab, 也可以使用Excel表格。但前者更快、更準確。參見圖5紅色方框的計算方法如下:f0為實際的觀測計數,即30、fe為期望計數,即(總行數X總欄數)/合計數=(180X75)/455=29.67;對卡方的貢獻(f0-fe)的平方/fe,當前值為0.004=(30-29.67)的平方/29.67=(0.33X0.33)/29.67。其他的均以此類推。

若是後者,則需要先彙總原始資料彙總表(見圖1),再計算期望值表(見圖7),最後計算卡方表(見圖8)。計算方式如上,此處不再贅述了。圖8中綠色方框的卡方值看起來有些眼熟吧?沒錯!結果同圖5的Minitab輸出的卡方值是一樣的。

圖7

圖8

若20% 以上單元格的預期頻率(計數)都小於5,尤其是在p值較小並且這些單元格對總卡方值的貢獻較大時,一些統計人員則會猶豫是否使用卡方檢驗 。如果某些單元格的預期頻率(計數)較小,則可以考慮合併或忽略行和/或列類別

作者簡介:Victor Wang

1) SGS製造業專業委員會首期成員;

2)國內某新能源上市公司質量總監;

3)資深六西格黑帶。

5
最新評論
  • 3本作者大大最好的一本小說,劇情讓人拍手叫好,連看三遍也不膩
  • 收銀系統哪個品牌好?能提供這3點就行