回覆列表
-
1 # 使用者989731948024
-
2 # 大海4231207040277
通常在迴歸分析時,如果是二分類變數可以直接當做連續性變數進行迴歸,而多分類時,則需要設定啞變數,即將每個類別轉換成0,1的編碼來表示,因此這裡我們求相關係數時,也可以採用類似的設定啞變數,只不過是有幾個類別就設定幾個啞變數,這也相當於將多分類變數變成了多個0、1編碼的二分類變數,然後再直接使用相關分析,選擇所有的啞變數和連續性因變數進行普通的pearson相關,就可以得出每個分類與因變數的相關係數了。
)小樣本資料:用二項分佈進行確切機率法檢驗;
(2)大樣本資料:用U檢驗;
2)多分類資料:用Pearson檢驗(又稱擬合優度檢驗)。
2. 四格表(2×2表)資料
1)完全隨機設計的四格表資料的分析
(1)當樣本量n>40,並且4個格子理論數均大於5時,則用Pearson 檢驗;
(2)當樣本量n>40,並且4個格子理論數均大於1且至少存在一個格子的理論數<5時,則用校正檢驗或用Fisher’s精確機率法檢驗;
(3)當樣本量n£40或存在任一格子理論數<1,則用精確機率法檢驗;
2)配對設計的四格表資料的分析
(1)b+c≥40,則用McNemar配對檢驗;
(2)b+c<40,則用二項分佈確切機率法檢驗;
3. 2×C表或R×2表資料的統計分析
1)列變數為效應指標,並且為有序多分類變數,行變數為分組變數,則可以採用行平均得分差(Row Mean Scores Differ)的CMH 或成組的Wilcoxon秩和檢驗;
2)列變數為效應指標並且為二分類,行變數為有序多分類變數,則可採用普通的Pearson 檢驗比較各組之間有無差別,如果總的'來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。
3)行變數和列變數均為無序分類變數:
(1)當樣本量n>40,並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗;
(2)當樣本量n£40,或理論數小於5的格子數多於行列表中格子總數的25%,則用Fisher’s確切機率法檢驗;
4. R×C表資料的統計分析
1)完全隨機設計的R×C表資料的統計分析
(1)列變數為效應指標,並且為有序多分類變數,行變數為分組變數,則CMH 或Kruskal Wallis的秩和檢驗;
(2)列變數為效應指標,並且為無序多分類變數,行變數為有序多分類變數,則採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義;
(3)列變數和行變數均為有序多分類變數,可以作Spearman相關分析或者非零相關(none zero correlation)的CMH ;