原假設H0:假設兩個變數間沒有關係(有沒有差異)p值>α,則接受原假設,即變數間沒有關係(沒有差異);p值<α,則拒絕原假設,即變數間有關係(有差異);什麼時候用相關分析、方差分析和卡方檢驗t檢驗單樣本T檢驗 檢驗樣本均值是否高於某一水平proc ttest data=dsn alpha=0.05 h0=0; var numberic_variable; run;雙樣本T檢驗用於檢驗兩組樣本間均值是否有差異分類變數——離散型分析變數——數值型proc ttest data=dsn alpha=0.05 h0=0; class isok; /*分類變數*/ var numeric_variable; /*分析變數*/ run;配對樣本T檢驗檢驗同一個變數前後是否有差異proc ttest data=dsn alpha=0.05 h0=0; paired numberic_variable_1 * numeric_variable_2; run;卡方檢驗檢驗兩個變數間是否獨立。列聯表和卡方檢驗 y1 y2 sumx1 a b a+bx2 c d c+dsum a+c b+d a+b+c+d卡方值越大,說明“x和y有關係”成立的可能性越小。proc freq data=dsn; table categorical * variable/chisq; /* y*x,因變數y為離散型變數,自變數x可為離散型或連續型*/ run;方差分析檢驗兩個變數間是否有關係proc anova data=dsn; class categorical_variable; model numeric_response_variable; rum;相關性檢驗兩個變數間是否有線性相關關係。proc corr data=dsn pearson; /*預設為皮爾森相關係數,可指定為spearman,hoeffding,kendall*/ var numeric_variable_1 numeric_variable_2 … numeric_variable_n; with numeric_response_variable; run;
原假設H0:假設兩個變數間沒有關係(有沒有差異)p值>α,則接受原假設,即變數間沒有關係(沒有差異);p值<α,則拒絕原假設,即變數間有關係(有差異);什麼時候用相關分析、方差分析和卡方檢驗t檢驗單樣本T檢驗 檢驗樣本均值是否高於某一水平proc ttest data=dsn alpha=0.05 h0=0; var numberic_variable; run;雙樣本T檢驗用於檢驗兩組樣本間均值是否有差異分類變數——離散型分析變數——數值型proc ttest data=dsn alpha=0.05 h0=0; class isok; /*分類變數*/ var numeric_variable; /*分析變數*/ run;配對樣本T檢驗檢驗同一個變數前後是否有差異proc ttest data=dsn alpha=0.05 h0=0; paired numberic_variable_1 * numeric_variable_2; run;卡方檢驗檢驗兩個變數間是否獨立。列聯表和卡方檢驗 y1 y2 sumx1 a b a+bx2 c d c+dsum a+c b+d a+b+c+d卡方值越大,說明“x和y有關係”成立的可能性越小。proc freq data=dsn; table categorical * variable/chisq; /* y*x,因變數y為離散型變數,自變數x可為離散型或連續型*/ run;方差分析檢驗兩個變數間是否有關係proc anova data=dsn; class categorical_variable; model numeric_response_variable; rum;相關性檢驗兩個變數間是否有線性相關關係。proc corr data=dsn pearson; /*預設為皮爾森相關係數,可指定為spearman,hoeffding,kendall*/ var numeric_variable_1 numeric_variable_2 … numeric_variable_n; with numeric_response_variable; run;