使用Excel資料分析工具進行多元迴歸分析與簡單的迴歸估算分析方法基本相同。但是由於有些電腦在安裝辦公軟體時並未載入資料分析工具,所以從載入開始說起(以Excel2010版為例,其餘版本都可以在相應介面找到)。
在彈出的選單中選擇“選項”,如下圖所示:
載入完畢,在“資料”工具欄中就出現“資料分析”工具庫,如下圖所示:
給出原始資料,自變數的值在A2:I21單元格區間中,因變數的值在J2:J21中,如下圖所示:
假設迴歸估算表示式為:
試使用Excel資料分析工具庫中的迴歸分析工具對其迴歸係數進行估算並進行迴歸分析:
彈出“迴歸”對話方塊並作如下圖的選擇:
上述選擇的具體方法是:
置信度可選預設的95%。
第一張表是“迴歸統計表”(K12:L17):
其中:
Multiple R:(複相關係數R)R2的平方根,又稱相關係數,用來衡量自變數x與y之間的相關程度的大小。本例R=0.9134表明它們之間的關係為高度正相關。(Multiple:複合、多種)
R Square:複測定係數,上述複相關係數R的平方。用來說明自變數解釋因變數y變差的程度,以測定因變數y的擬合效果。此案例中的複測定係數為0.8343,表明用用自變數可解釋因變數變差的83.43%
Adjusted R Square:調整後的複測定係數R2,該值為0.6852,說明自變數能說明因變數y的68.52%,因變數y的31.48%要由其他因素來解釋。( Adjusted:調整後的)
標準誤差:用來衡量擬合程度的大小,也用於計算與迴歸相關的其它統計量,此值越小,說明擬合程度越好
觀察值:用於估計迴歸方程的資料的觀察值個數。
第二張表是“方差分析表”:主要作用是透過F檢驗來判定迴歸模型的迴歸效果。
該案例中的Significance F(F顯著性統計量)的P值為0.00636,小於顯著性水平0.05,所以說該回歸方程迴歸效果顯著,方程中至少有一個迴歸係數顯著不為0.(Significance:顯著)
第三張表是“迴歸引數表”:
K26:K35為常數項和b1~b9的排序預設標示.
L26:L35為常數項和b1~b9的值,據此可得出估算的迴歸方程為:
該表中重要的是O列,該列的O26:O35中的 P-value為迴歸係數t統計量的P值。
值得注意的是:其中b1、b7的t統計量的P值為0.0156和0.0175,遠小於顯著性水平0.05,因此該兩項的自變數與y相關。而其他各項的t統計量的P值遠大於b1、b7的t統計量的P值,但如此大的P值說明這些項的自變數與因變數不存在相關性,因此這些項的迴歸係數不顯著。
使用Excel資料分析工具進行多元迴歸分析與簡單的迴歸估算分析方法基本相同。但是由於有些電腦在安裝辦公軟體時並未載入資料分析工具,所以從載入開始說起(以Excel2010版為例,其餘版本都可以在相應介面找到)。
在彈出的選單中選擇“選項”,如下圖所示:
載入完畢,在“資料”工具欄中就出現“資料分析”工具庫,如下圖所示:
給出原始資料,自變數的值在A2:I21單元格區間中,因變數的值在J2:J21中,如下圖所示:
假設迴歸估算表示式為:
試使用Excel資料分析工具庫中的迴歸分析工具對其迴歸係數進行估算並進行迴歸分析:
彈出“迴歸”對話方塊並作如下圖的選擇:
上述選擇的具體方法是:
置信度可選預設的95%。
第一張表是“迴歸統計表”(K12:L17):
其中:
Multiple R:(複相關係數R)R2的平方根,又稱相關係數,用來衡量自變數x與y之間的相關程度的大小。本例R=0.9134表明它們之間的關係為高度正相關。(Multiple:複合、多種)
R Square:複測定係數,上述複相關係數R的平方。用來說明自變數解釋因變數y變差的程度,以測定因變數y的擬合效果。此案例中的複測定係數為0.8343,表明用用自變數可解釋因變數變差的83.43%
Adjusted R Square:調整後的複測定係數R2,該值為0.6852,說明自變數能說明因變數y的68.52%,因變數y的31.48%要由其他因素來解釋。( Adjusted:調整後的)
標準誤差:用來衡量擬合程度的大小,也用於計算與迴歸相關的其它統計量,此值越小,說明擬合程度越好
觀察值:用於估計迴歸方程的資料的觀察值個數。
第二張表是“方差分析表”:主要作用是透過F檢驗來判定迴歸模型的迴歸效果。
該案例中的Significance F(F顯著性統計量)的P值為0.00636,小於顯著性水平0.05,所以說該回歸方程迴歸效果顯著,方程中至少有一個迴歸係數顯著不為0.(Significance:顯著)
第三張表是“迴歸引數表”:
K26:K35為常數項和b1~b9的排序預設標示.
L26:L35為常數項和b1~b9的值,據此可得出估算的迴歸方程為:
該表中重要的是O列,該列的O26:O35中的 P-value為迴歸係數t統計量的P值。
值得注意的是:其中b1、b7的t統計量的P值為0.0156和0.0175,遠小於顯著性水平0.05,因此該兩項的自變數與y相關。而其他各項的t統計量的P值遠大於b1、b7的t統計量的P值,但如此大的P值說明這些項的自變數與因變數不存在相關性,因此這些項的迴歸係數不顯著。