估計標準誤差 : 實際值與平均值的總誤差中,迴歸誤差與剩餘誤差是此消彼長的關係。因而回歸誤差從正面測定線性模型的擬合優度,剩餘誤差則從反面來判定線性模型的擬合優度。統計上定義剩餘誤差除以自由度n – 2所得之商的平方根為估計標準誤。: 其公式為 (5.10) 式中: 為估計標準誤差,n-2是自由度。 在迴歸分析中,估計標準誤差越小,表明實際值越緊靠估計值,迴歸模型擬合優度越好;反之,估計標準誤差越大,則說明實際值對估計值越分散,迴歸模型擬合越差。 實際工作中也可用下列簡捷公式 (5.11) 以例題2計算: (萬元) 或 作為迴歸模型擬合優度的判斷和評價指標,估計標準誤顯然不如判定係數r2. r2 是無量綱係數,有確定的取值範圍 (0—1),便於對不同資料迴歸模型擬合優度進行比較;而估計標準誤差是有計量單位的,又沒有確定的取值範圍,不便於對不同資料迴歸模型擬合優度進行比較。 但是,估計標準誤差在迴歸分析中仍然是一個重要的指標,因為它還是用自變數估計因變數時確定置信區間的尺度,用X對Y進行估計的置信區間為: (5.12) 因此,可以推斷有68.27%的Y落在Y±1SXY以內,有95.45%的Y落在Y±2SXY以內,有99.73%的Y落在Y±3SXY以內。這是在大樣本條件下的區間估計。如果樣本n<30,就要用 t 分佈來確定置信區間,在給定置信度 1 - a時,Y的某一數值的置信區間為: (5.13) 其中ta/2(n-2)可查 t 分佈表得到,X0為給定的自變數的某一數值。 如例2中: X0=8萬件 Y0=150.51萬元 SXY =9.77 X=5.04; 當a=0.05時,即以95%的置信度估計,查 t 表得 t0。025(5-2)=3.1824 。則Y的置信區間為: 也即當產量為8萬件時,有95%的把握估計生產成本在107.23 ——193.79萬元之間。
估計標準誤差 : 實際值與平均值的總誤差中,迴歸誤差與剩餘誤差是此消彼長的關係。因而回歸誤差從正面測定線性模型的擬合優度,剩餘誤差則從反面來判定線性模型的擬合優度。統計上定義剩餘誤差除以自由度n – 2所得之商的平方根為估計標準誤。: 其公式為 (5.10) 式中: 為估計標準誤差,n-2是自由度。 在迴歸分析中,估計標準誤差越小,表明實際值越緊靠估計值,迴歸模型擬合優度越好;反之,估計標準誤差越大,則說明實際值對估計值越分散,迴歸模型擬合越差。 實際工作中也可用下列簡捷公式 (5.11) 以例題2計算: (萬元) 或 作為迴歸模型擬合優度的判斷和評價指標,估計標準誤顯然不如判定係數r2. r2 是無量綱係數,有確定的取值範圍 (0—1),便於對不同資料迴歸模型擬合優度進行比較;而估計標準誤差是有計量單位的,又沒有確定的取值範圍,不便於對不同資料迴歸模型擬合優度進行比較。 但是,估計標準誤差在迴歸分析中仍然是一個重要的指標,因為它還是用自變數估計因變數時確定置信區間的尺度,用X對Y進行估計的置信區間為: (5.12) 因此,可以推斷有68.27%的Y落在Y±1SXY以內,有95.45%的Y落在Y±2SXY以內,有99.73%的Y落在Y±3SXY以內。這是在大樣本條件下的區間估計。如果樣本n<30,就要用 t 分佈來確定置信區間,在給定置信度 1 - a時,Y的某一數值的置信區間為: (5.13) 其中ta/2(n-2)可查 t 分佈表得到,X0為給定的自變數的某一數值。 如例2中: X0=8萬件 Y0=150.51萬元 SXY =9.77 X=5.04; 當a=0.05時,即以95%的置信度估計,查 t 表得 t0。025(5-2)=3.1824 。則Y的置信區間為: 也即當產量為8萬件時,有95%的把握估計生產成本在107.23 ——193.79萬元之間。