1)如果要監控樣本關係的穩定性,可以把10組資料用統計軟體做散點矩陣圖。看兩兩間的相關性。如果有強相關,分別計算相關係數或進行迴歸(從矩陣的角度實際是計算相關陣)。斜率明顯不為1時,說明隨著溫度升高,差異會變化(即存在互動作用)。
可以分段或移動(例如每20個數據)監控相關係數或迴歸係數,或者回歸模型殘差。在EXCEL上設好函式很容易完成。可以用單值-移動極差控制圖來監控。
2)注意所有樣本一起迴歸很可能會因為同質性(相關度接近1)而產生嚴重的共線性,這樣誤差極大。如果樣本間存在部分異質性,可以所有樣本一起進行主成分迴歸或者嶺迴歸(一個樣本作為因變數)。然後將方程左右相減,得到殘差。對殘差用控制圖監控穩定性。這是一種好的綜合控制方法。兩兩比較的控制方法見後面。
如果未學過主成分迴歸和嶺迴歸,直接使用1)的方法也是可以的。
注意: 如果殘差誤差是異方差的,需要資料變換為等方差。
3)如果各樣本同分布(重點是均值應該相等),且樣本間需要保持一致,可以用統計軟體進行分段的Friedman檢驗(配對Wilcoxon檢驗的多樣本擴充套件)或者隨機完全區組設計(配對t檢驗的多樣本擴充套件),檢驗出樣本的顯著差異。
如果想監控樣本差異的偏移量,且已知樣本系統性差異值(正常偏移量),可以用上述方法檢驗出對這個差異值的顯著偏離(在上述檢驗中樣本間波動扣除正常偏移分量)。
原理上,以上均是把同一時間的10個樣本溫度看做一個區組(這裡重要的是樣本間存在協方差,降低了誤差方差)。如果樣本間與溫度沒有明顯的互動作用(即溫度不同,樣本間差異較為穩定)。是可以直接應用以上方法的。
但如果樣本間與溫度存在較大互動作用(溫度不同樣本間差異明顯不同),則需要溫度是近似隨機的。如果短期溫度不近似隨機就要長間隔測量,如果長期溫度不近似隨機(有趨勢),就要短間隔測量。或者在有趨勢時,剝離趨勢分量也行。
4)可以用統計軟體進行聚類。例如對10個樣本進行聚類,發現哪些樣本關係相近。對時間聚類,發現哪些時間段之間類似。
5)想監控差異值異常波動的話,可以用控制圖。假設溫度是隨機波動而不是趨勢性的,如果想看同期差異的變化,就按高低順序把同期值相減,分別做時間序列圖或控制圖。注意要用到移動極差做誤差。也可以用多元控制圖整體控制風險,發現異常。
6)如果差異值有趨勢的話,還可以用差異值(或原資料)相對於時間或者溫度進行迴歸。迴歸的MSe就是誤差方差。殘差可以用控制圖監控穩定性。
7)如果迴歸誤差存在時間自相關(即資料獨立性有問題,前一值影響後一值),可以用連續多個時間點(例如5個)的簡單平均值(或移動平均值,或加權移動平均值)代替原差異資料,來進行分析。
再就是採取資料變換或增項或協方差的方法。
如果還存在自相關問題,可以按照
Y(n+1期)=αY(n期)+βx+ε
來回歸。也就是把上一時期的因變數數值也當做自變數。
如果擬合仍然不足,還可以在自變數中再加入Y(n-1期)項。
1)如果要監控樣本關係的穩定性,可以把10組資料用統計軟體做散點矩陣圖。看兩兩間的相關性。如果有強相關,分別計算相關係數或進行迴歸(從矩陣的角度實際是計算相關陣)。斜率明顯不為1時,說明隨著溫度升高,差異會變化(即存在互動作用)。
可以分段或移動(例如每20個數據)監控相關係數或迴歸係數,或者回歸模型殘差。在EXCEL上設好函式很容易完成。可以用單值-移動極差控制圖來監控。
2)注意所有樣本一起迴歸很可能會因為同質性(相關度接近1)而產生嚴重的共線性,這樣誤差極大。如果樣本間存在部分異質性,可以所有樣本一起進行主成分迴歸或者嶺迴歸(一個樣本作為因變數)。然後將方程左右相減,得到殘差。對殘差用控制圖監控穩定性。這是一種好的綜合控制方法。兩兩比較的控制方法見後面。
如果未學過主成分迴歸和嶺迴歸,直接使用1)的方法也是可以的。
注意: 如果殘差誤差是異方差的,需要資料變換為等方差。
3)如果各樣本同分布(重點是均值應該相等),且樣本間需要保持一致,可以用統計軟體進行分段的Friedman檢驗(配對Wilcoxon檢驗的多樣本擴充套件)或者隨機完全區組設計(配對t檢驗的多樣本擴充套件),檢驗出樣本的顯著差異。
如果想監控樣本差異的偏移量,且已知樣本系統性差異值(正常偏移量),可以用上述方法檢驗出對這個差異值的顯著偏離(在上述檢驗中樣本間波動扣除正常偏移分量)。
原理上,以上均是把同一時間的10個樣本溫度看做一個區組(這裡重要的是樣本間存在協方差,降低了誤差方差)。如果樣本間與溫度沒有明顯的互動作用(即溫度不同,樣本間差異較為穩定)。是可以直接應用以上方法的。
但如果樣本間與溫度存在較大互動作用(溫度不同樣本間差異明顯不同),則需要溫度是近似隨機的。如果短期溫度不近似隨機就要長間隔測量,如果長期溫度不近似隨機(有趨勢),就要短間隔測量。或者在有趨勢時,剝離趨勢分量也行。
4)可以用統計軟體進行聚類。例如對10個樣本進行聚類,發現哪些樣本關係相近。對時間聚類,發現哪些時間段之間類似。
5)想監控差異值異常波動的話,可以用控制圖。假設溫度是隨機波動而不是趨勢性的,如果想看同期差異的變化,就按高低順序把同期值相減,分別做時間序列圖或控制圖。注意要用到移動極差做誤差。也可以用多元控制圖整體控制風險,發現異常。
6)如果差異值有趨勢的話,還可以用差異值(或原資料)相對於時間或者溫度進行迴歸。迴歸的MSe就是誤差方差。殘差可以用控制圖監控穩定性。
7)如果迴歸誤差存在時間自相關(即資料獨立性有問題,前一值影響後一值),可以用連續多個時間點(例如5個)的簡單平均值(或移動平均值,或加權移動平均值)代替原差異資料,來進行分析。
再就是採取資料變換或增項或協方差的方法。
如果還存在自相關問題,可以按照
Y(n+1期)=αY(n期)+βx+ε
來回歸。也就是把上一時期的因變數數值也當做自變數。
如果擬合仍然不足,還可以在自變數中再加入Y(n-1期)項。