Arima模型在SPSS中的操作
ARIMA,就是autoregressive integrated moving-average model,中文應該叫做自動迴歸積分滑動平均模型,它主要使用與有長期趨勢與季節性波動的時間序列的分析預測中。
ARIMA有6個引數,ARIMA (p,d,q)(sp,sd,sq),後三個是主要用來描述季節性的變化,前三個針對去除了季節性變化後序列。為了避免過度訓練擬合,這些引數的取值都很小。p與sp的含義是一個數與前面幾個數線性相關,這兩引數大多數情況下都取0, 取1的情況很少,大於1的就幾乎絕種了。d與sd是差分,difference,d是描述長期趨勢,sd是季節性變化,這兩個引數的取值幾乎也都是0,1,2,要做幾次差分就取幾作值。q與sq是平滑計算次數,如果序列變化特別劇烈,就要進行平滑計算,計算幾次就取幾做值,這兩個值大多數情況下總有一個為0,也很少超過2的。
ARIMA的思路很簡單,首先用差分去掉季節性波動,然後去掉長期趨勢,然後平滑序列,然後用一個線性函式+白噪聲的形式來擬合序列,就是不斷的用前p個值來計算下一個值。
用SPSS來做ARIMA大概有這些步驟:
1定義日期,確定季節性的週期,選單為Data-Define dates
2畫序列圖來觀察數值變化,選單為Graph-sequence / Time Series - autoregressive
3若存在季節性波動,則做季節性差分,Graph- Time Series - autoregressive,先做一次,返回2觀察,如果數列還存在季節性波動,就再做一次,需要做幾次,sd就取幾
4若觀察到差分後的數列中有某些值遠遠大於平均值,則需要做平滑,做幾次sq就取幾
5然後看是否需要做去除長期趨勢的差分,確定p與sp
6然後在ARIMA模型中測試是否存在其他屬性影響預測屬性,如果Approx sig接近0,則說明該屬性可以加入模型,作為獨立變數,值得注意的是,如果存在突變,可以根據情況自定義變數,這個在判斷突變的原因比重時特別有用。
7然後用以確定的引數與獨立變數進行擬合預測。
8最後,用Graph- Time Series - autoregressive來判斷一下擬合產生的誤差ERR,如果不存在明顯特徵,可以看作是無規律的隨機白噪聲,就可以認為建模成功。
9最後使用ARIMA模型進行預測即可
感覺在電信行業的KPI預測中,最有應用前景的是第六步,除了可以找到那些變數對目標值有影響外,還能確定在目標屬性的變化中,不同原因的影響比例,如多少程度是由於競爭對手的失誤,多少程度是因為自己表現好,多少程度是因為市場大環境變化了。此外,透過預測值,可以指導計劃的編制和指標的制定,還能起到一點業務預警的作用。意義並不是很大,不過總比沒有好~~
Arima模型在SPSS中的操作
ARIMA,就是autoregressive integrated moving-average model,中文應該叫做自動迴歸積分滑動平均模型,它主要使用與有長期趨勢與季節性波動的時間序列的分析預測中。
ARIMA有6個引數,ARIMA (p,d,q)(sp,sd,sq),後三個是主要用來描述季節性的變化,前三個針對去除了季節性變化後序列。為了避免過度訓練擬合,這些引數的取值都很小。p與sp的含義是一個數與前面幾個數線性相關,這兩引數大多數情況下都取0, 取1的情況很少,大於1的就幾乎絕種了。d與sd是差分,difference,d是描述長期趨勢,sd是季節性變化,這兩個引數的取值幾乎也都是0,1,2,要做幾次差分就取幾作值。q與sq是平滑計算次數,如果序列變化特別劇烈,就要進行平滑計算,計算幾次就取幾做值,這兩個值大多數情況下總有一個為0,也很少超過2的。
ARIMA的思路很簡單,首先用差分去掉季節性波動,然後去掉長期趨勢,然後平滑序列,然後用一個線性函式+白噪聲的形式來擬合序列,就是不斷的用前p個值來計算下一個值。
用SPSS來做ARIMA大概有這些步驟:
1定義日期,確定季節性的週期,選單為Data-Define dates
2畫序列圖來觀察數值變化,選單為Graph-sequence / Time Series - autoregressive
3若存在季節性波動,則做季節性差分,Graph- Time Series - autoregressive,先做一次,返回2觀察,如果數列還存在季節性波動,就再做一次,需要做幾次,sd就取幾
4若觀察到差分後的數列中有某些值遠遠大於平均值,則需要做平滑,做幾次sq就取幾
5然後看是否需要做去除長期趨勢的差分,確定p與sp
6然後在ARIMA模型中測試是否存在其他屬性影響預測屬性,如果Approx sig接近0,則說明該屬性可以加入模型,作為獨立變數,值得注意的是,如果存在突變,可以根據情況自定義變數,這個在判斷突變的原因比重時特別有用。
7然後用以確定的引數與獨立變數進行擬合預測。
8最後,用Graph- Time Series - autoregressive來判斷一下擬合產生的誤差ERR,如果不存在明顯特徵,可以看作是無規律的隨機白噪聲,就可以認為建模成功。
9最後使用ARIMA模型進行預測即可
感覺在電信行業的KPI預測中,最有應用前景的是第六步,除了可以找到那些變數對目標值有影響外,還能確定在目標屬性的變化中,不同原因的影響比例,如多少程度是由於競爭對手的失誤,多少程度是因為自己表現好,多少程度是因為市場大環境變化了。此外,透過預測值,可以指導計劃的編制和指標的制定,還能起到一點業務預警的作用。意義並不是很大,不過總比沒有好~~