第一步:異常值檢測
異常值的檢驗有很多種方法,最常見的是圖示法,也有使用分析方法進行探索,如下說明。
箱盒圖:實驗研究時經常使用,非常直觀的展示出異常資料;
散點圖:研究X和Y的關係時,可直觀展示檢視是否有異常資料;
描述分析:可透過最大最小值等各類指標大致判斷資料是否有異常;
其它:比如結合正態分佈圖,頻數分析等判斷是否有異常值。
2
第二步:異常值判定
上述已經說明異常值會帶來嚴重的影響,扭曲資料結論等。那麼首先需要設定異常值的標準,然後再對其進行處理。異常值的判定標準並不統一,更多是透過人為標準進行設定,SPSSAU提供以下幾類判定規則:
缺失數字
小於設定標準的數字
大於設定標準的數字
大於3個標準差
第三步:異常值處理
完成異常值的判定之後,接著需要進行處理;SPSSAU提供兩類處理方式,分別為:
1、設定為Null值;此類處理最簡單,而且絕大多數情況下均使用此類處理;直接將異常值“幹掉”,相當於沒有該異常值。如果異常值不多時建議使用此類方法
2、填補;如果異常值非常多時,則可能需要進行填補設定,SPSSAU共提供平均值,中位數,眾數和隨機數共四種填補方式。建議使用平均值填補方式。
第一步:異常值檢測
異常值的檢驗有很多種方法,最常見的是圖示法,也有使用分析方法進行探索,如下說明。
箱盒圖:實驗研究時經常使用,非常直觀的展示出異常資料;
散點圖:研究X和Y的關係時,可直觀展示檢視是否有異常資料;
描述分析:可透過最大最小值等各類指標大致判斷資料是否有異常;
其它:比如結合正態分佈圖,頻數分析等判斷是否有異常值。
2
第二步:異常值判定
上述已經說明異常值會帶來嚴重的影響,扭曲資料結論等。那麼首先需要設定異常值的標準,然後再對其進行處理。異常值的判定標準並不統一,更多是透過人為標準進行設定,SPSSAU提供以下幾類判定規則:
缺失數字
小於設定標準的數字
大於設定標準的數字
大於3個標準差
第三步:異常值處理
完成異常值的判定之後,接著需要進行處理;SPSSAU提供兩類處理方式,分別為:
1、設定為Null值;此類處理最簡單,而且絕大多數情況下均使用此類處理;直接將異常值“幹掉”,相當於沒有該異常值。如果異常值不多時建議使用此類方法
2、填補;如果異常值非常多時,則可能需要進行填補設定,SPSSAU共提供平均值,中位數,眾數和隨機數共四種填補方式。建議使用平均值填補方式。