回覆列表
  • 1 # 大爪子的肚子

    第一步:異常值檢測

    異常值的檢驗有很多種方法,最常見的是圖示法,也有使用分析方法進行探索,如下說明。

    箱盒圖:實驗研究時經常使用,非常直觀的展示出異常資料;

    散點圖:研究X和Y的關係時,可直觀展示檢視是否有異常資料;

    描述分析:可透過最大最小值等各類指標大致判斷資料是否有異常;

    其它:比如結合正態分佈圖,頻數分析等判斷是否有異常值。

    2

    第二步:異常值判定

    上述已經說明異常值會帶來嚴重的影響,扭曲資料結論等。那麼首先需要設定異常值的標準,然後再對其進行處理。異常值的判定標準並不統一,更多是透過人為標準進行設定,SPSSAU提供以下幾類判定規則:

    缺失數字

    小於設定標準的數字

    大於設定標準的數字

    大於3個標準差

    第三步:異常值處理

    完成異常值的判定之後,接著需要進行處理;SPSSAU提供兩類處理方式,分別為:

    1、設定為Null值;此類處理最簡單,而且絕大多數情況下均使用此類處理;直接將異常值“幹掉”,相當於沒有該異常值。如果異常值不多時建議使用此類方法

    2、填補;如果異常值非常多時,則可能需要進行填補設定,SPSSAU共提供平均值,中位數,眾數和隨機數共四種填補方式。建議使用平均值填補方式。

  • 中秋節和大豐收的關聯?
  • 荒野大鏢客2秘籍?