回覆列表
  • 1 # 野釣旅行者

    基於標準差(SD)法

    基於MAD的中心距離計算法

    1.基於標準差(Standard2Deviations, SD)法

    a為一組數的平均數,b為這組數的標準差,則超出[a-2b, a+2b]範圍的值即被認為離群值。

    總結

    這種方法不是特別的靠譜,因為離群值的出現可能反過來很大程度影響平均數和標準差,所以平均數或者標準差受離群值的制約而使得這個檢測方法不靠譜。

    2.基於絕對離差中位數(Median Absolute Deviation, MAD)的中心距離計算法

    (1)計算所有觀察點的中位數median(X);

    (2)計算每個觀察點與中位數的絕對偏差值abs(X-median(X));

    (3)計算(2)中的絕對偏差值的中位數,即MAD = median(abs(X - median(X)));

    (4)將(2)得到的值除以(3)的值,得到一組基於MAD的所有觀察點的離中心的距離值abs(X - median(X))/MAD.

    總結

    這是一種穩健對抗離群資料的距離值方法,採用計算各觀測值與平均值的距離總和的方法。放大了離群值的影響,相比基於SD的中位數距離法,它可以更清晰地從正常觀察點中檢測出離群值來。

  • 中秋節和大豐收的關聯?
  • 鼠吃鼠,人會不會吃人?