回覆列表
-
1 # 會說科技
-
2 # 海州青年
壓力測試等的就是各種異常,有異常了才能排除隱患的。換句話說,問題肯定是早發現早解決來的划算,你主動發現問題,解決掉,叫專業,叫最佳化,發現問題,推介責任,被動解決要被罵慘!
-
3 # 奇妙青年
有價值。
資料清洗是資料處理的第一步。那麼識別異常值和查明異常的原因就是必備步驟。
異常值的原因:
1、資料來源有誤。
2、資料開發的錯誤。
程式設計師寫程式碼邏輯出bug了,異常值就出來了。
3、資料儲存過程沒問題,就是赤裸裸的異常值。
比如,房產經紀人的每月業績。有的經紀人運氣好,突然賣了一套5億的豪宅,那業績自然一騎絕塵,成為眾多碌碌無為經紀人當中的異常值。
這種情況,也需要查明原因,並解釋清楚。
4、資料儲存過程沒有問題,但是被作假了。
比如,銷售的成交訂單,有些異常值是因為人為的虛假訂單或者重複訂單。
這需要用專門的規則進行反查。
此外,資料分析的時候,異常值或者趨勢值本來就是要著重看的。
就價值而言,異常值可能比正常值還要高,因為異常的背後意味著特殊的事件,而透過對特殊事件的分析,能夠找到異常出現的原因,進而解決業務異常、資料異常,甚至是欺詐問題。無論是哪一種,都將改善業務的健康度或者是資料的質量,為後續的分析創造良好的基礎。如果有幸利用異常識別到欺詐等事件,透過最佳化規則,修補漏洞,可能會降低業務損失。
所以,遇到異常值時,千萬不可過濾了事,一定要記錄下來,當時或事後進行原因分析。