回覆列表
  • 1 # 雲端望川

    通常資料質量評估和管理評估需透過以下幾個維度衡量。常見的以下維度:

    1.完整性

    完整性,是指資料資訊是否完整,是否存在缺失情況。資料缺失的情況可能是整個資料記錄缺失,也可能是資料中某個欄位資訊的記錄缺失。

    2.規範性

    規範性,是指記錄是否符合規範,是否按照規定的格式儲存(例如標準編碼規則)。

    3.一致性

    一致性,是指資料是否符合邏輯,資料內單項或多項資料間存在邏輯關係。

    4.準確性

    準確性,用於度量哪些資料和資訊是不正確的,或者資料是超期的。準確性可能存在於個別記錄,也可能存在於整個資料集上。準確性和規範性的差別在於規範性關注合規,表示統一,而準確性關注資料錯誤。

    5.時效性

    資料從產生到可以檢視的時間間隔,也叫資料的延時時長。某些實時分析和決策需要用到小時或者分鐘級的資料,這些需求對資料的時效性要求極高,所以及時性也是資料質量的組成要素之一。

    6.唯一性

    唯一性,用於度量哪些資料是重複資料或者資料的哪些屬性是重複的。即對存在於系統內或系統間的特定欄位、記錄或資料集意外重複的測量標準。

    7.合理性

    合理性,是從業務邏輯角度判斷資料是否正確。評估方面可參照規範性、一致性做法。

    8.冗餘性

    冗餘性,是指多層次資料中,中是否存在不必要的資料冗餘。

    9.獲取性

    獲取性,是指資料是否易於獲取、易於理解和易於使用。

  • 中秋節和大豐收的關聯?
  • 完善垃圾分類的措施?