通常資料質量評估和管理評估需透過以下幾個維度衡量。常見的以下維度:
1.完整性
完整性,是指資料資訊是否完整,是否存在缺失情況。資料缺失的情況可能是整個資料記錄缺失,也可能是資料中某個欄位資訊的記錄缺失。
2.規範性
規範性,是指記錄是否符合規範,是否按照規定的格式儲存(例如標準編碼規則)。
3.一致性
一致性,是指資料是否符合邏輯,資料內單項或多項資料間存在邏輯關係。
4.準確性
準確性,用於度量哪些資料和資訊是不正確的,或者資料是超期的。準確性可能存在於個別記錄,也可能存在於整個資料集上。準確性和規範性的差別在於規範性關注合規,表示統一,而準確性關注資料錯誤。
5.時效性
資料從產生到可以檢視的時間間隔,也叫資料的延時時長。某些實時分析和決策需要用到小時或者分鐘級的資料,這些需求對資料的時效性要求極高,所以及時性也是資料質量的組成要素之一。
6.唯一性
唯一性,用於度量哪些資料是重複資料或者資料的哪些屬性是重複的。即對存在於系統內或系統間的特定欄位、記錄或資料集意外重複的測量標準。
7.合理性
合理性,是從業務邏輯角度判斷資料是否正確。評估方面可參照規範性、一致性做法。
8.冗餘性
冗餘性,是指多層次資料中,中是否存在不必要的資料冗餘。
9.獲取性
獲取性,是指資料是否易於獲取、易於理解和易於使用。
通常資料質量評估和管理評估需透過以下幾個維度衡量。常見的以下維度:
1.完整性
完整性,是指資料資訊是否完整,是否存在缺失情況。資料缺失的情況可能是整個資料記錄缺失,也可能是資料中某個欄位資訊的記錄缺失。
2.規範性
規範性,是指記錄是否符合規範,是否按照規定的格式儲存(例如標準編碼規則)。
3.一致性
一致性,是指資料是否符合邏輯,資料內單項或多項資料間存在邏輯關係。
4.準確性
準確性,用於度量哪些資料和資訊是不正確的,或者資料是超期的。準確性可能存在於個別記錄,也可能存在於整個資料集上。準確性和規範性的差別在於規範性關注合規,表示統一,而準確性關注資料錯誤。
5.時效性
資料從產生到可以檢視的時間間隔,也叫資料的延時時長。某些實時分析和決策需要用到小時或者分鐘級的資料,這些需求對資料的時效性要求極高,所以及時性也是資料質量的組成要素之一。
6.唯一性
唯一性,用於度量哪些資料是重複資料或者資料的哪些屬性是重複的。即對存在於系統內或系統間的特定欄位、記錄或資料集意外重複的測量標準。
7.合理性
合理性,是從業務邏輯角度判斷資料是否正確。評估方面可參照規範性、一致性做法。
8.冗餘性
冗餘性,是指多層次資料中,中是否存在不必要的資料冗餘。
9.獲取性
獲取性,是指資料是否易於獲取、易於理解和易於使用。