回覆列表
-
1 # 數通暢聯
-
2 # 資料劉磊
主資料指的是系統間共享的資料,比如客戶資料,商品資料,供應商資料等。相對於記錄業務活動的交易資料,主資料的變化比較緩慢。主資料與交易資料一起記錄了交易的全部資訊。舉個例子,超市的結算小票可以看作一條交易資料,裡面記錄了流水號,商品的名稱,數量,和金額,日期等。其中的商品名稱,來源於主資料,可以簡單理解為我們有一個貨品清單。它的更新是比較慢的,而交易資料則一直在發生。在企業中,主資料一般有專門的主資料系統來管理。一般在不同的業務系統中,可能存在不同編碼。比如商品名稱,在一套系統用ABC編碼,在另一套系統用123編碼,在打通系統資料的時候,就需要主資料系統把兩套系統做對映,相當於翻譯,這樣兩套系統的資料才能共享。
資料倉庫是為了支援企業決策分析而做的資料集合。它把銷售,客戶管理,庫存,生產,財務,人事等等業務系統的資料彙集到一起,並按照業務規則搭建資料模型,形成一個支援多維度分析的資料集合。資料倉庫系統不同於業務系統的地方在於,業務系統負責某個具體的業務功能實現,業務系統一般不保留歷史資料。而資料倉庫會把不同業務系統的歷史資料都拿過來,並按照主題搭建分析模型。
主資料和資料倉庫是兩個完全不同的概念。在系統層面,這是兩套獨立的系統。操作上,主資料系統的資料也會同步到資料倉庫中,作為分析的維度來使用。但是二者的定位和作用是完全不同的。
目前主資料、大資料、資料倉庫、Hadoop等概念都是市場上炒的很火的概念,但是很多人僅僅瞭解這些概念是互相有關聯的,卻不能很好的區分這些名詞之間的區別,今天在這裡我主要介紹一下主資料與資料倉庫。
在我看來主資料是指具有高業務價值的、可以在企業內跨越各個業務部門且能被重複使用的資料,是單一、準確、權威的資料。而資料倉庫是一個很大的資料儲存集合,出於企業的分析性報告和決策支援目的而建立,對多樣的業務資料進行篩選與整合。主資料可以看成是一類資料或多類資料,而資料倉庫則是多類資料的合集。可以看出主資料其實是資料倉庫的一部分。
我們搭建數倉,基於一定的規則進行資料抽取,將資料沉澱,保障資料是可追溯的。基於不同的演算法規則對數倉中的資料進行計算、匯聚來實現預測分析。而主資料管理使得企業能夠集中化管理資料,在分散的系統間保證主資料的一致性、準確性和權威性。主資料為資料倉庫提供的基礎資料(數倉模型的維表資料)就更具有權威性,那麼在做資料分析時也能更準確、更趨向於實際情況,更好的幫助企業高層進行決策分析。