回覆列表
-
1 # 工作印記
-
2 # 日衝資訊 黃
資料倉庫的概念已經快20年的歷史了。而大資料則是近10年才興起的。兩個概念是完全不同的。
大資料隨著網際網路的普及,海量的資訊以各種形式在網路上釋出和共享。由於資訊量太大,人們不得不花費大量時間和投入從資訊的海洋中撈取一點點有用的資訊,有很多時候這甚至是一種遙不可及的夢想。為了幫助人們找到海量資訊中有用的部分,大資料提供了高速地對文字,圖形,結構化的資料等多種形式的資料進行識別和分析,精準地抽取出有用資訊的手段。在實現方法上,雲計算,人工智慧等技術起到了至關重要的作用。
資料倉庫和大資料的目的不同,實現的技術手段也不同,可以說是兩碼事。但是,大資料的涉及範圍很廣,資料倉庫也是大資料的分析物件,同時,大資料的分析結果也能被資料倉庫所使用。從這個意義上來說,二者又密切相關。
兩個名詞的從定義上就是有本質區別的
資料倉庫:是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合。它是單個數據儲存,出於分析性報告和決策支援目的而建立。
大資料:指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程最佳化能力的海量、高增長率和多樣化的資訊資產。
資料倉庫從某種角度來看其實是一種結構化的資料,根據企業的定位儲存的一些價值度高的資料集合,而大資料是來個各個層面的資料集合,這些資料的價值可能需求透過各種技術手段進行處理後才能體現。
當然,從某種角度來看,企業的資料倉庫本身就是一個大資料,是企業長時間積累的資料的集合。
從資料處理模式來看,資料倉庫也並非都是可以透過一個sql就能查出自己想要的結果的,而且如果倉庫中資料量巨大,也是需要藉助大資料處理的手段,例如一些工具來資料資料查詢已經資料展示的。