-
1 # 數鑰分析雲
-
2 # 生活桃
剛好最近幾年也接觸了很多大資料、人工智慧、BI等。大資料和BI其實不應該說成是同一類應用的新舊技術,也不能說選擇大資料還是BI。兩者實際上時相互依賴,相互滲透遞進的。
1. BI即所謂的商業智慧,基於資料倉庫、資料處理、資料分析挖掘、資料展現等為企業提供有價值的內容,一直一來的形式以基於一個個體的資料庫為基礎進行的,資料體量小,分析不出更多有價值的內容,更多的還是資料多維度的分析展示。而大資料從字面意思看其實就是很大的資料,也就是將各種各樣(可以同類,也可以不同類)的海量資料集合在一起來進行資料分析和挖掘。關鍵點就在大字,因為只有擁有了這麼大體量的資料,才能分析出很多有意思的內容出來。你想就一個公司的資料、一個醫院的資料、一個商家的資料,你能分析出好多東西來呢。而一個區域、一個省、一個國家的資料彙集在一起就不一樣了。
2.不得不說很多企業很早就在做BI,但是那時的BI應該是基於比較單一的資料庫,進行一些基礎的資料清洗處理,然後把透過一定資料分析的結果透過BI工具展現給使用者。其實BI發展到現在,那應該是基於大資料平臺的BI了,也就是說資料基礎變了,從以前的單一的資料庫變成大資料平臺了。資料體量越大,能分析的內容就越多,同時基於大資料平臺的話,分析和資料展現的效率都大大提高。比如基於大資料可以分析出群體性事件,爆發性事件,預測性事件等等。也可以透過各區域,各類別的聚類演算法快速找出脫離群體的個體現象。
3.現在說得比較多的大資料+人工智慧,也就是我們是基於大資料平臺上的很多應用。其實也是一個數據抽取清洗、資料處理、資料分析挖掘、資料展現的一個全過程,只是我們抽取的資料量更大,資料處理的速度更高效,同時資料探勘的演算法可以更復雜,展示的形式更豐富而已,那這個過程其實也可以叫做BI過程。
4.因此我們不能說選擇大資料還是BI,我們可以在原來BI的基礎上進行技術擴充套件,變成基於大資料平臺的BI。比如基於hadoop的大資料平臺上進行BI分析,何嘗不可呢。可以基於海量資料進行快速處理,可以透過各種大資料演算法進行資料分析。同時現在的BI也可以有更豐富的大資料分析結果展示方式。
回覆列表
大資料與BI是兩種不同的概念和工具,是社會發展到不同階段的產物,大資料對於BI,既有傳承,也有發展。
大資料是什麼?
大資料(Big Data)是指在可承受的時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程最佳化能力來適應海量、高增長率和多樣化的資訊資產。大資料更偏重於發現,以及猜測並印證的迴圈逼近過程。
BI又是什麼?
BI(BusinessIntelligence)即商業智慧,它是一套完整的解決方案,用來將企業中現有的資料進行有效的整合,快速準確的提供報表並提出決策依據,幫助企業做出明智的業務經營決策。
大資料和BI從思想角度上來看,都是遵循“資料-資訊-知識-智慧”這個發展過程的;兩者的區別在於下面幾點。
大資料與BI的資料來源側重點是不同的,BI的資料來源一般為企業內部資訊化系統中的資料,大資料的資料來源不僅包含企業內部的資訊化系統的資料,還包括各種外部系統、機器裝置、資料庫的資料。大資料的資料來源更廣泛,而且資料更多的來自於雲端,可無限擴充套件。
2.發展方向
對於企業來說,BI的應用是一種管理和思維方式的轉變,對企業內部資料進行分析,支撐企業運營與決策,從傳統商業模式走向商業智慧。
大資料除了解決企業業務問題,還包括與行業、產業的深度融合,不同行業所呈現的內容與分析維度各不相同,是用全新的資料技術手段來拓展和最佳化企業業務。
3.技術標籤
BI的技術標籤:ETL、資料倉庫、OLAP、視覺化報表。
大資料的技術標籤:Hadoop、MPP、HDFS、MapReduce、流處理等。
隨著時代的變革與技術的迭代,相應的,BI在技術上也經歷了多次最佳化和變革,新型BI也被賦予了更多“大資料”潛能,既滿足海量實時資料分析,也滿足決策型的業務分析。
分析雲,一站式大資料分析解決方案,就是最典型的大資料與BI相結合的產物,也解決了大資料和BI之間如何取捨的問題。
大資料≠BI,大資料也不是BI的簡單升級,大資料涉及了思想、工具和技術的深層次變革。無論企業當前如何選擇,未來終將會迎來數字化轉型升級,走到資料驅動時代。