回覆列表
-
1 # IT人劉俊明
-
2 # 四川新華小魚
大資料包括很多方面,但是很多都來源於生活。在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代》中大資料指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有資料進行分析處理。大資料的5V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值密度)、Veracity(真實性)。“大資料”是指以多元形式,自許多來源蒐集而來的龐大資料組,往往具有實時性。在企業對企業銷售的情況下,這些資料可能得自社交網路、電子商務網站、顧客來訪紀錄,還有許多其他來源。這些資料,並非公司顧客關係管理資料庫的常態資料組。[
大資料是我的研究方向之一,所以我來回答一下這個問題。
我先來說一下大資料的特徵,早期我們在談論大資料的時候都是從“4V”的角度來描述大資料的,也就是資料量大、資料結構多樣化、速度快、價值密度低等幾個方面。因為說了幾年之後,大家對大資料的特徵幾乎都有所瞭解,但是到底什麼是大資料大部分人還是搞不清楚。
其實早期我們在談論大資料的時候,大資料還沒有形成一個產業鏈,所以只能從特徵的角度來進行描述,因為很難從產業的角度來描述。目前,大資料正在從概念向產業化過渡,所以我們現在來談論大資料的時候可以說大資料包括以下內容:
第一,資料採集。資料採集是大資料的重要環節,目前除了傳統的結構化資料採集之外,物聯網成為採集資料的主力軍。物聯網採集的資料格式非常多樣化,有感測器資料、影片資料、音訊資料等等。
第二,資料的傳輸、儲存。這部分功能目前主要由雲計算平臺來完成,雲計算是大資料的重要支撐平臺,雲計算的基礎服務(IaaS)為大資料提供了資料的儲存服務以及提供計算資源。
第三,資料整理(清洗、歸併等)。這部分功能由專業的崗位來從事,這部分工作需要對業務邏輯有一定的瞭解,但是總的來說難度並不大,可以藉助軟體自動完成大部分功能。
第四,資料分析。資料分析是大資料目前的核心內容之一,資料分析又以場景分析為主,涉及到的行業非常廣泛。資料分析結合機器學習能做更多的事情,所以大資料也是人工智慧的基礎之一。
第五,資料安全。沒有安全的大資料是沒有前途的,所以大資料安全也是大資料產業的重要環節。
第六,資料呈現。大資料分析的結果要透過呈現端表現出來,很多傳統做資料分析的領域,比如BI,都可以納入到資料呈現端。
總之,大資料包含的內容都緊緊圍繞資料展開,大資料與物聯網、雲計算、人工智慧都有緊密的聯絡。
如果有大資料方面的問題,也可以諮詢我。