回覆列表
-
1 # 西線學院
-
2 # 加米穀大資料
大資料,顧名思義,是海量的資料或巨量的資料。
根據維基百科的定義,大資料的大小從TB級別到PB級別(1PB=1024TB,1TB=1024GB)不等。到目前為止,尚未有一個公認的標準來界定“大資料”的大小。換句話說,“大”只是表示大資料容量的特徵,並非全部含義。
大資料的市場規模沒有天花板
大資料產業特點及現狀
https://www.toutiao.com/i6586814699969446403/
隨著雲時代的來臨,大資料(Big data)也吸引了越來越多的關注。大資料(Big data)通常用來形容一個公司創造的大量非結構化和半結構化資料,這些資料在下載到關係型資料庫用於分析時會花費過多時間和金錢。大資料分析常和雲計算聯絡到一起,因為實時的大型資料集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。
“大資料”在網際網路行業指的是這樣一種現象:網際網路公司在日常運營中生成、累積的使用者網路行為資料。這些資料的規模是如此龐大,以至於不能用G或T來衡量。
大資料到底有多大?一組名為“網際網路上一天”的資料告訴我們。
一天之中,網際網路產生的全部內容可以刻滿1.68億張DVD;
發出的郵件有2940億封之多(相當於美國兩年的紙質信件數量);
發出的社群帖子達200萬個(相當於《時代》雜誌770年的文字量);
賣出的手機為37.8萬臺,高於全球每天出生的嬰兒數量37.1萬……
截止到2012年,資料量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。
國際資料公司(IDC)的研究結果表明,2008年全球產生的資料量為0.49ZB,2009年的資料量為0.8ZB,2010年增長為1.2ZB,2011年的數量更是高達1.82ZB,相當於全球每人產生200GB以上的資料。而到2012年為止,人類生產的所有印刷材料的資料量是200PB,全人類歷史上說過的所有話的資料量大約是5EB。
IBM的研究稱,整個人類文明所獲得的全部資料中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的資料規模將達到今天的44倍。每一天,全世界會上傳超過5億張圖片,每分鐘就有20小時時長的影片被分享。然而,即使是人們每天創造的全部資訊——包括語音通話、電子郵件和資訊在內的各種通訊,以及上傳的全部圖片、影片與音樂,其資訊量也無法匹及每一天所創造出的關於人們自身的數字資訊量。這樣的趨勢會持續下去。