首頁>科技>

大時代大資料統計到2023年,大資料分析市場規模將達到1030億美元。糟糕的資料質量每年給美國經濟造成的損失高達3.1萬億美元。到2020年,每個人將在短短一秒鐘內產生1.7兆位元組。網際網路使用者每天產生約2.5億億位元組的資料。95%的企業認為管理非結構化資料的需要是一項業務問題。97.2%的組織正在投資大資料和AI。藉助大資料,Netflix每年可在保留客戶上節省10億美元

2020年大資料統計

我們可以認為資料是新時代的黃金嗎?讓我們回顧一下2020年的大資料統計,來找出答案。

1. Google每天獲得超過35億次搜尋。

Google仍然是搜尋引擎市場的最大股東,截至2020年1月,其在全球搜尋引擎市場的份額為87.35%。2020年的大資料統計表明,每年有1.2萬億次搜尋每秒超過40,000個搜尋查詢。

另外,15%的谷歌新搜尋內容都是此前從未標記過的!所以這些不僅僅是資訊的重複,取而代之的是每日都有更多獨特的資料集透過Google生成。

2. WhatsApp使用者每天最多交換650億條訊息。

您是否還知道WhatsApp現在在全球180個國家/地區中並且擁有60種不同的語言可用?

不僅如此,有500萬家企業正在積極使用WhatsApp Business應用程式與客戶建立聯絡,並且全球有超過10億個WhatsApp群組。

現在你知道了。

3. 糟糕的資料質量每年給美國經濟造成高達3.1萬億美元的損失。

在大資料分析成為一個成熟的想法之前,公司將大量資訊儲存在其資料庫中,卻不知道該如何處理。對於像美國這樣在高度資料驅動的經濟中運作的國家來說,虧損資料可能會達到數萬億美元。

不良的資料質量可能會導致決策失誤或業務策略錯誤。這將導致生產率降低,並在客戶和品牌之間造成不信任,從而使該品牌在市場上失去聲譽。BI工具和資料視覺化軟體對於2020年的業務成功至關重要。

4. 95%的企業認為對管理非結構化資料的需要是其業務面臨的問題。

在像我們這樣的數字經濟中,只有那些擁有正確資料形式的經濟體才能成功領航市場,做出未來預測並調整其業務以適應市場趨勢。不幸的是,我們今天生成的大多數資料都是非結構化的,這意味著資料的形式,大小甚至形態都不同。因此,管理和分析既困難又成本高昂,這解釋了為什麼對大多數公司來說這是一個大問題。

5. 全球45%的企業正在雲中執行至少一種大資料工作負載。

根據有關雲計算中大資料的統計,雲技術是席捲全球的最新技術趨勢之一。它消除了組織購買和維護昂貴的計算硬體,為主機付費以及開發伺服器日常執行所需的軟體的需要。

儘管到2020年,雲可以容納Internet上所有工作負載的85%,但目前只有一小部分企業將其用於大資料運營。

6. 我們今天生成的資料中80-90%是非結構化的。

在當今世界,消費者與品牌打交道時希望擁有相同的崇高體驗。無論他們使用哪種裝置,他們始終希望獲得相同的質量體驗。

使用者可以使用PC透過社交媒體與公司聯絡,在移動裝置上瀏覽公司網站,使用平板電腦進行購買以及透過電子郵件與您的客戶服務聯絡。這樣,所有資料都是從同一個人生成的,但形式卻不同。

大資料行業統計

儘管有些行業在大資料上大放異彩,讓我們找出哪些行業代表一些最傑出的投資者:

7. 到2025年,銀行中的大資料分析市場可能會增長到621億美元。

根據有關銀行業大資料的統計,全球銀行業已經將大資料分析納入其基礎架構中,並且正在迅速地發展。截至2013年,全球金融部門中有高達64%的人已將大資料納入其基礎架構的一部分。快進到2019年,大資料銀行分析市場已達到298.7億美元,到2020年至2025年之間的複合年增長率為12.97%。

全球銀行所產生的資料可以提供改進的客戶服務,幫助銀行家為其客戶建立新的個性化報價,還可以幫助更好地管理風險。所有這些最終將導致全球銀行業績效的提高。

醫療保健是一個每天產生大量資料的行業。有關特定診斷的資料越多,醫療保健專業人員就越容易處理它們。

大資料可以帶來:

降低個人醫療費用

更好的醫護人員 治療能力

有效避免可預防的疾病

流行病暴發的預測

改善整體生活質量

有關大資料在醫療保健方面的統計,在全球大資料分析的醫療保健市場到2019年底,已經價值226億美元,並且預計將以20%左右的複合年增長率增長。

通用大資料統計

9.到2020年,將有大約40萬億千兆位元組的資料(40 ZB)。

衡量我們今天擁有的資料量並不是一門精確的科學。在瀏覽與大資料有關的數字時,我們發現了許多預測和估計,但我們可以保留的數字很少。大資料增長統計的數量也很高。關於大資料量的許多預測之一來自IDC的研究“ 2020年的數字宇宙”。訊息人士稱,明年,我們應該擁有約40萬億千兆位元組的資料,即40 ZB。

同一項研究表明,2010年的大資料量為1.2 ZB。此外,IDC還向我們提供了另一條有用的資訊,這些資訊幫助我們回答了資料增長速度有多快的問題?IDC報告稱,到2020年,數字宇宙將每兩年翻一番。因此,我們決定對此進行測試。我們採用了2010年以來的資料量(1.2 ZB),並在十年中每兩年將其翻倍五倍。

我們得到的結果約為38.5 ZB,這與IDC對2020年的預測(40 ZB)基本一致。現在,這些都是粗略的估算,因此,在2012年,資料量為2.8 ZB(而不是2.4 ZB)。每個連續的估算值也略有不同。

這就是為什麼資料視覺化軟體和資訊圖表工具變得越來越流行的原因。除非以易於消化的方式呈現,否則我們的大腦根本無法處理太多資訊。

10.所有資料的90%是在最近兩年中建立的

引起我們注意的大資料統計資料之一來自於2017年的IBM研究。該資料概述了當時全球90%的資料是在過去兩年中建立的。起初,我們很驚訝地發現我們在相對較短的時間內生成了如此多的資料。但是,一旦我們分析了網際網路的驚人增長,這便開始變得有意義。2012年,我們有25億網際網路使用者。2014年,這個數字達到了30億大關,到2019年,我們的線上人數達到41億。

現在,可以肯定的是,隨著時間的流逝,資料量呈指數增長。那麼,難道真的是我們在短短兩年內就建立了90%的所有資料嗎?答案是肯定的。

11.今天,從網際網路上下載所有資料大約需要1.81億年的時間。

關於大資料的有趣資訊來自Unicorn Insights,它回答了從網際網路下載所有資料需要多長時間的問題。該來源使用以下值:Internet上所有資訊的0.55 ZB,平均下載速度為44Mbps。但是,由於這些大資料統計資訊已更改,因此我們以33 ZB的資料和46Mbps的平均下載速度來重新計算。我們得到的結果大約是1.813億年。令人印象深刻,對不對?

12. 2012年,僅分析了所有資料的0.5%。

除非對其進行標記或分析,否則大量海量資料沒有價值。那麼,問題是那有多少資料?根據IDC從2012年開始的數字宇宙研究,僅分析了0.5%的資料,而標記資料的百分比略高,為3%。透過進一步研究這些資料分析統計資料,我們發現並非所有資料都有帶來價值的潛力。

2017年,《經濟學人》聲稱資料已取代石油成為世界上最有價值的資源。有許多來源將資料與石油進行了比較,而忽略了兩者之間的一個巨大差異。與石油不同,可以輕鬆提取資料,並且供應源源不斷。而且,與石油不同,我們可以多次使用資料並從中獲得新的見解。石油和資料之間的比較使我們得出以下結論:我們應該收集並存儲儘可能多的資料。但是,如果我們僅這樣做,而沒有標記或分析我們擁有的資訊,其價值將遠不如石油的價值重要。

13.網際網路使用者每天生成約2.5億億位元組的資料。

到2020年,我們應該擁有估計的資料量(40 ZB),因此我們必須問自己,建立所有這些資料的作用是什麼。那麼,每天產生多少資料?2.5億位元組。現在,這個數字似乎很高,但是如果以兆位元組為單位,即0.0025兆位元組來看,這似乎還不算多。再加上到2020年我們將擁有40 ZB的事實,我們將以固定的速度生成資料。

但是,還有其他方法可以檢視我們每天生成的資料量。2.5億位元組等於地球上所有螞蟻的數量乘以100。此外,如果有1億便士,我們可以覆蓋整個地球1.5倍。擁有2.5億個五倍。我們可以從大資料的事實和資料中學到的東西真是令人著迷。大資料方面,2018年是非常有趣的一年,我們預計2019年將同樣令人興奮且資料豐富。

14. 2019年,網際網路使用者線上消費了12億年。

試想一下,網際網路使用者在一百萬年中可以生成多少資料,更不用說十二億年了?現在,在繼續之前,讓我們解釋一下如何得出這個結論。2019年,我們有43.9億網際網路使用者。根據2019年最新的《數字報告》,網際網路使用者在網際網路上花費了6個小時42分鐘,這清楚地表明瞭大資料的快速增長。因此,如果43.9億網際網路使用者中的每一個每天都在網上花費6個小時42分鐘,那麼僅在2019年我們就花費了12億年。

15.社交媒體佔在線總時間的33%。

除了多網路趨勢的興起以外,使用者在社交媒體平臺上花費的平均時間也顯著增加。2012年,數字使用者在社交媒體網站上花費了一個半小時來填補其空閒時間,而在2017年,他們在這些網站上的平均時間為2小時15分鐘。

最後,同一訊息來源發現,在數字使用者線上花費的總時間中,有33%留給了社交媒體。毫無疑問,這就是為什麼資料增長統計資料是當今的大部分原因。除了社交媒體,使用者在網上花費的時間中有16%用於線上電視和流媒體,另外16%用於音樂流媒體。線上新聞佔據了總線上時間的13%,而其餘22%的時間則用於其他線上活動。

16. 2019年,有23億活躍的Facebook使用者,他們生成大量資料。

2019年有23億Facebook使用者。現在,我們要回答的問題是這些使用者僅在一分鐘內生成多少資料。為了幫助我們解決此問題,我們從Domo收集了資料,該資料釋出了有關數字使用者在60秒內建立的資料量的年度報告。

Facebook從2012年開始的統計資料顯示,使用者每分鐘共享684,478條內容。2014年,這一數字增長了近四倍,每分鐘產生246萬條內容。當談到2015年的資料統計時,Domo的資料顯示,在短短60秒內,Facebook使用者就獲得了410萬條帖子。

除了Facebook的統計資料外,Domo還為我們提供了一些相當引人入勝的美國大資料統計資料。訊息人士稱,2017年美國人每分鐘使用2657700 GB網際網路資料。2018年,每分鐘使用的網際網路資料量達到3138420 GB,在一年中有驚人的增長。

17. Twitter使用者每分鐘傳送超過50萬條推文。

Facebook的網際網路資料使用情況統計只是冰山一角。來自Domo的Data Never Sleeps 6.0報告的社交資料也為我們提供了有關Twitter上使用者活動的一些見解。每分鐘的推文數量從2017年的456,000條增加到2018年的473,400條,最終達到2020年的528,780條。

我們還查看了Internet Live統計資料,以檢視僅在2019年傳送了多少條推文。在不到1.5個月的時間裡,Twitter使用者傳送了300億條推文。考慮到Twitter誕生前的三年時間才達到十億條推文,我們今天的數字向我們展示了這些社交網路在過去幾年中增長了多少。

此外,Twitter是使用大資料和人工智慧的大公司之一。有關Twitter的統計資料和事實向我們表明,社交媒體網路不僅將AI用於其影象裁剪工具,而且還用於防止不當內容。

18. 97.2%的組織正在大資料和人工智慧上進行投資。

2018年,New Vantage釋出了第六次高管調查,主要針對大資料和人工智慧。該研究記錄了包括摩托羅拉,美國運通,納斯達克等在內的大約60家《財富》 1000強企業高管的回答。除了表明大資料在領先公司中的強大存在之外,新華帝的研究還回答了以下問題:公司花了多少錢進行資料分析?

62.5%的參與者表示,他們的組織任命了首席資料官(CDO),這表明自2012年以來增長了五倍(12%)。此外,參與這項研究的組織數量創紀錄,其對大資料和人工智慧計劃的投資達到了97.2%。少於5,000萬美元的組織中,投資比例最高的組織(60.3%)。近三分之一的參與者(27%)表示,他們的公司在大資料和AI方面的累計投資在5,000萬美元至5.5億美元之間。最後,只有12.7%的參與者表示,他們的公司投資了超過5億美元。

那麼,大資料是未來嗎?如果我們專注於高盛,IBM和美國銀行等公司的大資料投資,我們可以回答“是”。

19.使用大資料,Netflix每年可在保留客戶方面節省10億美元。

如今,許多公司都使用大資料來擴充套件和增強業務,而最好的影片流服務之一Netflix就是一個很好的例子。截至2019年10月,數字使用者最喜歡的流媒體服務Netflix擁有1.635億訂戶。現在,這家位於加利福尼亞的公司可以幫助我們回答以下問題:大資料有哪些好處?嗯,在流服務中使用大資料的好處之一是由於較低的訂閱取消率而保留了客戶。Netflix制定了將觀眾固定在座位上的策略,大資料是該策略的重要組成部分。

Netflix收集的某些資訊包括搜尋,評分,重新收看的節目等。這些資料可幫助Netflix為使用者提供個性化的推薦,顯示類似於他們已經觀看過的影片的影片,或為特定型別的影片提供各種建議。另外,我們必須承認,該公司的“持續監視”功能極大地改善了使用者體驗。

在檢視各種大資料統計資料時,我們發現Netflix早在2009年就投入了100萬美元用於增強其推薦演算法。更有趣的是,該公司2015年用於技術和開發的預算為6.51億美元。2018年,預算達到13億美元。

至於保留客戶方面節省的10億美元,這只是Carlos Uribe-Gomez和Neil Hunt在2016年所做的粗略估計。我們認為,這一數字現在要高得多,因為Netflix在內容上花費了超過120億美元。在2018年,這一數字在2020年達到了170億美元。

我們已經介紹了Netflix如何從大資料中受益,但這僅僅是個開始。大資料在各種行業中都佔有一席之地,因為它可以幫助發現模式,消費者趨勢並增強決策能力。那麼,問題是大資料產業價值多少?在未來幾年中,我們可以期待什麼?Wikibon在其2018年大資料分析趨勢和預測中回答了這些問題。

那麼,大資料值多少錢?據Wikibon稱,大資料分析市場(BDA)預計將達到490億美元,複合年增長率(CAGR)為11%。因此,市場每年將獲得70億美元的價值。根據這一預測,到2023年BDA市場將達到1030億美元。

21. 2020年,大資料市場預計將增長14%

在研究Statista對全球資料市場增長的預測時,我們發現大資料在2012年(61%)和2013年(60%)的增長率最高。在進行大資料增長統計時,2018年大資料市場增長了20%,而在2019年,大資料市場預計將增長17%。正如Statista指出的那樣,市場的增長將隨著時間的流逝而下降,到2025年至2027年將達到7%。

22.到2020年,資料科學和分析工作的職位清單將達到270萬左右。

大資料行業的最大問題之一是缺乏具有深厚分析能力的人員。從資料增長統計資料來看,很顯然沒有足夠的人接受過大資料的培訓。根據RJMetrics的資料,2015年,全球共有11,400至19,400名資料科學家。麥肯錫預測,到2018年,將有大約280萬人擁有分析人才。另一方面,到2020年,資料科學和分析工作的數量預計將達到270萬。因此,資料科學和分析人才的需求之間存在很大差距。

23.到2020年,每個人將在短短一秒鐘內產生1.7兆位元組。

如果我們假設Domo的大資料增長預測是準確的,那麼到2020年,地球上的每個人每天應該產生146,880 GB。如果我們考慮到那時世界人口將達到80億,那麼很容易得出結論,我們每天建立的資料量將急劇增加。此外,IDC預測,到2025年,我們將每年生產165 ZB。

現在,讓我們跳到2020年與大資料相關的技術預測和未來趨勢。

24.到2020年,自動化分析對於大資料將至關重要。

大資料領域的許多預測之一是,從現在開始的一年內,將不可避免地實現諸如Hadoop和Spark之類的框架背後的流程的自動化。另一個預測與智慧可穿戴裝置有關,這將有助於加速大資料的增長。我們也可以期望機器學習在不久的將來會進一步發展。結合資料分析,我們希望它可以建立預測模型,以更高的準確性預測未來。最後,Flat World Solutions預測,如果選擇資料驅動的方法,到2020年企業將獲得4300億美元的收入。

我們希望我們成功地找到了一些最令人印象深刻的大資料統計資料。該主題的主要收穫之一是大資料市場正在迅速擴充套件,並且我們日新月異地擁有更多資訊。最終目標不是收集儘可能多的資料,而是從我們收集的資料中獲取價值。

大資料趨勢

讓我們看一下有關大資料趨勢的一些統計資料,以瞭解未來的發展趨勢:

25. 到2025年,物聯網裝置的數量可能會增加到416億。

全世界每秒都有 127臺新裝置連線到網際網路。這些連線的裝置每天產生5兆位元組的資料,到2025年可能達到79.4 ZB。

物聯網裝置執行各種功能,這取決於它們的設計目的以及要收集的資訊型別。從健身裝置,感測器到其他裝置,物聯網可幫助行業增強功能並擴大市場範圍。

26. 到2022年,全球在大資料分析解決方案上的支出將超過2743億美元。

根據業務中有關大資料的統計資料,數字化轉型和技術進步仍然是增加大資料支出的主要先驅。在每個行業中都有如此激烈的競爭,企業需要不斷創新以保持與市場的相關性。大資料分析提供了行業專家做出明智決策所需的適量資訊。這些決策可以透過準確識別可以潛在地提高業務收入的市場趨勢來推動業務向前發展。

結論

在這個數字時代,大資料已經並將繼續成為一支不可忽視的力量。大品牌和行業專家都知道這一點。從長遠來看,利用其眾多優勢的企業領導者將始終領先於競爭對手。不要猶豫,行動起來!

5
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 大資料營銷,企業應該這樣做