什麼是大資料?要簡單通俗點的解釋？

首頁>Club>圓圓滾滾週週2020-05-22 08:57

什麼是大資料?要簡單通俗點的解釋？

大資料

回覆列表

1 # 我的股票操作日記

從字面意義理解，就是大量，海量資料，這些資料，這些資料有數字，文字，影象等，為什麼以前沒有這個概念呢，因為以前計算機的計算能力不行，網路頻寬不夠，儲存裝置不夠大，所以無法採集和處理海量資料，現在條件具備了，可以處理海量資料了，並且從海量資料裡提取的資訊越來越多。所以現在開始有大資料的概念了。

2 # 重慶吳超

社會某區域或某行業或某領域內真實、實時、系統、完善且有分析、彙總、歸納的持續的資訊集合。
3 # 股市小蠻腰

大資料就是無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合，是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。

4 # 投行老周

就是很多很多的資訊，主要指合法取得，且可合法實用的使用者身份資訊，住址資訊，聯絡方式，生活習慣，消費習慣等。
5 # IT人劉俊明

這是一個非常好的問題，作為一名大資料從業者，我來回答一下。

瞭解大資料首先要從大資料的概念開始，不同於人工智慧概念，大資料概念還是相對比較明確的，而且大資料的技術體系也已經趨於成熟了。解釋大資料概念，可以從資料自身的特點入手，然後進一步從場景、應用和行業來逐漸展開。

最後，大資料還有一個特點就是資料本身的真實性，大資料時代所帶來的一個重要副作用就是資料真假難辨，這也是當前大資料技術所要重點解決的問題之一。從當前大型網際網路平臺所採用的方法來看，通常是技術和管理相結合的方式，比如通過為使用者認證就能夠解決一部分資料的真實性（專業性）問題。
我從事網際網路行業多年，目前也在帶計算機專業的研究生，主要的研究方向集中在大資料和人工智慧領域，我會陸續寫一些關於網際網路技術方面的文章，感興趣的朋友可以關注我，相信一定會有所收穫。

6 # 大鵬展翅說膠帶故事

什麼是大資料，應該很好理解！簡單通俗的說就是你在大資料面前就是赤裸裸的！任何事情都隱藏和瞞著不了！

從百度的搜尋引擎開始，如果準確的說是從美國的谷歌開始，這樣的引擎搜尋功能應該是大資料的前身吧，這個是我個人的理解！不知道有沒有問題！

搜尋引擎把所有的資料顯示出來，並分析出來，找到大家想要的資料！這個就是大資料！
資料，資料，就是準確的數字量化，通過對準確的數字計算來判斷資料結構，得到資料結果！

比如一個人喜歡旅遊，日常生活中購買物品的東西都會多少跟旅遊有關，每天的行程線路也都會通過資料展現出來！而通過對這個人的日常行為規範進行大資料處理，就會得出這個人的生活習慣，日常愛好及生活細節！從而得出大資料的結論！

應該說，現在已經離不開大資料了！因為我們已經進入到了大資料時代！
7 # 李小礦

我理解大資料就是可以用數字表示的所有的事，包括你認為有用的沒用的，通通扔給電腦，通過指定的演算法來呼叫其中相關資料，從而得出你需要的結果。

8 # 陰溝裡的蟲子

資料就是資訊，大資料的邏輯就是彙集足夠多的資訊，加以梳理分析，以便於做出準確判斷，再設計匹配的商業化方案，以達到商業目的。
再通俗點，就是一個資訊收集分析的工具而已。
9 # 空空老木頭

通俗點說，就是很多資料。但是，這個多，不是雜七雜八的多，而是有一定關聯性的，可以從中分析總結出一些事物的特徵來。

10 # 老徐2430

生活工作中所有的流水賬資訊就是大資料，在資訊化時代，它通過特定模式的整合、分析，使人得到對自己有用的、有指導性的結論。參加工作時講臺塑數字化、表單化、資訊化，一晃二十年了，應該就是大資料的雛形，但那會資訊化能力不足，沒人這麼稱呼。管理是千變萬幻，主線未變，大資料也僅僅是一種方法，只是更符合形勢，更有效。小名流水賬，大名大資料。
11 # 涵藝視覺

大資料通俗的解釋就是海量的資料，顧名思義，大就是多、廣的意思，而資料就是資訊、技術以及資料資料，合起來就是多而廣的資訊、技術、以及資料資料。

12 # 治理科技王老師

相信大家對於這次新冠肺炎疫情期間社群防控力度之嚴、強度之大深有體會。但在杭州濱江區，在疫情爆發之初，卻面臨著社群疫情防控人手不足的問題。對此，國家電網杭州分公司研發了全國首個“電力大資料+社群網格化”演算法，實現了收集、研判電力資料功能，並對濱江157476戶居民、超過1000萬條電力資料，進行了收集和分析。為了精準判斷細微的用電資料差別，該公司在演算法中開發了居民短暫和長期外出、舉家返回、隔離人員異動等3個場景6套演算法模型。通過3輪150餘萬條次電力大資料巡航，精準判斷出區域內人員日流動量和分佈，還可以實時監測居家隔離人員、獨居老人等特殊群體347戶。這讓社群人員得以根據電量波動判斷業主狀況，提高了登記和服務的效率，從而解決了人手不足的難題。
聽完這個例子，不知道你有沒有什麼感觸呢？看似“高大上”的大資料，實際上就是這麼的“接地氣”。今天呢，我主要是想糾正一些大家對於大資料的誤解，對大資料有一個更清晰且正確的認識。

二、大資料是什麼？

其中，第三正規化和第四正規化都是由計算機來進行計算的，二者之間有什麼區別呢？

引用維克托·邁爾·舍恩伯格撰寫的《大資料時代》中的話來說，就是：大資料時代最大的轉變，就是放棄對因果關係的渴求，取而代之關注相關關係。第四正規化相對於第三正規化來說，更關注“是什麼”，而不需要知道“為什麼”，就像人類總是會思考事物之間的因果聯絡，電腦卻更擅長相關性分析。這也是為什麼有人提出第三正規化是“人腦+電腦”，人腦是主角，而第四正規化是“電腦+人腦”，電腦是主角。
也許會有同學提出疑問，這是不是與我們科學研究的理念相違背？畢竟，如果通篇只有對資料相關性的分析，而缺乏具體的因果解讀，這樣的文章一般被認為是資料堆砌，是不可能發表的。

這裡我又想給大家舉一個例子了，讓大家更好的理解第四正規化的意義所在。拿我們近年來特別關心的霧霾來說，我們想要研究霧霾的產生機制，從而進行鍼對性的預防。

按照第三正規化的思路，我們需要先在一些具有“代表性”的地方建立氣象站，收集與霧霾形成有關的引數，包括大氣化學成分、地形、風向、溫度、溼度等氣象因素。需要注意的是，第三正規化下，我們所收集的引數都是我們認為可能會影響到霧霾形成的因素，實際上已經人為地排除了某些不重要的引數。從研究的可行性角度出發無可厚非，但是從準確性上來說，已經是根源性的錯誤了。如果能夠獲取更全面的資料，即不加篩選地收集各類引數資料，進行更細緻的資料分析，那麼就能得出更科學的預測，這就是第四正規化的出發點。
這點相不難理解，我們日常生活中使用的微信、支付寶、微博、抖音等軟體每天都會產生數百億條以上的資料，這僅僅是移動應用一天的資料量，此外其他各行各業也都會產生各式各樣的資料，其總量絕對超出了你們的想象。舉個具體的例子，據英特爾預測，全球資料總量在2020年將達到44ZB，而中中國產生的資料量將為8000EB，8000EB是什麼概念？整個地球上所有沙粒總數的10倍！

第二、資料型別繁多

正如我剛才所提到的，大資料包括結構化資料、半結構化資料和非結構化資料。結構化資料指資料的屬性相同，可以用統一的結構進行表示；非結構化資料缺少固定的結構，通常整體儲存，比如各種圖片、視訊、音訊等，非結構化資料越來越成為資料的主要形式，據IDC資料顯示，企業中80%的資料都是非結構化資料；而半結構化資料則介於兩者之間，比如HTML和XML文件，其內部用成對的標籤記錄對應的資料，但每個文件內部的標籤又不是統一的，沒有固定的規律。
第三、價值密度低

大資料的價值很高，但是單條記錄卻基本無意義，缺乏有效資訊，這也對我們收集資料提出了要求，資料分析一定要建立在大量的資料集的基礎上。舉個例子，張三是某電商平臺的忠實使用者，我們作為後臺，如果單看他的某一條購物記錄，無非是知道了他買了什麼東西，消費了多少錢，但是我們一旦利用大資料分析系統對張三所有的購物記錄進行分析，那麼我們就能得出他的一個消費畫像，瞭解其購買偏好，從而對他進行精準的商品推薦。

第四、處理速度快

如今5G時代，資料產生的速度越來越快，這就要求資料後臺能夠快速處理掉無用資訊，因為需要控制儲存成本。同時更快速地處理資訊，能夠獲取更多的有效價值，才能夠在商業競爭中取得優勢。兩方面因素都刺激著資料處理技術的高速發展，目前採取流式資料處理技術可以達到毫秒級甚至微秒級的處理時間，滿足實時監控分析使用者行為，從而提供個性化服務的需求。
三、結語

最後，引馬雲的一句話作為結尾：未來的時代將不是IT時代，而是DT的時代。這裡的DT就是data technology, 希望各位對大資料有了一個新的認識，也希望大家能夠在這個萬物互聯的時代，把握時代機遇，掌握資訊技能，做一朵勇往直前的“後浪”。
13 # 子游財經

講一個關於大資料的段子，應該會有通俗的認識理解～

某必勝客店的電話鈴響了，客服人員拿起電話。

顧客：你好，我想要一份……

客服：先生，煩請先把您的會員卡號告訴我。

顧客：16846146***。

顧客：你為什麼知道我所有的電話號碼？

客服：陳先生，因為我們聯機到CRM系統。
顧客：我想要一個海鮮比薩……

客服：陳先生，海鮮比薩不適合您。

顧客：為什麼？

客服：根據您的醫療記錄，你的血壓和膽固醇都偏高。

顧客：那你們有什麼可以推薦的？

客服：您可以試試我們的低脂健康比薩。

顧客：你怎麼知道我會喜歡吃這種的？

客服：您上星期一在國家圖書館借了一本《低脂健康食譜》。

顧客：好。那我要一個家庭特大號比薩，要付多少錢？

客服：99元，這個足夠您一家六口吃了。但您母親應該少吃，她上個月剛剛做了心臟搭橋手術，還處在恢復期。

顧客：那可以刷卡嗎？

客服：陳先生，對不起。請您付現款，因為您的信用卡已經刷爆了，您現在還欠銀行4807元，而且還不包括房貸利息。
顧客：那我先去附近的提款機提款。

客服：陳先生，根據您的記錄，您已經超過今日提款限額。

顧客：算了，你們直接把比薩送我家吧，家裡有現金。你們多久會送到？

客服：大約30分鐘。如果您不想等，可以自己騎車來。

顧客：為什麼？

客服：根據我們CRM全球定位系統的車輛行駛自動跟蹤系統記錄。您登記有一輛車號為SB-748的摩托車，而目前您正在解放路東段華聯商場右側騎著這輛摩托車。

顧客:當即暈倒......

14 # 活潑小韭菜

有人說大資料技術是第四次技術革命，這個說法其實不為過。很多人只是聽過大資料這個詞或者是簡單知道它是什麼，那麼它是什麼呢，在這裡就通俗點來說一下個人對大資料的理解。

大資料，很明顯從字面上理解就是大量的資料，海量的資料。大，意思就是資料的量級很大，不上TB都不好意思說是大資料。資料，狹義上理解就是12345那麼些資料，畢竟計算機底層是二進位制來存的，那麼在大資料領域，資料就不僅僅包括數字這些，它可以是所有格式的東西，比如日誌，音訊視訊，檔案等等。
舉個例子，淘寶雙十一的總交易額的顯示，後面就是大資料技術的支援，全國那麼多淘寶使用者的交易記錄匯聚到一起，資料量很大，而且要做到實時的展現，就需要強有力的大資料技術來處理了。

資料量一大，那麼得找地方來存，一個伺服器硬碟可以掛多少，肯定滿足不了這麼大的資料量儲存啊，所以，分散式的儲存系統應運而生，那就是HDFS分散式檔案系統。簡單的說，就是把這麼大的資料分開存在甚至幾百甚至幾千臺伺服器上，那麼管理他們的系統就是HDFS檔案系統，也是大資料技術的最基本的元件。

有地方存了，需要一些分散式的資料庫來管理查詢啊，那就有了hbase等，還需要一些元件來計算分析這些資料啊，mapreduce是最基本的計算框架，其他的計算框架Spark和Storm可以完成實時的處理，其中HDFS和MapReduce組成了Hadoop1.
一言以蔽之，圍繞大資料的發展，新興了大資料技術，大資料的網際網路公司，以及大資料技術的相關培訓公司，超人學院就是其中一個全方位的大資料培訓公司，因為我本身以前是做培訓的，我是不是在打廣告。。。
15 # 刀情劍客

大資料，簡單來講就是資料量大！

不過大有大的難處，由於資料量的暴增，導致之前的資料處理工具無法處理如此海量的資料，衍生出大資料技術，就是現在的hadoop和他的一系列周邊技術。。

技術進步之後，隨著資料處理能力的增強，人工智慧也隨之突飛猛進，人工智慧的特點就是需要大量的資料去餵養，這也是現在為什麼人們，更多的是提人工智慧，越來越少的談及大資料，因為大資料已經成為了基礎，就像空氣和水，非常重要，重要到沒有必要去討論。（當然現在空氣汙染導致大家對空氣的討論也多了起來，這是後話了）
人工智慧需要海量的資料餵養，導致人們又開始拼命的想要獲取資料，這個其實是商家層面，消費者來講只能說是資料的貢獻者！

所以，大資料只是商家的大資料，消費者需要商家提供更個性化的服務，就需要給商家提供更多的個人隱私，想要保護隱私，就沒有琳琅滿目的個性化，，對於消費者來講，這是一個無法迴避的迴圈！

16 # 盧禮憲

大資料這個詞其實流行了很久了，與我們的生活息息相關，並不陌生，現在我們生活中的大平臺基本上都用到大資料，淘寶，拼多多，美團，滴滴等都用到大資料，如今大資料基本上無處不在。

大資料(big data),IT行業術語,是指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。
二、大資料特徵

容量(Volume):資料的大小決定所考慮的資料的價值和潛在的資訊;

種類(Variety):資料型別的多樣性;

速度(Velocity):指獲得資料的速度;

可變性(Variability):妨礙了處理和有效地管理資料的過程。

真實性(Veracity):資料的質量。

價值(value):合理運用大資料,以低成本創造高價值。

人類誕生以來，資料就開始膨脹，時代交替，工業革命，網際網路時代，5G時代，人工智慧時代，都是資料的一次次發展，資料的不斷精準，加快了人類的新陳代謝，大資料推動歷史發展。
大資料的價值體現在以下幾個方面:

1、對大量消費者提供產品或服務的企業可以利用大資料進行精準營銷;

2、做小而美模式的中小微企業可以利用大資料做服務轉型;

3、面臨網際網路壓力之下必須轉型的傳統企業需要與時俱進充分利用大資料的價值。

4、各大領域的科研需要大資料，加快技術變革和換代如醫療，環保，公共政府服務

5、航空航天，軍事領域因為大資料也會得到突飛猛進的提升。
17 # 短線操作講解

一、概念：

· 一種規模大到在獲取、儲存、管理、分析方面大大超出了傳統資料庫軟體工具能力範圍的資料集合，具有海量的資料規模、快速的資料流轉、多樣的資料型別和價值密度低四大特徵。

大資料的本質就是一大堆結構化的和非結構化的資料。因為資料量太大，你沒辦法使用，你需要從中抓取出有價值的內容或你想要的資料，這就是大資料應用。
老程式都知道，我們做企業級的專案（資料庫專案）時，都會有資料的儲存，而且會做出很多圖表，為決策者進行科學地決策提供了客觀依據，為每個工作者從資料中發現問題，做進一步改進提供了依據，當然也有即時變動的資料展示位動態圖表。

1）、超市管理系統，也會把每年的資料進行彙總，對比每個月的銷量，以瞭解淡旺季，幫助做下一步的應對策略；把不同型別的商品進行彙總，對比哪個商品賣得多，哪個商品收益高；哪個商品在哪個時間段賣得快等等。當然，如果有會員的話，甚至可以統計出不同年齡段，不同性別的不同喜好等等。

2）、石油行業的進銷存系統，會統計哪個加油站的銷量好，哪種型號的銷量好。

3）、在HIS（醫院資訊管理）系統裡，會統計哪個科室的患者多，哪個醫生的掛號量大，哪個醫療裝置的使用頻度高，哪個病種多，甚至哪個年齡段得哪種型別病的數量多，甚至哪個地區的人患哪種病的概率高。在很多研究型醫院裡，還可以通過大量資料得出什麼型別的細菌是導致某種病的主因等等。
隨著時間的推移，資料的積累，隨著社會節奏的變化，使用資訊化系統的人越來越多，資料積累的速度越來越快，資料也越來越龐大。當規模大到在獲取資料，儲存資料，管理資料，分析資料方面大大超過了傳統資料庫軟體工具能力範圍的資料集合，並且資料的價值越來越大，針對資料的處理就需要專門的企業或者人員來完成，這就是現在大資料（當然，大資料的內涵遠遠不是這一兩句話能夠說清楚的）。

你可以簡單理解為：以前那是小資料，現在是大資料，哈哈！

從技術層面說，大資料和以前的資料時代（"小資料"）的最大差異在於：以前是資料找應用、演算法的過程，偏重於用抽樣推測全域性,從抽樣資料中分析，沒有采集到的樣本所對應的相關規律。

而大資料時代的重要技術特徵之一，是應用、演算法去找資料的過程，因為資料規模變成了技術上最大的挑戰，我們更關注每一個個體的微觀表現
二、應用場景舉例：

應用場景能夠體現出大資料的價值

1）、超市管理系統：

除了傳統的資料彙總對比外，現在還需要對資料做進一步的挖掘，如：根據大量的資料能夠的得出

（啤酒與尿布的故事）買了某種商品的人同時還會買另外一種商品，這樣超市就會盡量把這兩種商品的擺放位置靠近，以方便客戶進行購買（這是為了商場商品擺放提供了依據）

電子商務平臺上更是對資料的彙總更加有說服力，比如：淘寶，這個平臺“太可怕”了，他可以統計出南北方地區不同省份人群的特點，比如：不同省份人員的網購量，哪個性別，哪個年齡段購買最多，甚至根據衣服的尺碼都知道哪個省份人員的身高情況，那個人省份人員喜歡什麼顏色的衣服，噢，還有內衣，根據內衣，你都知道哪個省份女性的罩杯大小……
你在京東買了奶瓶又搜尋過奶粉，那京東的大資料就預測到你可能有小寶寶了，接下來一大堆和嬰兒有關的東西都推薦給你。你可能說這就是大資料啊，也太簡單了。其實如果京東僅服務你一個人，那簡單，但是京東對幾億使用者（大資料）都能做這個推廣，就不簡單。

這是商業公司對消費者日常的購買行為和使用商品習慣進行彙總和分析，瞭解到消費者的需求，從而改進已有商品並適時推出新的、消費者很可能會滿意的商品的體現

2）、石油行業的進銷存系統，著名的“魔鏡”預知石油市場走向，“魔鏡”幫助中石等企業分析資料，將資料視覺化，使企業科學的判斷、決策，節約成本，合理配置資源，提高了收益。

3）、在HIS（醫院資訊管理）系統裡特別是醫學研究上。
大資料改變醫學診斷手段

大資料分析為許多醫學難題的解決提供了新途徑，改變了一些疾病診斷方式。大資料可以挖掘出大量以往的相似疾病案例，通過分析這些診斷資料，對疑難雜症進行快速判別。如，在心臟病的診斷過程中，首先採集心臟資料並轉化為心臟圖譜，然後根據圖譜進行建模，模型中的變數包括壓力、張力、僵硬度等，最後根據這個模型分析心臟疾病病情，並作出相應的診療方案。此外，還可以利用影象處理技術，將心臟資料建模成為一個虛擬實體，通過設定不同的引數，模擬觀察各類手術或者藥物對心臟機能造成的影響，從而在診療之前就對診療後心髒疾病可能的走勢做出預測，為獲取疾病診治方法提供了手段。

大資料可預測病情的擴散趨勢

當流行病發生時，可以對疾病已有的擴散趨勢和感染人數進行建模，對每一個時間節點的資料進行分析處理，從而對流行病進行統計研究，預測病情的擴散趨勢，為疾病防治提供參考。同時，當下一次疫情發生時，可以調出往年資料進行分析，瞭解規律，從而有望抑制病情的進一步擴張。
……

疾病預防、臨床應用、網際網路醫療等等

4）、做搜尋引擎的百度和谷歌更是可怕，他儲存著所有網際網路使用者搜尋的關鍵詞。使用者搜尋的關鍵詞就代表著他所關心的話題，如：最近搜尋it的培訓的比較多，說明了什麼，最近搜尋web前端培訓的比較多說明了什麼，最近搜尋如何預防流感，得了流感怎麼辦，怎麼才能知道自己得了流感等等，這說明了流感的季節到來，擔心的流感的人很多，還有可能得到的流感的人數佔比和速度……

5）、交通：

實時路況給人們出行選擇帶來的方便。交通擁堵的原因分析，並結合車輛購買的增長情況，決定修路的節奏把握（如：什麼路段需要修路，什麼路段需要優先修路，要不要單行等等），根據大資料的全樣本體現的高峰期更有說服力，並制定一系列的對策等等。
三、大資料能做什麼？

預測，決策，為機器學習和人工智慧提供支撐

預測從古代就做了，但是大資料做預測的核心是全樣本，多個維度的全樣本，交叉確認，人會說謊，在社交場合會隱藏部分內心，但這部分內心在日積月累的網際網路上總有絲竹馬跡會留下來，所以，越來越多的資料模型和資料會給出無限接近感知的結果。也就是可以讓計算機具有學習能力，機器學習就是設計一個一些讓計算機可以自動學習的演算法，人工智慧的核心是什麼？歸根到底是“計算機用大資料在代替人腦來思考；計算機可能比人腦思考的更全面和迅速

當然大資料的應用，不是一篇文章，簡單舉個例子就能說明白的，現在是資料為王的時代，我們現在才真正開始體會“資料最有說服力"的魅力所在，我認為，資料的作用待開發的地方太多了，資料的作用，未來不可限量，沒法預測，也不敢預測，只能期待。我想未來大量的資料真的是一件“可怕”的事情，人類還需要把這些資料應用在生產上，否則，會帶來災難性的結果。

18 # 伴風indicate

大資料簡單來說：就是海量的資訊！不論用途，不論方向，就是簡單地資訊收集，引數收集，所有這些彙總起來就是大資料。大資料，不是隨機樣本，而是所有資料！

而大資料分析，就是針對這些資訊進行識別，再進行分類，將其有事件變為資料化，概率化，然後應用於各種商業用途。

以上是對大資料簡單地解讀。那麼大資料的意義何在呢？
隨著大資料的發展，企業的技術研發、應用和落地在前期就能獲得預期，能避免很多無所謂的浪費，以便於將有限的資源集中到開發更適合時代的企業產業。

商業決策可以通過資料分析來獲取更為準確的資訊和方向，最終能幫助決策者能更為準確直觀的指導業務實踐。

人工智慧離不開資料。隨著人工智慧的發展，資料能模擬的更加人性化，也更個人化，也更適合於各種不同場景的應用。大資料的價值在於它是目前解決這個時代更新最有效的方法。

但對於我個人而言，比較牴觸過度的大資料和網際網路，原因如下：

一、當各類app通過我的使用習慣，推薦各種我搜索過一次的各種商業廣告時，我會有種隱私被人冒犯的憤怒；

二、當你在使用各類軟體時，都會被要求提供個人資訊以便於獲得更好的使用者體驗，這無形中增加了個人資料洩露的風險；
三、當資料化盛行，似乎人性變得無處安放；

四、一旦行業固化，人們想要突破階層將變得不可能，擁有大量資料的將遙遙領先，後發的行人，將一輩子連望其項背的資格都沒有，可以預見社會將會成為一潭死水，毫無興趣和生機。
19 # 賣保哥

用最通俗的語言跟你解釋一下。

舉個例子，你想要買一雙鞋，開啟淘寶搜尋了半天，感覺不太合適，然後又一想，晚點買也可以，於是退出了淘寶，打開了抖音，開始看某些土味視訊。

當你下一次開啟淘寶的時候，淘寶一定會給你推薦各種新款式的鞋，並且會給你推送相關的活動。而你每次開啟抖音，看到的大部分都是土味視訊。
其原因就是因為你在淘寶上用了大部分時間去搜索鞋子，淘寶通過測算覺得你對鞋子感興趣，於是你每次進淘寶都會給你推薦鞋子。除非你下次用更多的時間去搜索另外一個東西。而抖音覺得你比較喜歡土味視訊，因此這種視訊便一直出現。

會銷售的售貨員在賣東西的時候一定不會僅僅去說產品，他肯定會通過各種方法去了解你的資訊，等到資訊足夠後再去為你推薦更加合適的產品，而此時你成交的概率非常大。

所以不妨回憶一下，買東西的時候有沒有售貨員跟你聊除產品以外的東西？比如家庭？

因此，只要能通過某種途徑，瞭解到你的詳細資訊或者行為，根據這些資訊或者行為進行推薦你所感興趣的東西，就叫做大資料。
不知道你清楚了沒有？

20 # 技術驅動

大資料（big data），指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合，是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。

　　麥肯錫全球研究所給大資料出的定義是：一種規模大到在獲取、儲存、管理、分析方面大大超出了傳統資料庫軟體工具能力範圍的資料集合，具有海量的資料規模、快速的資料流轉、多樣的資料型別和價值密度低四大特徵。
　　大資料技術的戰略意義不在於掌握龐大的資料資訊，而在於對這些含有意義的資料進行專業化處理。換而言之，如果把大資料比作一種產業，那麼這種產業實現盈利的關鍵，在於提高對資料的“加工能力”，通過“加工”實現資料的“增值”。

　　從技術上看，大資料與雲端計算的關係就像一枚硬幣的正反面一樣密不可分。大資料必然無法用單臺的計算機進行處理，必須採用分散式架構。它的特色在於對海量資料進行分散式資料探勘。但它必須依託雲端計算的分散式處理、分散式資料庫和雲端儲存、虛擬化技術。

　　隨著雲時代的來臨，大資料（Big data）也吸引了越來越多的關注。分析師團隊認為，大資料（Big data）通常用來形容一個公司創造的大量非結構化資料和半結構化資料，這些資料在下載到關係型資料庫用於分析時會花費過多時間和金錢。大資料分析常和雲端計算聯絡到一起，因為實時的大型資料集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。大資料需要特殊的技術，以有效地處理大量的容忍經過時間內的資料。適用於大資料的技術，包括大規模並行處理（MPP）資料庫、資料探勘、分散式檔案系統、分散式資料庫、雲端計算平臺、網際網路和可擴充套件的儲存系統。
　　這一切都始於數字時代到來後我們所產生的資料量的指數激增。這主要是因為計算機、因特網和技術能夠從我們生活的真實世界中獲取資訊，並將其轉化為數字資料。在2017年，當我們上網時、當我們攜帶配備GPS的智慧手機時、當我們通過社交媒體或聊天應用程式與我們的朋友溝通時、以及我們在購物時，我們會生成資料。你可以說，我們所做的涉及數字交易的一切都會留下數字足跡，這幾乎是我們生活的一切。

　　除此之外，機器生成的資料量也在快速增長。當我們的“智慧”家庭裝置彼此通訊或與他們的家庭伺服器通訊時，資料就會生成和共享。世界各地的工廠和工廠的工業機械越來越多地配備了感測器來收集和傳輸資料。很快，自動駕駛的汽車將走上街頭，將他們所到之處周圍的環境實時、四維的地圖傳送回家。

劇多

什麼是大資料?要簡單通俗點的解釋？

大資料

相關內容