資料是事實或觀察的結果,是對客觀事物的邏輯歸納,是用於表示客觀事物的未經加工的原始素材。資料可以是連續的值,比如聲音、影象,稱為模擬資料;也可以是離散的,如符號、文字,稱為數字資料。在計算機系統中,資料以二進位制資訊單元0、1的形式表示。
數字化是指將任何連續變化的輸入如圖畫的線條或聲音訊號轉化為一串分離的單元,在計算機中用0和1表示。通常用模數轉換器執行這個轉換。當今時代是資訊化時代,而資訊的數字化也越來越為研究人員所重視。
早在上世紀40年代,夏農證明了取樣定理,即在一定條件下,用離散的序列可以完全代表一個連續函式。就實質而言,取樣定理為數字化技術奠定了重要基礎。
如今人類社會已經步入大資料時代,人們的所有活動都會在資料空間留下痕跡,這一切都源於網際網路的的出現。網際網路的價值在於其並非僅僅是連線,而是基於連線基礎上的記錄和資料。這些不斷積累的龐大資料正在塑造一個新形態-數字形態。
從量數、據數、人臉識別,到城市大腦、量子思維,正在形成一個以大資料為核心的社會形態,資料在網際網路社會的大資料時代是一種非常重要的資源,資料不是一切,但一切都會變成資料。
從人類歷史的發展程序看,記錄資訊的能力,是人類社會脫離原始社會進入文明社會的重要標誌之一。早期文明最古老的抽象工具就是基礎的計算以及長度和重量的計算。
隨著資料記錄的發展,人類探索世界的想法一直在不斷深化,人們渴望能更精確地記錄時間、距離、地點、體積和重量。計算機的出現帶來了數字測量和儲存裝置,這樣就大大提高了資料化的效率。
計算機也使得透過數學分析挖掘出資料更大的價值變成了可能。總之,數字化帶來了資料化,但是,數字化無法取代資料化。數字化是把模擬資料變成計算機可讀的資料,這與資料化有著本質的不同。
大資料從人們似懂非懂開始,到現在大資料概念基本上已經成為科普常識了。但是仍有人持懷疑態度,即大資料真的像傳說中的那麼有價值、對社會、對科技發展具有指導意義嗎?結論是十分肯定的,有!只不過大資料的真正意義並非是建立在IT技術進步而導致的資料採集、整理、分析能力的提升,而是建立在我們對於資料的不同理解之上。
事實上,人類對於外部世界的認知就是建立在“資料”之上的。舉例來說,一個嬰兒,他對於父母的辨識、對於語音的學習、對於危險的防範等,都是來自於一次又一次地重複嘗試,當積累到了足夠的數字,他就會把這種積累歸納為自己的知識。
比如,一個小朋友看到不止一次人觸控到燒開的水會被燙傷,當他看到1000次這樣的事例後,他就會透過從這些資料的積累中,使得自己對於開水的認知能力和防範意識得到一個提升。
資料不僅僅是一項技術,它意味著數字時代的到來,將人類與大資料融合在一起,為人們展現一個對世界全新的認知思路。將世界看作資訊,看作可以理解的資料的海洋,為我們提供了一個從未有過的審視現實的視角。它成為一種可以滲透到所有生活領域的世界觀。
在物聯網時代,一切都可以數字化,資料就是資源和財富,大資料分析已成為業務中的關鍵要素。基於資料的分析、監控和資訊服務變得越來越普遍,在各行各業中,越來越多的資料驅動企業需要對資料進行實時吸收好分析,以形成正確的判斷和決策,大資料正在成為IT行業中佔據主導地位,基於應用和服務的物聯網將促進大資料的更廣泛使用。
由於物聯網資料具有非結構化、碎片化、時空域等特性,需要新型的時間儲存和處理技術。而大資料技術可支援物聯網上海量資料更深入地應用。物聯網幫助收集來自感知層、傳輸層、平臺層、應用層的眾多資料,然後將這些 海量資料傳送到雲計算平臺進行分析加工。
物聯網產生的大資料處理過程可以歸結為資料採集、資料儲存和資料分析三個基本步驟。其中,資料採集和儲存是基本功能,而大資料時代真正的價值蘊含在資料分析中。物聯網資料分析的挑戰還在於將新的物聯網資料與已有的資料庫整合。
大資料與物聯網的結合使得應用空間廣闊,充滿著無限可能。隨著物聯網、網際網路、移動網際網路、智慧終端、大屏顯示系統、雲計算平臺等的聯合應用,大資料可以幫助人們建立智慧監控模型、智慧決策模型等應用,深刻改變人們的生活。
物聯網的價值在於其資料。未來的世界一定是數字的世界,需要一個有廣義雲計算能力的全維大平臺來支撐。隨著物聯網技術的逐步發展和應用,大資料給現實世界帶來的最大變化是一切都可以數字化,使人們意識到世界的本質是資料。
事實上,我們所處的世界就是由多種多樣的資料組合而成的,只不過是人們過去並未深刻地認識到這一點。
當前社會發展已經進入大資料時代,利用大資料技術來分析物聯網海量資料,將會使決策更加科學有效,同時它將改變人們的生產生活方式,創造出更多的新產業和新業態。推動人類社會進入更高層次的資訊化水平,未來,大資料將會徹底改變世界。