同時因為我只是一名普通的上班族,因此我決定從今天起靠拆讀著作,來傳遞知識。
正文開始
今天解讀的這本《智慧時代》是吳軍博士2016出版的著作,全書374頁,主要講述了大資料和人工智慧。本文的宗旨是解釋大資料和機器智慧的出現的意義,以及它對我們的技術發展、商業和社會都會產生重大的影響。
科學和資料的關係——資料是文明的基石
科學目前而言是人類開啟世界、認知世界最有效的工具,而大資料就是科學研究的底層基礎。
那就先來看看科學,科學研究的發展可以大致分為四個階段,即描述自然現象的實驗科學、以牛頓定律和麥克斯韋方程等為代表的理論科學、模擬複雜現象的計算科學和今天的資料密集型科學。
實驗科學的主要研究方法是觀察事物——提出假設——建立模型——進行實驗——獲得資料——分析資料——改進檢驗模型——得出結論。在這個過程種需要大量的歸納、統計、分析資料,比如地心說、日心說都是建立在這個基礎上產生的。
理論科學,理論科學是將事物的規律用簡單的定理進行表示,其核心是透過演繹推理來證明某些事物變化的客觀規律。而這個研究過程種邏輯推理和數學證明是其核心。提出假設——建立模型——邏輯推理——帶入資料——數學證明——得出定理。無論的牛頓定律還是勾股定理都需要用資料來做嚴格的證明。
在計算科學發明之前,人類描述自然、宇宙、社會等等現象,進行科學研究時常常需要花費巨大的精力進行重複複雜的資料計算,這種資料的處理在手算時常常無法確定一定正確,經常需要反覆的驗算以保證資料的完全正確,而科學研究又了人類最重要的研究工作,因此必須要有一種能夠從事簡單重複計算、保留計算過程、可以驗證的工具來代替手算,因此計算科學誕生了。
接著,隨著計算科學的進度,我們發現以往的科學研究存在一些重大的不足,比如實驗科學研究的資料代表性不足,資料的研究範圍太小,又或者是假設的前提有問題、模型的建立不正確等等。這就導致我們需要深度挖掘資料,擴大資料研究的範圍,找到更多的資料來支援科學模型等等。因此科學研究自然進入了資料密集型科學。
由此我們可以得出一個結論,資料是一切人類的活動的底層邏輯,是文明的基石,人類對它的認識反映了文明的發展程度。人類社會發展也可以說是從客觀世界的觀察中總結出資料,處理和使用資料從而轉化為知識,將知識轉化為定理、文化、產品等一切。比如我們的萬年曆、月陰曆、指南針都需要用資料來反覆的驗證。
大資料的定義和本質——消除不確定性
大資料,狹義上是指計算機科學中所有能輸入計算機並被計算機程式處理的符號介質的總稱。廣義上則是以適於更好使用或處理的方式來表示或編碼的資訊或知識,它可以被測量、收集和報告及分析,能夠使用圖形或影象來顯示。
翻譯一下就是能夠被人類解讀的資訊或知識,然而世界又是極其複雜的,第一、相比已知的世界,未知世界是更大的舞臺;第二,人類需要解讀更多的資訊來了解未知的世界,從而獲得更多的真理。這才是大資料定義的內涵。
那麼大資料是如何瞭解未知世界的呢,宇宙萬物、人類內心對未知世界的第一感受是不確定性。比如我們無法知道對方想什麼,無法知道宇宙的下一步如何發展,地球哪裡會出現地震等等。但是我們可以透過資料分析來消除這種不確定性。即我們雖然無法知道對方想什麼,但可以透過收集對方生活工作的資料來預測他的想法,可以透過收集地球地脈每時每刻的資料變化來預測該地區是否會發生地震。因此大資料的本質就是透過收集資料處理資料讓我們更好的瞭解事物發展的客觀規律。
雖然世界充滿了不確定性,這種不確定性來自兩個方面,一是影響世界的變數太多以至於無法用數學模型來描述;二是來自客觀世界本身:不確定性是我們所在宇宙的特性。但是隻要我們不斷髮展大資料那麼在大多數領域我們將消除不確定性從而更好的為我們服務。
智慧革命和大資料的關係
我們先來看下,人類社會飛越發展了幾個階段
第一次工業革命,即以蒸汽機為代表的技術革命,其內涵是顛覆了農業文明,將人類的勞動力從土地中釋放出來。核心是技術帶動了生產力、生產效率的指數飛躍,城市化建設開始成為主流。
第二次工業革命,即以電能為代表的科技革命,其內涵是將技術與科學相互融合,將科學技術定義為第一生產力。核心是商品經濟快速發展,經濟貿易代替戰爭席捲全球,資本主義、殖民經濟開始成為了現代社會的基礎。
資訊革命,即以計算機和半導體為產業是資訊革命,其內涵是縮短了全人類資訊交流的距離,從而促進了社會了發展。核心是資訊科技+產業=新產業。徹底顛覆了我們的社會結構,以網際網路、移動支付、計算機辦公、手機傳輸為例,其本質都是基於資料傳遞的資訊,縮短了地球空間的距離,人類徹底從物質建設轉變成了精神建設階段。
智慧革命,這是未來發展的一種預測或者說,這就是我們如今面對的社會本質。其內涵是徹底釋放我們的精神建設,智慧革命以前我們社會的主要基於經濟發展的理論,即勞動分工——創造商品——商品創造價值——價值與交換價值轉化。這其中的底層邏輯是智慧革命以前我們所有的分工都是基於物質基礎的分工,創造的價值都是基於物質需要的商品為主。智慧革命將帶來的是什麼呢,也許應該是釋放精神建設的分工。
以自媒體為例子,我們看到了任何人都可以基於自身認知來輸出知識獲得財富,每個人都是生產資料和生產工具的獲得者,在機械時代我們因為無法獲得生產資料無法輸出知識使得我們不得不進入公司工廠來獲得財富,但是今天的我們徹底改變了,越來越多的人將不再需要進入工廠、公司進行工作,每個人都可以成為自我價值的實現者。2、自媒體垂直深度的挖掘本質就算精神勞動的分工,經濟學的法則是供求關係平衡,但是自媒體告訴我們精神追求似乎是永遠不可能供過於求的,底層邏輯是人性,任何人都希望獲得喜悅、滿足,看看帥哥美女來刺激我們的本能,又或者希望他人分享悲傷、故事、愛情來撫慰我們內心深處的心靈。
是的心靈,智慧革命在《人類簡史》說得很清楚,就是要控制我們的心靈,並且還是我們自願被控制的心靈,我們不能簡單的說這是好是壞,但我們需要明白這就算趨勢。那麼大資料的作用呢
請看一個簡單的例子,來表示下大資料是怎麼控制我們心靈以至於帶來智慧革命的。
假設你非常喜歡看直播和短影片,每當你點選一次某一種題材的內容時,資料就會記錄下你點選該類產品的點選量,進而推薦給你更多這類題材的內容,接著資料根據這類題材內容分析與它相關的產業,比如看影片需要零食,恰好你還點選了某些食品的影片,那麼你看影片時就會推薦給你這些零食,再然後你又點選了衣服、鞋子等等,如此資料都會給你解決你所需要的任何物質基礎。
在細化你看直播、影片時,每當你反饋彈幕和主播互動時,資料會記錄你反饋彈幕前引起你興奮的內容是什麼,你和主播互動時刺激你互動的點是什麼,然後資料分析後會反饋給一些你喜歡的自媒體人或者該型別的企業,讓他們更多的創造能夠刺激你的同類型內容,然後你會發現幾乎每個你愛的影片都會持續給你帶來刺激點。
大資料和機器智慧
阿爾法圍棋(AlphaGo)是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人,由谷歌(Google)旗下DeepMind公司戴密斯·哈薩比斯領銜的團隊開發。其主要工作原理是“深度學習”。AlphaGo下棋的模型:第一個關鍵技術是把棋盤上當前的狀態變成一個獲勝機率的數學模型,這個模型裡面沒有任何人工的規則,而是完全靠前面所說的資料訓練出來的。第二個關鍵技術是啟發式搜尋演算法——蒙特卡羅樹搜尋演算法,它能將搜尋的空間限制在非常有限的範圍內,保證計算機能夠快速找到好的下法。
由此我們得出,下圍棋看似智慧型別的問題,從本質上講,其實是一個大資料和演算法的問題。大資料與機器智慧是相伴而生。 機器智慧主要是透過深度學習得到,從而將大資料探勘問題轉化為可計算的問題來處理事物。
人工智慧核心是基於計算機和機械,機器不會控制人類,但是製造智慧機器的人可以控制人類。未來的社會,屬於那些具有創意的人,包括計算機科學家,而不屬於掌握某種技能做重複性工作的人。
大資料核心之一就是變智慧問題為資料問題。
什麼是機器智慧,參考圖靈測試可以判斷機械智慧(這裡不做解釋)。機器智慧分為傳統人工智慧(1.0)的方法和現代其他的方法(比如資料驅動、知識發現或者機器學習)。那麼傳統的人工智慧方法是什麼呢?簡單地講,就是首先了解人類是如何產生智慧的,然後讓計算機按照人類的思路去做,這種方法很快就被確定是錯誤的,因為我們需要的不是一個人,而是一個解決問題的機械。從科學的角度上說,機器智慧最重要的是能夠解決人腦所能解決的問題,而不在於是否需要採用和人一樣的方法,因此我們只需要讓機械能夠解決問題就好,而不需要賦予它以智慧。
比如,我們需要某種機械智慧來和我們溝通交流,我們不需要它有智慧,可以用窮舉法來讓機械智慧學習儘可能多的語言對話,或者我們不斷的輸入各種語言交流的資料,從而使得機械智慧能夠理解我們的話語從而對應說出相應的話語。所以未來社會的智慧問題其本質依然可以概括為資料問題,因此我們還需要深入研究下資料的核心。
資料的篩選
大資料既然是智慧革命的基礎,那麼就需要帶入資料。但是這裡面有一個最核心的問題就是怎麼確定輸入的資料是有效的,我們常常說某些人說話不過腦子說話是放屁或者說某些人在做無用功,資料也一樣,輸入資料的是人,是人就會偽造資料用於欺騙,也會創造重複無意義的資料,當然也包括有用的資料。因此如何篩選、挖掘就是人工智慧和大資料發展的核心問題。