首頁>科技>

同世界先進水平相比,中國的大資料在網際網路核心技術上與發達國家還有很大差距,甚至嚴重受制於人。我們的如何推動大資料技術產業創新發展,構築網路強國呢?

讓醫療資料流動起來,實現更多醫院醫療資料共享,利用資料分析,在使用者中挖掘潛在“民心”,共享的大資料產業鏈價值鏈和生態系統正在我們身邊逐步構築。大資料應用,未來會走向何方?我們面臨怎樣的挑戰?

本文根據中國經濟大講堂《不容錯過的大資料時代》,由加米穀進行整理成文,僅供學習參考。

大資料據技術與應用(1):大資料的價值和意義:https://www.toutiao.com/i6774292166886818308/

大資料技術與應用(2):大資料時代,傳統企業該如何轉型:https://www.toutiao.com/i6774308902889587211/

大資料技術與應用(3):大資料助力社會治理和我們的日常生活:https://www.toutiao.com/i6774656681008693771/

五、大資料未來的應用方向和我們面臨的挑戰

我們看看現狀,實際上我們現在大資料應用大體上是分成3個層次:

第一個就是描述性分析

描述性分析什麼呢,指關注現在發生了什麼事情,然後把這個事物的發展歷程給你視覺化的展現出來,通過圖視覺化的方式展現出來,把當前的資料分析以後,把它的態勢給你展現出來,讓你能夠把握這個事物發展的一個基本態勢,這就是描述性分析。

第二種,我們稱之為預測性分析

就是要在描述基礎上,你把現在的狀況搞清楚後,它可能怎麼走,再進一步可能發現的事物的趨勢是什麼。比如說谷歌的流感預測,它就預測可能在什麼地方發生。比如說奧斯卡獲獎的預測,那它就可能要發生,就這就是預測性分析。

但也有人問我說股票能不能夠預測,理論上是可以的,但你預測了別對外說,你來看這個結果,肯定是可以的,但如果以你對外一說,那就肯定又不靈了,它和其它的都不一樣啊,對外一說,別人都真的到那兒去。就像有時候我們交通智慧交通一樣的,一說什麼地方不堵,所有人都往那兒去了,馬上就把這邊堵了。它這種預測一定是一個客觀的事實的資料的收集才能做到。

第三種分析是什麼呢,叫做指導性分析

就是說關注選擇做什麼,要呈現不同的決策後果,就是我根據現在的態勢,也能預測到未來的變化,那麼預測到未來的變化後,我現在做什麼對未來有什麼影響,要反過來影響我想未來。如果說打仗,用大資料指揮打仗也是一樣的,如果我做這個決策,會演變成什麼結果?

這就叫指導性分析,這個是最高階的一種方式。要知道我們現在該怎麼做。

實際上當前大資料應用來講,總體的結論我認為還是一個初級階段,還遠遠的不夠。從應用層次上講,就是描述性預測性的東西多,指導性應用少;從資料來源的角度,從單一的資料來源來進行分析的多,從多元資料的應用上,基於已經存在的資料,就是你現在有什麼資料,我就玩什麼資料,從資料裡面找東西多,但是我主動去搜集資料的應用也相對偏少。

提問:在網際網路或者是大資料的創新這個領域,尤其是在比如一些數字的經濟的這些共享,還有一些基礎設施的建設,包括我們大資料的一些創新,還處於一些劣勢。我想聽梅院士給我們介紹一下最主要的我們還處於哪方面的劣勢?

答:最大的一個差距就還是我們的後發所帶來的問題,我們相對是跟著別人走,在資訊科技起步的時候中國並沒有參與。所以說我們叫做核心技術、基礎技術缺失。這是我們最大的問題。

我們經常講我們國家的資訊產業叫做缺芯少魂,沒有晶片,CPU不是我們的,作業系統我們不能夠控制,這叫缺芯少魂。那我們現在很多企業做得也不錯了,但是我們叫做什麼呢,低端化、空心化。空心化就講了我們應用都做得不錯,我們很多企業都在做應用,但是我們的高階的裝置做不出來。

這種情況是一個長期的一個過程,但是現在可以看到我們這個東西正在逐步逐步的逼近,我們很多能力已經具備了,現在比如說像BAT,在應用規模上毫無疑問都是世界級的大公司,他們也產生了很多世界級的應用,在國際上是沒有的,他們搭建的平臺的處理能力也是世界級的,他們的資料中心也是世界級的,但是模式創新上有沒有新的東西。

過去我們經常談,我們在網際網路的模式上借鑑偏多,創新還是不多,但是現在我們開始有了,也有很多網際網路的創業,比如說像微信之類的應用,那就是很典型的一種創新,即時通訊在這個領域,它基本上把中國的市場給佔住了。那麼當然還有其他的網際網路公司做的,我相信都是都是很不錯的。

第二個趨勢是什麼呢,就是我們的很多環境還沒建立起來。剛才你談到的資料的共享還不夠,那麼國家層面,法律法規層面對資料共享的支撐也還不夠。

所以共享了這一輪,從國家層面主要在推的是政務資料的共享和開放,如果大家看15年8月份到9月5日正式釋出的那個,叫做《促進大資料行動綱要》三項任務,第一項任務就是政務資料的共享開放,而且有明確的時間表,國家明年完成共享,今年是把所有的目錄完成,

明年完成共享。2020年向社會開放,國家的網站都雲出來了,政務資料的都拿出來之後,這些部門之間的共享就對我們每一個老百姓都能帶來好處,讓我們少跑腿,政務資料的共享出來,就會讓我們每一個創業的公司能有更多的資料來源去做你的運用創新,大體上可能是這樣。

我說共享開放也不夠。我覺得第三個不夠缺陷是什麼,就是我們中國發展到的現狀,按中央的說法是我們現在已經走入一個新時代,要走向一個全面強起來的一個征程,自信心夠不夠?

我們還得有一個自信,我們有龐大的人才資源,我們能不能夠建立自己的自信心,我們別在技術上去一味的模仿,跟蹤別人走過的東西,靠我們的人口紅利來形成一個市場規模,靠我們的人口規模來形成競爭優勢。我想這個可能不是,我們更多的模式上的創新也是需要的,

在網際網路時代,可能很多東西只有想不到,沒有做不到。今天我們的自信心,我們不管在技術上長期的堅守,長期的根源,我相信到本世紀中葉,中國的科技強國夢,全面強國夢還是會實現的。

大資料是我們這個時代產生了一個新的現象,而這個現象將長期伴隨我們存在下去。為什麼,我們可以看到人類製造並採集資料的速度,它總是領先於你的處理技術的,所以說我們不斷地面臨規模超過現有的工具能夠獲取處理的能力的這麼一個數據集,就是說你的計算能力是永遠跟不上了。也就是說,大資料現象會長期伴隨我們存在下去。

未來我們每一個人都生活在資料的包圍中,你給大家分享兩個小故事,就是我們計算機界的兩個著名人物。現在回過來看,說明那時的眼光都那麼的不對。

沃森,那個沃森系統就以他命名的,他是IBM的前任主席,也是創始人之一。1941年的時候,他做了一個說法,大概全世界5臺計算機就夠了。夠嗎,當時IBM是全世界賣計算機最牛的。

比爾·蓋茨,今年還當選我們中國工程院的外籍院士,這個網上也炒了很久。1981年他說過,640K的記憶體對所有人應用都夠了,現在夠嗎,我們每一個手機是多少,至少是64吧,64個GB,它是640個KB,什麼概念,所以說是長期存在。

有一個報道,去年美國一個數據管理軟體供應商,叫做資料冰山報告,他說當前全球企業儲存的資料中52%的資料產生後,就存在著從來沒用過,我不知道在座的企業有沒有遇到。實際上,我們每一個人都是這樣的,你去到一個旅遊景點,咔咔咔照相完以後,回家後你們看過嗎,整理過嗎,幾乎沒有吧,照的時候特別積極。

然後還有一個說法,估計一個組織中80%的資料只使用了一次,首次使用以後從此再也不用了,這就是所謂的暗資料現象,就是說大資料長期伴隨我們存在,我們根本沒有能力處理那麼多資料,所以對我們搞計算機的而言,這就是我們的目標,能不能做得到,估計很難,資料量永遠是超出這個(處理)能力的。當然我們在這個環節中間怎麼樣生存好(是個挑戰)。

最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 是什麼寶藏APP,才能登上蘋果2019本土優秀APP榜單?