實際上現在很多大資料領域的老師都在帶領團隊從事“小資料”的研究,這也是高校老師尋求創新突破的一個重要方向,而隨著大資料在行業領域的落地應用,資料問題進一步突出,如何能夠利用相對有限的資料來完成預測和決策,更具有現實價值。
在大資料發展的初期,大家幾乎都在追求“大資料”,似乎大資料能夠解決一切問題,而早期由於網際網路領域積累了大量的資料,在這種背景下,大資料確實解決了很多問題,很多高校老師也積極推動了大資料的產業應用,這個期間不論是對於企業,還是對於老師和學生來說,都是黃金期。
對於企業來說,透過引入大資料技術,構建資料中臺,基於資料和大算力來訓練各種模型,以此來推動業務創新,這確實帶來了顯著的效果,這個過程中,很多老師也披掛上陣,走進了網際網路大廠。
對於學生來說,在這個大資料的黃金時期,創新點可以說是“無處不在”,在相關性理論的推動下,只要結果夠好,完全可以不解釋很多模型上的問題,或者說這根本無法解釋,所以很多同學都以調參俠來調侃自己。
但是隨著資料中臺推動業務上升的能力在減弱,大資料本身的“大耗能”,也受到了很多詬病,這也導致不少老師重新迴歸科研,重新思考大資料下一個階段的創新出口。如果僅僅靠大資料和大算力來推動創新,這無疑是一條不歸路,很多大廠正是基於算力和資料的優勢,把眾多小團隊推進了牆角。
總體上來說,現在很多科研工作者開始重視小資料的價值,這是對於前期過於關注大資料的一個修正,在特定領域,尤其是工業場景下,大資料未必有實際意義,高價值的小資料樣本往往價值更高,模型也更透明,更容易理解。
實際上現在很多大資料領域的老師都在帶領團隊從事“小資料”的研究,這也是高校老師尋求創新突破的一個重要方向,而隨著大資料在行業領域的落地應用,資料問題進一步突出,如何能夠利用相對有限的資料來完成預測和決策,更具有現實價值。
在大資料發展的初期,大家幾乎都在追求“大資料”,似乎大資料能夠解決一切問題,而早期由於網際網路領域積累了大量的資料,在這種背景下,大資料確實解決了很多問題,很多高校老師也積極推動了大資料的產業應用,這個期間不論是對於企業,還是對於老師和學生來說,都是黃金期。
對於企業來說,透過引入大資料技術,構建資料中臺,基於資料和大算力來訓練各種模型,以此來推動業務創新,這確實帶來了顯著的效果,這個過程中,很多老師也披掛上陣,走進了網際網路大廠。
對於學生來說,在這個大資料的黃金時期,創新點可以說是“無處不在”,在相關性理論的推動下,只要結果夠好,完全可以不解釋很多模型上的問題,或者說這根本無法解釋,所以很多同學都以調參俠來調侃自己。
但是隨著資料中臺推動業務上升的能力在減弱,大資料本身的“大耗能”,也受到了很多詬病,這也導致不少老師重新迴歸科研,重新思考大資料下一個階段的創新出口。如果僅僅靠大資料和大算力來推動創新,這無疑是一條不歸路,很多大廠正是基於算力和資料的優勢,把眾多小團隊推進了牆角。
總體上來說,現在很多科研工作者開始重視小資料的價值,這是對於前期過於關注大資料的一個修正,在特定領域,尤其是工業場景下,大資料未必有實際意義,高價值的小資料樣本往往價值更高,模型也更透明,更容易理解。