回覆列表
-
1 # IT人劉俊明
-
2 # xDawn97嗷
首先你可以學一門Python,入門快捷,相對容易,不需要太多掌握太多的底層細節,這樣就有了一個實驗工具。
然後,就該學學理論了。建議選購《高等數學》,和高中無縫銜接,並且掌握一些基礎的數學工具。
然後,逐步深入,學習《機率論與統計》,《線性代數》。面對海量的資料,統計學的辦法是必要的。建立涉及多維度資料的數學模型,矩陣工具也很重要。
以上基本是所有理科的基礎,必須掌握,其中,統計學方面的理論對資料科學而言尤其重要。迴歸,因果,相關性分析都是必要的能力。
接下來可以選擇性學習《複變函式》,《圖論》,《運籌學》,《泛函分析》,《近世代數》,《微分方程》,《資訊理論》,《訊號與系統》,《張量分析》
這會給理解和構造更復雜抽象的模型提供幫助。
當然,以上都是數學基礎。
應用的話,可以學習目前流行的理論,比如神經網路演算法,聚類演算法,社群發現演算法等
對於神經網路演算法,看過一本《Neural Network and Learning Machines》好像還不錯
你還需要掌握一些時興的軟體框架,比如Tensorflow,Pytorch等
此外,還需要掌握一些資料處理工具
比如Hadoop,Hive,Spark之類的工具
以及一些常用資料庫
比如Mysql,Oracle,MongoDB什麼的
資料的話,並不稀缺,滿世界都是。網上有非常多的影片,慕課,和很多專業人員的部落格。歸根到底還是要花功夫學習掌握。
有更多精力的話,可以試著學習一門更底層的程式語言,比如Java或者C++
或者在資料視覺化方向上下點功夫,瞭解一下怎麼整理和呈現資料
最後,英語要好。
應該就差不多了吧。。。
隨著大資料的發展,資料分析作為資料價值化的重要方式之一必然會得到大面積的普及,未來資料分析不僅僅是專業人士的工作,大部分職場人都應該具備一定的資料分析能力,所以作為文科生來說,掌握一定的資料分析技術也是有必要的。
目前資料分析有兩種型別,一種是應用級資料分析,以應用工具為主,另一種是研發級資料分析,以統計學和機器學習的分析方式為主。相對於研發級分析來說,應用級資料分析並不複雜,即使數學基礎比較薄弱的人也能夠掌握。
對於文科生來說,可以按照以下的學習步驟學習資料分析:
第一:從Excel工具開始。Excel能夠滿足大部分職場人的資料分析要求,通常在10萬條以內的資料,採用Excel進行分析是沒有壓力的,而且可以執行維度較高的資料分析任務。在使用Excel的過程中也會逐漸積累一些統計學的分析方法,逐漸提升資料分析的能力。
第二:學習資料庫知識。隨著資料量的增長,當Excel不能滿足需求的時候就需要掌握一定的資料庫知識了,學習資料庫可以從關係型資料庫開始。學習關係型資料庫並不複雜,重點在於Sql語言的掌握。掌握Sql語言之後就可以執行更加靈活的資料分析任務了,而且可以結合BI工具進行專業的場景資料分析。
第三:學習程式設計。要想進一步提升資料分析能力就需要掌握程式語言了,目前Python語言在資料分析領域有廣泛的應用,Python語言語法簡單且功能強大,即使沒有任何程式語言基礎的人也能夠學得會且用得好。
未來,大資料作為產業網際網路的核心技術之一,必然會廣泛的落地到廣大的傳統行業,而資料分析將是一個重要的崗位,所以學習資料分析技術能夠明顯提升自身的職場競爭力,未來的發展空間也比較廣闊。