大資料是我的主要研究方向之一,同時也在帶大資料方向的研究生,所以我來回答一下這個問題。
首先,大資料分析技術是可以從零基礎開始學起的,但是需要一個系統的學習過程。
大資料分析的學習過程可以按照以下幾個步驟進行規劃:
第一:數學及統計學基礎。大資料分析目前有兩種主要的分析手段,一種是採用機器學習方式,另一種是採用統計學方式,不論採用那種方式都需要掌握數學知識和一定的統計學知識。雖然數學和統計學具有一定的難度,但是可以從基礎部分開始學起,然後根據實驗要求再逐步深入。
第二:程式語言。大資料領域比較常見的程式語言包括Java、Python、Scala、R等,其中Python語言在資料分析領域的應用比較多,而且Python語言簡單易學、功能強大,所以從Python開始學起也是個不錯的選擇。Python語言的學習可以分成三個階段,第一個階段是學習基本的Python語法,第二個階段可以學習各種庫(Numpy、Scipy、Matplotlib等)的使用,第三個階段進行場景分析。
第三:大資料平臺。目前比較常見的大資料平臺是Hadoop、Spark,基於Hadoop的大資料應用生態已經趨於成熟,不少商用大資料平臺也是基於Hadoop構建的,所以從Hadoop平臺開始學起是不錯的選擇。
第四:參加實踐。大資料分析涉及到的環節比較多,除了分析環節,還涉及到資料的採集、整理、儲存和呈現,如果單純的透過自學的方式來學習大資料將是一個比較漫長的過程,所以透過實踐來學習大資料是比較不錯的選擇。
最後,從事大資料分析崗位還需要具備一定的行業知識,未來行業知識將是大資料分析師的核心競爭力之一。
大資料是我的主要研究方向之一,同時也在帶大資料方向的研究生,所以我來回答一下這個問題。
首先,大資料分析技術是可以從零基礎開始學起的,但是需要一個系統的學習過程。
大資料分析的學習過程可以按照以下幾個步驟進行規劃:
第一:數學及統計學基礎。大資料分析目前有兩種主要的分析手段,一種是採用機器學習方式,另一種是採用統計學方式,不論採用那種方式都需要掌握數學知識和一定的統計學知識。雖然數學和統計學具有一定的難度,但是可以從基礎部分開始學起,然後根據實驗要求再逐步深入。
第二:程式語言。大資料領域比較常見的程式語言包括Java、Python、Scala、R等,其中Python語言在資料分析領域的應用比較多,而且Python語言簡單易學、功能強大,所以從Python開始學起也是個不錯的選擇。Python語言的學習可以分成三個階段,第一個階段是學習基本的Python語法,第二個階段可以學習各種庫(Numpy、Scipy、Matplotlib等)的使用,第三個階段進行場景分析。
第三:大資料平臺。目前比較常見的大資料平臺是Hadoop、Spark,基於Hadoop的大資料應用生態已經趨於成熟,不少商用大資料平臺也是基於Hadoop構建的,所以從Hadoop平臺開始學起是不錯的選擇。
第四:參加實踐。大資料分析涉及到的環節比較多,除了分析環節,還涉及到資料的採集、整理、儲存和呈現,如果單純的透過自學的方式來學習大資料將是一個比較漫長的過程,所以透過實踐來學習大資料是比較不錯的選擇。
最後,從事大資料分析崗位還需要具備一定的行業知識,未來行業知識將是大資料分析師的核心競爭力之一。