回覆列表
-
1 # IT人劉俊明
-
2 # IT人劉俊明
作為一名IT行業的從業者,同時也是一名計算機專業的研究生導師,我來回答一下這個問題。
首先,選擇大資料方向是沒有問題的,但是學習大資料是具有一定難度的。
當前正處在大資料時代,大資料未來將得到廣泛的落地應用,所以從未來發展的前景來看,大資料方向是不錯的選擇。學習大資料需要具備三方面的基礎知識,分別是數學、統計學和計算機,另外還包括一眾輔助學科,比如社會學、經濟學等等。所以大資料涉及到的內容還是比較多的,而且也具有一定的難度。
對於計算機專業的學生來說,學習大資料方向通常需要學習以下幾個方面的內容:
第一:程式語言。大資料領域的程式語言比較常見的有Java、Python、Scala、R等,其中Python和R語言在資料分析領域應用比較多,Java語言在大資料應用開發和大資料平臺開發領域應用比較多,Scala則主要應用於Spark平臺。
第二:大資料平臺。目前比較常見的大資料平臺是Hadoop和Spark,不少商用大資料平臺通常也是基於Hadoop構建的,而且Hadoop平臺對於計算機硬體的要求比較低,比較適合初學者和大學生群體。另外,大資料平臺的元件比較多,需要一個系統的學習過程才能逐漸掌握。
第三:大資料分析。資料分析是大資料專業要重點學習的內容,目前大資料分析有兩種主要方式,一種是統計學分析方式,另一種是機器學習分析方式。以機器學習方式為例,首先需要掌握一些常見的演算法,包括決策樹、樸素貝葉斯、支援向量機等等,然後透過程式語言完成演算法的實現,進而對演算法進行訓練和驗證,整個過程還是具有一定難度的。當前,場景分析是大資料比較常見的落地應用。
作為一名IT行業的從業者,同時也是一名計算機專業的研究生導師,我來回答一下這個問題。
首先,選擇大資料方向是沒有問題的,但是學習大資料是具有一定難度的。
當前正處在大資料時代,大資料未來將得到廣泛的落地應用,所以從未來發展的前景來看,大資料方向是不錯的選擇。學習大資料需要具備三方面的基礎知識,分別是數學、統計學和計算機,另外還包括一眾輔助學科,比如社會學、經濟學等等。所以大資料涉及到的內容還是比較多的,而且也具有一定的難度。
對於計算機專業的學生來說,學習大資料方向通常需要學習以下幾個方面的內容:
第一:程式語言。大資料領域的程式語言比較常見的有Java、Python、Scala、R等,其中Python和R語言在資料分析領域應用比較多,Java語言在大資料應用開發和大資料平臺開發領域應用比較多,Scala則主要應用於Spark平臺。
第二:大資料平臺。目前比較常見的大資料平臺是Hadoop和Spark,不少商用大資料平臺通常也是基於Hadoop構建的,而且Hadoop平臺對於計算機硬體的要求比較低,比較適合初學者和大學生群體。另外,大資料平臺的元件比較多,需要一個系統的學習過程才能逐漸掌握。
第三:大資料分析。資料分析是大資料專業要重點學習的內容,目前大資料分析有兩種主要方式,一種是統計學分析方式,另一種是機器學習分析方式。以機器學習方式為例,首先需要掌握一些常見的演算法,包括決策樹、樸素貝葉斯、支援向量機等等,然後透過程式語言完成演算法的實現,進而對演算法進行訓練和驗證,整個過程還是具有一定難度的。當前,場景分析是大資料比較常見的落地應用。