大資料是我的主要研究方向之一,同時也在帶大資料方向的研究生,所以我來回答一下這個問題。
大資料技術經過多年的發展已經趨於成熟,目前已經形成了一個初步的產業鏈,包括資料的採集、整理、儲存、安全、分析、呈現和應用,這條產業鏈分佈了多個崗位,同時也涉及到物聯網、雲計算等相關內容。
從技術的角度出發,當前大資料技術崗位分為大資料平臺研發、大資料應用開發、大資料分析、大資料運維等崗位,所以學習大資料技術可以按照這些崗位來制定學習計劃。
對於基礎比較薄弱的人來說,可以重點考慮大資料應用開發和大資料分析崗位,這兩個崗位的人才需求量也比較大。大資料應用開發崗位可以按照以下幾個步驟學習:
第一:計算機基礎。學習大資料需要具備一定的作業系統知識和資料庫知識,其中重點在於Linux作業系統,因為學習大資料需要搭建大資料實驗平臺。另外,資料庫基礎對於學習大資料知識也是比較重要的。
第二:程式語言。大資料開發比較常見的程式語言包括Java、Scala和Python,在Hadoop平臺下比較常見的選擇是Java語言,而在Spark平臺下可以選擇Scala語言,Python在資料分析領域的應用比較普遍。
第三:大資料平臺知識。目前比較常見的大資料平臺包括Hadoop和Spark,不少商業大資料平臺也是基於這兩個平臺搭建的,而且這兩個平臺的生態也比較健全。
在掌握以上知識之後就可以透過大量的實驗來提升大資料開發能力,如果能參加一個專案組進行實習是一個不錯的選擇,因為大資料相關知識比較多,所以邊用邊學是個不錯的選擇。
大資料是我的主要研究方向之一,同時也在帶大資料方向的研究生,所以我來回答一下這個問題。
大資料技術經過多年的發展已經趨於成熟,目前已經形成了一個初步的產業鏈,包括資料的採集、整理、儲存、安全、分析、呈現和應用,這條產業鏈分佈了多個崗位,同時也涉及到物聯網、雲計算等相關內容。
從技術的角度出發,當前大資料技術崗位分為大資料平臺研發、大資料應用開發、大資料分析、大資料運維等崗位,所以學習大資料技術可以按照這些崗位來制定學習計劃。
對於基礎比較薄弱的人來說,可以重點考慮大資料應用開發和大資料分析崗位,這兩個崗位的人才需求量也比較大。大資料應用開發崗位可以按照以下幾個步驟學習:
第一:計算機基礎。學習大資料需要具備一定的作業系統知識和資料庫知識,其中重點在於Linux作業系統,因為學習大資料需要搭建大資料實驗平臺。另外,資料庫基礎對於學習大資料知識也是比較重要的。
第二:程式語言。大資料開發比較常見的程式語言包括Java、Scala和Python,在Hadoop平臺下比較常見的選擇是Java語言,而在Spark平臺下可以選擇Scala語言,Python在資料分析領域的應用比較普遍。
第三:大資料平臺知識。目前比較常見的大資料平臺包括Hadoop和Spark,不少商業大資料平臺也是基於這兩個平臺搭建的,而且這兩個平臺的生態也比較健全。
在掌握以上知識之後就可以透過大量的實驗來提升大資料開發能力,如果能參加一個專案組進行實習是一個不錯的選擇,因為大資料相關知識比較多,所以邊用邊學是個不錯的選擇。