題主學歷是夠了,資料工程師這個方向也很好,未來也是主流。我就結合我自身的學習經驗提幾點吧,按需採納。
工作時的程式都是在linux環境跑的,所以基本運維要熟悉,推薦使用centos7,熟練使用vi編輯器。熟練shell指令碼。
不得不說,這個技術真是太尼瑪方便了,讓伺服器運維變得那麼和諧。先掌握單機docker,然後可以用用docker swarm,如果k8s會的話,就更牛逼了。
java的簡單demo可以做做,安裝環境要熟悉,hadoop的安裝離不開java。python的一句名言,“人生苦短,我用python”,在我做了幾年java後,突然接觸python,體會的更深。python也是大資料分析的主流語言哦,比如深度學習,神經網路TensorFlow,就是用python的哦,學完python,做做影象識別會有很大成就感。
老牌大資料,相關資料也比較多,掌握hdfs,hive,hbase。
大資料網紅,spark streaming,spark sql,如果瞭解了storm流式計算更好。
做牛逼的資料分析師,演算法是核心,而演算法的核心就是數學,有木有無招勝有招,大道至簡的感覺。當然大部分人不用寫啥演算法,模型大牛們都寫好了,更多的是組裝調參。
題主學歷是夠了,資料工程師這個方向也很好,未來也是主流。我就結合我自身的學習經驗提幾點吧,按需採納。
1.linux環境工作時的程式都是在linux環境跑的,所以基本運維要熟悉,推薦使用centos7,熟練使用vi編輯器。熟練shell指令碼。
2.docker容器技術不得不說,這個技術真是太尼瑪方便了,讓伺服器運維變得那麼和諧。先掌握單機docker,然後可以用用docker swarm,如果k8s會的話,就更牛逼了。
3.java,python高階語言java的簡單demo可以做做,安裝環境要熟悉,hadoop的安裝離不開java。python的一句名言,“人生苦短,我用python”,在我做了幾年java後,突然接觸python,體會的更深。python也是大資料分析的主流語言哦,比如深度學習,神經網路TensorFlow,就是用python的哦,學完python,做做影象識別會有很大成就感。
4.hadoop生態老牌大資料,相關資料也比較多,掌握hdfs,hive,hbase。
5.spark生態大資料網紅,spark streaming,spark sql,如果瞭解了storm流式計算更好。
6.數學做牛逼的資料分析師,演算法是核心,而演算法的核心就是數學,有木有無招勝有招,大道至簡的感覺。當然大部分人不用寫啥演算法,模型大牛們都寫好了,更多的是組裝調參。