-
1 # IT人劉俊明
-
2 # 千鋒頭號粉絲
隨著大資料技術的呼聲只增不減,越來越多的人開始了對大資料技術的學習,在這裡對參加大資料學習的同學提出幾點建議!
1、應屆生學習大資料
個人覺得應屆生應該打好基礎,大學本科一般都會開設資料結構,演算法基礎,作業系統,編譯原理,計算機網路等課程。這些課程一定要好好學,基礎紮實了學其他東西問題都不大,而且好多大公司面試都會問這些東西。如果你準備從事IT行業,這些東西對你會很有幫助。
至於學什麼語言,我覺得對大資料行業來說,Java還是比較多。有時間有興趣的話可以學學scala,這個語言寫spark比較棒。
叢集環境一定要搭起來。有條件的話可以搭一個小的分散式叢集,沒條件的可以在自己電腦上裝個虛擬機器然後搭一個偽分散式的叢集。一來能幫助你充分認識Hadoop,而來可以在上面做點實際的東西。你所有踩得坑都是你寶貴的財富。
然後就可以試著寫一些資料計算中常見的去重,排序,表關聯等操作。
對於很多面試官來說,面試應屆生就問你的基礎,筆試大多是資料結構和演算法方面的,如果你基礎不錯而且有一定的大資料方面的經驗,基本上都會過。
2、對有一定程式設計工作經驗想轉行的,來學習大資料技術
主要考察三個方面,一是基礎,二是學習能力,三是解決問題的能力。
基礎很好考察,給幾道筆試題做完基本上就知道什麼水平了。
學習能力還是非常重要的,畢竟寫Javaweb和寫mapreduce還是不一樣的。大資料處理技術目前都有好多種,而且企業用的時候也不單單使用一種,再一個行業發展比較快,要時刻學習新的東西並用到實踐中。
解決問題的能力在什麼時候都比較重要,資料開發中尤為重要,我們同常會遇到很多資料問題,比如說最後產生的報表資料對不上,一般來說一份最終的資料往往來源於很多原始資料,中間又經過了n多處理。要求你對資料敏感,並能把握問題的本質,追根溯源,在儘可能短的時間裡解決問題。
基礎知識好加強,換工作前兩週複習一下就行。學習能力和解決問題的能力就要在平時的工作中多鍛鍊。
對大資料技術基礎知識不紮實的同學,建議還是先掌握基礎技術,外加一些簡單的專案進行練習。
回覆列表
大資料相關技術的學習需要一個系統的過程,另外還需要配合相關的專案,所以大資料的學習並不簡單。大資料學習的內容分成三個大的部分,分別是計算機、數學和統計學,所以大資料的學習要以這些內容為主並輔助經濟學、社會學、醫學等學科。
大資料的學習要有一個完善的學習計劃,可以按照以下步驟進行:
第一,演算法基礎學習。學習大資料要打好基礎,這些基礎以數學、統計學為主。
第二,搭建大資料平臺。搭建大資料平臺是進行功能實現和資料分析的基礎,這個過程需要了解Linux作業系統,並且在Linux作業系統上搭建Hadoop平臺、Spark平臺。目前的大資料平臺包括商用大資料平臺大多都以Hadoop和Spark為基礎,所以掌握這兩個常見大資料平臺的搭建是學習大資料的重要基礎。
第四,在大資料平臺上進行資料分析實驗。資料分析是大資料開發的重點,資料價值化主要是透過挖掘和分析實現的。大資料分析以場景大資料分析為主,這個過程就需要演算法設計和演算法實現了。目前在演算法實現的過程中,使用Python語言比較多,由於Python的庫非常方便,所以Python廣受程式設計師的歡迎。
如果有大資料方面的問題,或者是考研方面的問題,都可以諮詢我。