回覆列表
-
1 # 碼農視界
-
2 # IT人劉俊明
目前很多大資料的課程都涵蓋了Java、Python、R或者Scala,有的側重Java多一些,有的側重Python多一些,也有的側重Scala和R,這主要還是看具體的使用環節。
通常情況下從Hadoop開始學起的話,一般都是使用Java語言做第一個排序實驗,一個原因是早期做大資料的程式設計師大部分都是Java程式設計師,另外一個原因是Hadoop平臺本身就是Java構建的。我早期使用Hadoop的時候使用的就是Java語言,後來改用了Python,Python相對於Java來說程式碼量要少很多,同時調整起來也比較容易。從大資料整體的應用生態來說,學習Java Web是必要的,因為大資料的應用也要落地,而目前的落地專案大部分都是基於Java Web或者Python。
目前很多大資料應用都開始使用Spark多一些,與Hadoop比較起來Spark更加強大,同時也更快。在Spark下使用Scala語言是一個不錯的選擇,Scala在型別安全、併發以及生態方面比較成熟,如果有Java基礎,那麼學習Scala還是一個比較有趣的過程。
從培養程式設計師的角度來說,學習大資料時如果選擇Java語言,那麼未來的就業空間會好一些,有了Java的基礎再學習Python或者Scala會非常容易。所以,我認為培訓機構選擇使用Java語言做大資料開發主要還是從就業的角度考慮的。
都是坑啊,老弟OR老妹。真正大資料技術是不可能用java來搪塞的!java確實是大資料開發需要的程式語言,但絕對不會是佔絕大比重的,佔絕大比重的不就成了java課程了,還說什麼大資料!
此外,還有的一些大資料課程偏HTML5,有的偏視覺化(視覺化並不真正大資料技術,只是一個小分支),還有的偏測試,專業搞大資料的一看就知道是坑,專門坑小白的,所以遇見這樣的還是快閃為妙,不然出來找工作還是隻能找java的,花了比java課程多的錢,出來還是java工程師,想想多虧啊!
真正的大資料技術是包括Hadoop、spark、storm、分散式計算框架、資料分析等等
想學習真正大資料的小夥伴,一定要睜大眼睛哈!