-
1 # 擺動小火車
-
2 # 網際網路上的追跡者
大資料體系,毫無疑問是java scala的語言體系,雖然大部分開源軟體提供Python藉口,但是他們的實現語言都是java或者scala。從這點上說,java scala語音是學習首選,大資料書的話 推薦權威指南系列,無論是hadoop權威指南hbase權威指南入門,其次大資料相關元件,都要學習瞭解一下,我個人比較推薦看軟體官方網站,前提你英語過關,耐得住性子。
-
3 # 濟南碼農蛐蛐
如果是大資料平臺的搭建和任務編寫,還是要java scala。如果呼叫大資料平臺進行資料處理,可以用python。
-
4 # 鯤鵬科技
大資料首選Python語言,Python語言語法簡單,非常容易上手,雖然執行速度不如C語言,但是C語言100行程式碼完成的功能Python往往只需要10行,非常適合資料分析,有非常多的庫檔案,在大資料時代發展極快!
-
5 # 金牌KK
學大資料個人覺得最好的語言是scala,因為大資料主流spark原始碼是使用scala編寫的, 所以熟悉scala語言,才能更好地看懂原始碼。書籍一般推薦入門級的:saprk快速大資料分析、快學scala、scala程式設計
-
6 # 歌頌
C語言屬於高階語言中比較底層語言,大資料行業從業者專業除了理工科之外,還有大量財經、統計、社科類專業呢,無論是專業背景還是學習成本不不可能讓這些群體用C啊。
再者R和Python這種高階語言本就針對資料處理設計的,有豐富的資料處理工具和模組,學習成本低,程式碼書寫效率高,執行效率什麼的,這應該是後期部署的時候,工程師們負責最佳化的工作。
總之,大資料處理使用Python是比較合適的。
-
7 # 百利天下理工職業規劃
首先了解下大資料分析流程,大資料分析流程總共有6個步驟,分別是:1.業務理解;2. 資料採集;3. 資料儲存;4. 資料預處理;5. 資料分析;6.資料視覺化。可根據各個流程使用的工具來了解自己要學的工具;
資料採集裡邊我們介紹了網路資料採集法、系統日誌採集法,網路資料採集法的網路爬蟲工具,系統日誌採集法分為離線和實時採集,離線採集使用的工具是Hadoop,實時採集使用的工具是flume+kafka。資料儲存裡邊我們介紹了儲存業務資料的資料庫MySQL和HBASE、儲存日誌資料的HDFS。資料分析主要是利用分析方法、分析工具以及各種模型和演算法對採集來的以及預處理過的資料進行分析。資料分析的工具:MapReduce和Spark。資料視覺化的工具:PowerBI。
對於以上的大資料分析流程都要求我們具備一定的程式設計基礎,當下比較火的,用的比較多的是python程式語言,python比較快捷且容易上手和理解,因而它比較偏上層,而Java、C、C++等都比較偏底層;如果做偏業務類的資料分析python就夠了,但是如果想走資料科技這條線,底層語言的JAVA、C是需要掌握的。
-
8 # 豆約翰羽佳
大資料技術體系是java和scala
書籍的話,要根據自身情況決定
學習大資料技術前提需要
必須會java技術
必須會linux技術
必須會一些虛擬化技術
必須會資料庫相關知技術
最好會一些web程式設計
最好會python
如果上面技術都還可以
書籍的話就是那些經典的
權威系列,如:
《Hadoop權威指南》
《快學Scala》
等等
如果上述那些必會技術有問題
先了解一下那些必會技術
再談大資料的學習
回覆列表
大資料首選Python語言,Python語言語法簡單,非常容易上手,雖然執行速度不如C語言,但是C語言100行程式碼完成的功能Python往往只需要10行,非常適合資料分析,有非常多的庫檔案,在大資料時代發展極快!