-
1 # 程式設計師小寧
-
2 # 傳智播客
是的,要從這些語言開始學習。
java:寫分散式的實現,如mr,graph,spark(scala),其中scale是大資料的基礎,只有這樣才能看懂資料處理。
python:寫udf,資料處理,單機版,gpu版,指令碼。python程式碼很好上手學習,而且有很多資料庫可以直接拿來用。
但你要知道他們兩個分別可以做什麼,在資料探勘領域的話,python對java有很大的優勢。除了語言靈活簡單之外,資料探勘相關的庫豐富強大也是一個非常重要的原因。而且現在很多資料探勘資料的工具,都會提供python的介面。
除了資料探勘這分析之外,比如爬蟲,後臺等,還有很多強大的輪子可以用。
上面說明了,這兩種語言基本是幹什麼的。如果想做大資料分析,首先要學習語言。如果大家有想學習這兩種語言的。給大家發兩張學習線路圖。
1.java
2.python的學習線路圖
有以上兩張線路圖,可以參考上面的階段去逐步學習,避免找不到學習重點,自己在網上看就學亂了。
-
3 # IT人劉俊明
大資料是我的主要研究方向之一,所以我來回答一下這個問題。
做資料分析也有很多不同的崗位,雖然都是資料分析但是分析的過程和使用的工具也有很大的區別。比如應用級資料分析員往往透過各種工具軟體來完成資料的分析和整理,傳統做BI的工程師大多需要掌握資料庫知識和業務知識,對程式語言幾乎沒有任何要求。其實,未來企業使用的更多的資料分析人員是這種應用級資料分析員,簡單的說就是做場景資料分析。
另外一種資料分析就是研發級資料分析,這部分資料分析任務往往要結合機器學習等技術來實現,需要掌握各種常見的資料分析演算法,以及使用程式語言來實現這些演算法,然後由實現工程師完成應用實現。
資料分析的過程涉及到資料採集、整理(清洗、脫敏、歸併等過程)、演算法設計、演算法訓練、演算法應用等步驟,演算法實現則需要使用程式語言來實現,而目前使用較多的語言是Python。我在早期做大資料的時候使用的就是Java,後來改用Python,我比較推薦使用Python來做大資料分析,使用Python確實比較方便。
所以,做大資料分析,如果做研發級資料分析當然需要學習程式語言,但是並不是所有的資料分析師都需要程式設計。
如果有大資料方面的問題,也可以諮詢我。
-
4 # 加米穀大資料
大資料培訓學習主要分為:大資料開發、資料分析與挖掘。
一般說的大資料培訓是指大資料開發,需要學習Java;
資料分析與挖掘學習Python;
二者的入門學習確實要從這些語言開始,如果你選擇其中一個學習,選擇相應的程式語言開始學習即可。
0基礎 · 第一階段 Java開發·
第二階段 大資料基礎·
第三階段 Hadoop生態體系·
第四階段 Spark生態系統·
第五階段 專案實戰
提高班 · 第一階段:大資料基礎·
第二階段:Hadoop生態體系·
第三階段:Spark生態系統·
第四階段:專案實戰
第一階段:python基礎·
第二階段:資料庫·
第三階段:高階應用·
第四階段:分析與挖掘·
第五階段:專案實戰
-
5 # 夢無痕84574230
感謝邀請,大資料分析不一定從語言學起,是應該從分析方法學起,JAVA和python是目前大資料應用對接比較廣泛的語言,但是也有其他語言比如scala,R語言等。最好的學習方法是邊學邊動手進行實驗,選好一個語言可以語言學習和方法學習同時進行
回覆列表
①大資料分析常用的開發開發框架haoop,spark等都是由Java系語言編寫的,所以Java系語言(如scale語言)是學習大資料的基礎,只有這樣你才能看懂資料處理邏輯,有時還需要看原始碼來處理問題。
②Python語言程式碼簡潔,有豐富的科學資料處理庫,善於處理多維陣列運算,矩陣運算等複雜資料計算,是大資料分析和機器學習的首選語言。