-
1 # 東風高揚
-
2 # 若只是初見good
其實很多人提到了傳統挖掘工具在沒落的事,其實應該算是的吧,畢竟目前網際網路產生資料的速度確實有點快。當然,所謂大資料很多時候確實也有點難虛,但不管怎麼樣,資料的思維是在不斷地強化的,從過去拍腦袋決定,過渡到逐漸以資料為依據理性的做決策,是有這個趨勢的。所以,熟悉資料的處理流程,以資料的思維去思考問題,總是比較正確的方向的。再次強調一個事就是,其實在目前這種情況下,任何語言、框架什麼的都是比較次要的,重要的是解決問題的模式,其次是快速學習的能力,因為這個領域變化太快,需求有足夠的能力補充:大資料領域很多細分的崗位:大資料分析師、資料開發工程師、資料探勘工程師、甚至是爬蟲工程師。分別解決資料統計分析報表類問題、平臺運維資料開發問題、資料深度挖掘類問題、資料來源獲取問題等,其實還有,就不細說了。資料分析類的偏SQL,當然也會經常用到一些指令碼語言進行資料的加工啊,等等,其中當然也包括python,這裡用java的少。資料開發工程師,基本屬於硬開發類了,由於大資料框架大多java,所以這也是java這在這裡流行的原因。資料探勘,傳統類的資料探勘,python是大愛,但是在分散式模式下,其實python的侷限性還是蠻大的,一些分散式機器學習庫,例如spark mllib啊之類的,之類用python其實就是乏力了。最後爬蟲這塊,可能很多人不認可他是屬於大資料的,但是可以查一下目前其實爬蟲與資料領域結合是越來越緊密了,最起碼我司爬蟲是屬於資料團隊的,而爬蟲基本也屬於python的天下了,當然java爬蟲也是有滴。最後,不管怎麼說,大資料領域語言只是其中一環,還有很多東西,而且對於任何老司機來說,語言更是次要的如果是資料開發,java。如果是資料探勘類的,可以從python入手。
-
3 # 尋貓網路
計算機行業算是專業性比較強的行業,基礎扎不紮實直接影響你未來的發展,不要考慮哪個更好,沒有更好,大資料也可以依靠java來實現,基礎最重要
-
4 # 華信智原天津IT達人
先把Java學好,打好基礎,如果對大資料感興趣,可以再培訓學習。華信智原大資料應用研究院(天津研發中心) 專注大學生,致力於Java大資料,Java軟體開發,Web前端開發,UI設計,大資料精準營銷,跨境電商等專案實戰。官方服務電話: 022-87081819,022-58151212
回覆列表
首先,Java和大資料其實並不相悖。首先Java是一門程式語言,而大資料涉及可以說是一個門類。如果是一個Java零基礎的想轉入軟體行業,就看你今後的發展方向。如果你是想作為一個程式設計師的話,建議先選擇Java學習,然後進入程式設計師的行列,解決吃飯問題。當然,如果有一定的基礎知識,還是可以轉入到大資料的分析,建模等。如果是做大資料開發的軟體工程師,那還是你建議先學習Java。
來看看,學習Java的路線圖。Java的基礎知識,比如面向物件的知識,基礎語法等這些事必不可少的,網上一查一大堆。然後就是一節一節的升級,比如一些核心的類庫等等。Java主要是用於Web開發,那麼後臺、伺服器、客戶端相關的知識得學習,與資料庫的互動等等,該學習的框架也是必不可少,比如Servlet,Spring等等,以及JSP,JSTL(StandardTagLibraries)或者第三方TagLibraries,熟悉主流的網頁框架,例如JSF,Struts,Tapestry,Cocoon,WebWork,以及他們下面的涉及模式,如MVC等。學習如何使用及管理Web伺服器,例如tomcat,resin,Jrun,並且知道如何在其基礎上擴充套件和維護Web程式,學習分散式物件以及遠端API,例如RMI和RMI/IIOP等等。當然還有很多東西也是需要去學習的。雖然看起來這麼多,但一旦入門以後,接觸多了就會越來越快了。
而如果要做大資料分析師,要學習的知識也是不少的。①:統計學知識。包括均值、中位數、標準差、方差、機率、假設檢驗等等具有時間、空間、資料本身。要能夠建立演算法模型,要不然你分析出來的結果離實際相差十萬八千里的話,估計要不了幾天,你就會被捲鋪蓋走人了。當然,做個一般的大資料分析師,就不會涉及到很深的高等數學知識了,但要做一個牛B的大資料分析師,還是要學習學習再學習。②:分析工具,比如Excel。當然不需要掌握的高大全,也得要掌握常用的函式,比如重點包括但不限於sum,count,sumif,countif,find,if,left/right,時間轉換,透視表,各種圖表做法等之類的。如果資料量不算是特別大的話,Excel能夠解決很多問題。比如,篩選部分贓資料,排序,挑選滿足條件的資料等等。③:資料庫知識。大資料大資料,就是資料量很多,Excel就解決不了這麼大資料量的時候,就得使用資料庫。如果是關係型資料庫,比如Oracle、mysql、sqlserver等等,你還得要學習使用SQL語句,篩選排序,彙總等等。非關係型資料庫也得要學習,比如:Cassandra、Mongodb、CouchDB、Redis、 Riak、Membase、Neo4j 和 HBase等等,起碼常用的瞭解一兩個,比如Hbase,Mongodb,redis等。
如果是作為開發工程師的話,憑藉懂Java還是很容易進入大資料行業的。只是還是作為程式設計師的身份實現大資料的分析等。不過一般的公司不太容易做,因為資料的來源,廣度深度都不夠,分析結果不具有什麼意義,如果購買的話也是不容易的,當然還是有一些渠道能得到的。
任何一門技術都是要經過時間去沉澱的,選擇好剩下的就是努力。