首頁>Club>
還是選擇java更合適大資料?
4
回覆列表
  • 1 # Bean蠶豆

    如果是大資料方向,python明顯是比java更有優勢,所以個人建議是從python入手。為什麼這麼說呢,我認為受以下幾個因素的影響。

    大資料從目前來看,資料分析、資料探勘、機器學習、人工智慧等都歸屬於大資料的範疇,其實是大資料技術與資料科學的混合體

    大資料目前來看是大資料技術與資料科學的混合體,大資料技術偏重工程實話,對計算機程式設計要求較高;資料科學偏重數學抽象,對數學與統計要求較高。大資料技術透過程式語言去解決業務問題,可以理解成我們生活中的碼農,而資料科學則更多的是利用統計工具或者指令碼語言對資料的處理分析,透過使用到的是Matlab、R、SAS、SPSS等工具。

    python與java語言的本身的定位有關係

    java是一種面向物件程式語言,不僅吸引了c++語言的優點,還摒棄了難以理解的多繼承、指標等概念。java具有功能強大、易於理解的特點。java主要用於商業邏輯強的領域,如商城、erp、oa、金融等領域。

    python是一種面向物件的解釋型語言,python是純粹的自由軟體,原始碼與直譯器cpython遵循GPL協議。python主要用於資料分析、科學計算、金融分析、資料探勘、人工智慧等領域,具體快速開發特性的應用場景。

    總的來說,想學習大資料對於Pythong來說更適合一些,Python在資料科學方面的應用會更有優勢較java語言,當然如果偏向於應用的開發方面-比如資料產品類的,則java會更有優勢。
  • 2 # X工程師

    為什麼很多零基礎、轉行的,上來就想轉大資料、區塊鏈,殊不知就是計算機從業者也不敢輕易說去學這些啊。

    大概都是被培訓機構灌輸的?

  • 3 # IT人劉俊明

    大資料作為第三次資訊化浪潮的代表技術之一在未來的發展一定會有廣闊的空間,所以大資料方向現在是一個比較熱門的選擇,也是一個比較好的選擇。

    大資料涉及的內容是以資料為中心進行拓展,涵蓋資料的採集、整理、傳輸、儲存、安全、分析和呈現,這是基本的研究流程,當然還要跟不同行業的結合,透過機器學習等方法來發現資料背後所隱藏的聯絡,而這正是大資料的價值所在。

    由於大資料以資料為中心,所以涉及的內容不僅僅是計算機領域,還涉及數學、統計等專業的內容,所以不少數學專業和統計專業的朋友也在做大資料方面的工作。多領域、多專業融合是大資料的特點,這些不同角色的大資料人所使用的工具也不盡相同。

    計算機專業的大資料人以平臺為基礎,在平臺上研發各種行業的大資料應用,這部分人需要掌握程式語言,比如以Hadoop平臺為例可以選擇使用Java、Python,如果使用Spark平臺,可以選擇使用Scala、Python。這幾種語言本身是可以做落地應用的語言,不僅可以做演算法實現,還可以提供完整的處理流程支援,目前大資料領域Python比較受開發人員歡迎。

    Python語言本身比較簡單適合零基礎學習,但是做大資料卻是需要一定基礎的,比如需要熟練使用Linux平臺,需要資料庫基礎知識,需要數學基礎知識等,程式語言只是其中的一項。

    Java語言是目前比較流行的開發語言,使用人群也非常龐大。使用Java做大資料也是一個常規方案,我早期就是使用Java做Hadoop平臺下的開發。

    如果是數學專業、統計專業則更多關注於演算法、分析領域,比如各種演算法的設計、實現和應用,比如統計專業經常使用R語言,R語言做大資料分析還是非常方便的。成熟的大資料團隊都會配備演算法工程師,而BI團隊則更多出自於統計領域。

    總的來說,做大資料方向從零基礎開始學習需要一個系統的過程,也需要時間的保障,從Python開始學習是可以的,但是建議初學者最好能找專業人士制定一個適合自己的學習計劃,如果有人指導一下則更是事半功倍。

  • 4 # 碼農視界

    可以的,只不過路漫漫其修遠兮,想要成為大資料工程師,目測眼觀:三年五載後,必是一位奇才。

    要成為大資料技術人才 你需要經歷的九九八十一難!

    首先數學知識是必備技能之一,其次是英語,再就是程式語言,你以為你掌握一門程式語言就可以了嗎?不!你太天真了,想要從事大資料技術,一門熟練的程式語言只是基礎,你至少還要了解其他兩種程式語言。

    額,好像有點跑題了,迴歸正主!!!

    java主要針對的是Hadoop技術的程式設計開發語言,而Python和Scala主要是spark技術的程式設計開發語言,兩個語言的側重點不一樣,也要看自己興趣和以後的發展方向。

  • 5 # 機器學習之路

    建議你學Python吧,不過說句實在話,大資料真不好學,我現在也在正在學,想想就有點扯淡,公司沒人懂這個,又沒人教我,還讓做這個,為了公司以後發展,要我開發一套流程,做的是kaggle上面的一個比賽,訓練集有10萬,測試大概有20萬,如果你做大資料,很有必要去了解kaggle的這個比賽平臺,如果在比賽中取得了好成績絕對能為你找工作帶來不少的好處,畢竟上面都是大牛,想拿個好成績非常不容易。做大資料其實就是資料分析加資料探勘,所以對統計學以及機率論可以要求要高點,給你推薦幾本書,Python資料分析與挖掘,還有Python資料分析,還有機器學習實戰,好好加油。

  • 中秋節和大豐收的關聯?
  • 有感情讀書的句子?