回覆列表
  • 1 # IT人劉俊明

    目前比較常見的大資料平臺有Hadoop和Spark,流行的商用大資料平臺也大多是基於Hadoop和Spark構建的,只不過商用大資料平臺在部署方便性和穩定性等方面有所提高。

    Hadoop平臺是基於Java語言開發的,所以不少大資料程式設計師在Hadoop平臺的第一個實驗往往都是使用Java完成的。Hadoop平臺除了可以使用Java語言外,還支援Python語言,由於Python語言本身比較簡潔且調整起來比較方便,所以目前得到了廣大程式設計師的喜愛。

    Spark平臺的開發是基於Scala語言的,所以在Spark平臺下的研發比較傾向於使用Scala語言,Scala語言兼顧了Java的效能和Ruby的樂趣,所以很多程式設計師比較喜歡Scala的編寫風格。Spark平臺下除了可以使用Scala外,還可以使用Java或Python語言,個人比較推薦在Spark平臺下使用Scala語言。

    所以,做大資料平臺的研發工作,Java、Python、Scala都是比較常見的工具語言,作為研發人員最好都接觸一下,以便於在特定的場景使用對應的開發語言。建議從Python開始學起,然後再學習Java和Scala,Python比較容易上手,Scala是Java語言發展而來的,所以按照這個順序學習會比較輕鬆一些。

    如果你有關於Java、Python、大資料方面的問題,也可以諮詢我。

  • 2 # 普釘

    大資料,我也是剛接觸,說一點自己的體會。

    首先,大資料就業可以分為,從程式語言相關的角度看,資料分析師,和資料工程人員需要使用程式語言,Python,Java,Scala等。

    從目前企業應用來看,資料分析人員主要使用Python,做資料分析,資料視覺化,等。

    而資料工程人員,主要是資料的儲存,轉換,主要使用Java。

  • 中秋節和大豐收的關聯?
  • 在綜藝節目《歌手》中有哪些讓你驚豔的歌手?