回覆列表
  • 1 # IT人劉俊明

    目前Java和Python是做大資料平臺開發最常見的兩種程式語言,當然還有Scala和R,下面我簡單的分析一下Java與Python在做大資料開發時的優缺點,具體選擇哪個可以根據實際情況來判斷。

    首先說一下Java語言,Java語言應用廣泛,可以應用的領域也非常多,有完整的生態體系,另外Java語言的效能也非常不錯。Java與大資料的關係非常密切,一方面目前做大資料開發的程式設計師很多都是從Java程式設計師轉過去的,另一方面Hadoop平臺本身就是基於Java開發的,所以目前Java在大資料開發中的使用還是非常普遍的。

    但是Java語言自身的複雜性讓很多程式設計師感覺它有點“重”,格式化的東西有點多,所以在Spark平臺下,很多程式設計師更願意使用Scala語言,而Scala就是基於Java語言構建的,所以有Java基礎再學習Scala還是比較輕鬆的。

    再說一下Python語言,Python語言目前在大資料和人工智慧領域有廣泛的應用,原因就是Python語言簡單、直接、方便。Python語言是指令碼式語言,所以學習起來比較簡單,指令碼語言的天然屬性就是直接,所以Python在語法結構上比Java要“輕”很多。另外,由於Python有豐富的庫支援,所以Python做軟體開發也非常“直接”,程式設計師的作用有點像做“整合”的感覺。目前Python在Hadoop和Spark平臺下的使用都非常普遍,而且越來越多的Java程式設計師轉向使用Python,因為沒人願意複雜。

    但是Python缺點也比較明顯,那就是Python的效能遠不及Java,另外與大資料平臺的耦合度也不如Java好。但是如果你使用Python做演算法實現、資料分析、資料呈現等應用是完全沒有問題的,效率也比較高。

    總之,如果做大資料開發,Java和Python最好都學習一下,語言本身就是工具,學習起來並不是十分困難。

    如果有大資料方面的問題,也可以諮詢我。

  • 中秋節和大豐收的關聯?
  • 家用生態魚缸需要種植水草嗎?