回覆列表
  • 1 # 不務正業的研究僧

    光Hadoop那一套就夠喝一壺的。搞好這個已經很不容易。如果還要進階,分兩個方向發展,一個是繼續走Hadoop類的資料基礎設施達人之路,spark、kafka、storm、分散式rdbs等一系列架構。第二是走機器學習類的資料應用牛人之路,經典的學習演算法、CNN、rnn那一套,tf、caffe2之類的框架,Python、r資料分析利器都需要了解使用。

    這兩個是所有擁有大量資料的企業必須面對的問題。所以走那一條都會有錢途。但個人覺得,第二條顯然要更好玩更有趣。TB、pb級的資料日常接觸不到也沒有實用可能,但機器學習演算法就不同了。腦洞大開可以玩到很多有意思的東西哦!

  • 2 # 加米穀大資料

    二、大資料的工作方向,主要分為:

    1. 大資料工程師

    2. 資料分析師

    3. 大資料科學家

    4. 其他(資料探勘等)

    1、Java

    2、Linux命令

    3、HDFS

    4、MapReduce

    5、 Hadoop

    6、Hive

    7、ZooKeeper

    8、HBase

    9、Redis

    10、Flume

    11、SSM

    12、Kafka

    13、Scala

    14、Spark

    15、MongoDB

    16、Python與資料分析

  • 3 # 覓夏885

    hadoop可以處理離線資料,spark可以處理離線或者實時資料,然而,現在機器學習,人工智慧很火,人工智慧的浪潮正在席捲全球,諸多詞彙時刻縈繞在我們耳邊:人工智慧(Artificial Intelligence)、機器學習(Machine Learning)、深度學習(Deep Learning)。不少人對這些高頻詞彙的含義及其背後的關係總是似懂非懂、一知半解。所以,今後的學習方向應該以這些為主。為華人工智慧而努力。

  • 4 # 羊羽說

    spark,下一代hadoop。spark的生態比hadoop更全面,更有優勢,推薦關注學習。

  • 中秋節和大豐收的關聯?
  • 怎樣證明有女生暗戀你?