回覆列表
-
1 # 不務正業的研究僧
-
2 # 加米穀大資料
二、大資料的工作方向,主要分為:
1. 大資料工程師
2. 資料分析師
3. 大資料科學家
4. 其他(資料探勘等)
1、Java
2、Linux命令
3、HDFS
4、MapReduce
5、 Hadoop
6、Hive
7、ZooKeeper
8、HBase
9、Redis
10、Flume
11、SSM
12、Kafka
13、Scala
14、Spark
15、MongoDB
16、Python與資料分析
-
3 # 覓夏885
hadoop可以處理離線資料,spark可以處理離線或者實時資料,然而,現在機器學習,人工智慧很火,人工智慧的浪潮正在席捲全球,諸多詞彙時刻縈繞在我們耳邊:人工智慧(Artificial Intelligence)、機器學習(Machine Learning)、深度學習(Deep Learning)。不少人對這些高頻詞彙的含義及其背後的關係總是似懂非懂、一知半解。所以,今後的學習方向應該以這些為主。為華人工智慧而努力。
-
4 # 羊羽說
spark,下一代hadoop。spark的生態比hadoop更全面,更有優勢,推薦關注學習。
光Hadoop那一套就夠喝一壺的。搞好這個已經很不容易。如果還要進階,分兩個方向發展,一個是繼續走Hadoop類的資料基礎設施達人之路,spark、kafka、storm、分散式rdbs等一系列架構。第二是走機器學習類的資料應用牛人之路,經典的學習演算法、CNN、rnn那一套,tf、caffe2之類的框架,Python、r資料分析利器都需要了解使用。
這兩個是所有擁有大量資料的企業必須面對的問題。所以走那一條都會有錢途。但個人覺得,第二條顯然要更好玩更有趣。TB、pb級的資料日常接觸不到也沒有實用可能,但機器學習演算法就不同了。腦洞大開可以玩到很多有意思的東西哦!