回覆列表
-
1 # 西街三水哥
-
2 # IT極客老兵
如果你從事大資料研發類工作,你需要學習一門開發語言,JAVA或者Python,用於開發大資料相關的資料儲存、抽取、計算分析等任務。
如果你從事大資料運維類工作,你需要了解Hadoop、Hbase、MongDB、Spark等大資料產品。
最重要的是,你要了解運用大資料技術的相關行業,沒有業務知識,大資料技術也只是技術,並不能產生更多的價值。
以下回答屬於個人理解,不喜勿噴!
首先、想學習大資料,就需要知道什麼才是大資料!要學習哪些東西?
涉及大資料的東西其實太多了。
比如伺服器負載均衡搭建,是不是資料大資料呢?資料庫分庫分表,主從資料庫是不是資料大資料呢?
這個要從大資料的起源來說,大資料起源是google公司寫的三篇論文開始說。
google公司是世界上軟體技術最強之一,人家公司自己有自己的大資料平臺,釋出了三篇論文,分別是Google-File-System和Google-Bigtable以及Google-MapReduce。這三篇論文釋出之後,才有的大資料的概念。
大資料中的File-System現在學習的叫hdfs。(Hadoop Distributed File System)
Hadoop分散式檔案系統,利用linux,來做的分散式檔案系統。
MapReduce是一種程式設計模型。
Bigtable就是超大資料庫儲存了。