回覆列表
-
1 # 小熊社長
-
2 # 天道酬勤知行合一
我的建議是這樣的:
你有一定的開發基礎,應該會節省很多學習時間,更容易理解。因為大資料環境比較複雜,並不像學習程式設計軟體一樣,機器安裝一下,跟老師敲幾行程式碼就可以了,但大資料可就要麻煩多了,至少要準備好虛擬化的叢集環境,然後又要安裝部署各種計算框架,所以需要有耐心,有一定解決問題的能力,堅持不懈,才有可能學好大資料。我推薦的學習步驟是:打好基礎,理解為主。多動手實踐,一定自己搭建出程式設計環境。後面再不斷的學習spark、python、storm、雲計算等相關課程,慢慢自己的頭腦中會形成一套知識體系,對大資料的理解也會越來越透徹!
總結: 學習方法很重要,需要堅持,自己要有一定解決問題的能力,前途無量!
-
3 # 加米穀大資料
提高班 :
第一階段:大資料基礎·
第二階段:Hadoop生態體系·
第三階段:Spark生態系統·
第四階段:專案實戰
-
4 # 風中一葉飄
大資料技術學習網路有很多講的非常好的影片,spark是一個不錯的選擇,它有大資料技術應具備的完整的生態圈,並且spark也是企業用的最多的技術。
首先的話,你要學習大資料和資料探勘,那麼肯定的你要知道行業的相關的一些知識和崗位應用,這樣的話你才能有針對性的、有目的性的去學習。
一、大資料的職業規劃方向
學習目的在於工作上的運用,以下為大資料方向的三個崗位,附上薪資待遇。
1. 大資料售前工程師、大資料運維工程師(HCNA)
2. 大資料開發工程師、大資料平臺開發工程師(HCNP)
3. 大資料科學家、大資料架構師、大資料高階分析師(HCIE)
4. 其他(資料探勘工程師、倉庫採集開發工程師)
二、大資料開發工程師需要的技能點:
必須技能10條:
01.Linux 基本操作
02.python&爬蟲介紹
03.hadoop分散式集中
04.離線資料處理
05.實時資料處理
06.ETL與環境相關
07.大資料應用與資料探勘
08.java高階(虛擬機器、併發)
09..HBase(JavaAPI操作+Phoenix )
10. Kafka
11. Spark (Core+sparksql+Spark streaming )
12.CDH叢集
三、如何系統的學習
不管學習什麼知識,學習無外乎資料,主要有影片、電子書、面試資料、專案原始碼。
這裡重點推薦《深入理解Java虛擬機器》、《Java高併發實戰》必看書籍。
接著開始學hadoop,hbase,hive,scala,spark,python、kafka這些點,啃到hive的時候,人就有點暈了,按理說程式語言有相通性的,我買了相關書籍《HBase權威指南》《Hive開發指南》《快學Scala》《Spark 快速大資料分析》。