回覆列表
-
1 # 程式猿來導事
-
2 # IT人劉俊明
首先,大資料的基礎有三大部分內容,分別是數學、統計學和計算機,所以要想從事大資料領域的研發工作需要一個系統的學習過程。
在大資料的技術體系結構中,程式語言是一個重要的組成部分,目前在大資料領域使用比較普遍的程式語言包括Java、Python、R、Scala等,通常從事不同的崗位需要掌握不同的程式語言(與技術團隊有密切關係),所以學習大資料一定要具備程式語言基礎,但是並不是說一定要具備Java基礎。從事資料分析通常更多的選擇是採用Python語言,無論是透過統計學方式還是機器學習方式,而R語言在資料過濾和推薦系統等大資料應用領域也有廣泛的應用。
雖然學習大資料並不一定要掌握Java語言,但是掌握Java語言對於學習大資料技術還是有積極意義的,一方面原因是Hadoop平臺本身就是採用Java語言開發的,另一方面原因是Java語言具有健全的生態體系,在開發大資料落地應用方面具有一定的優勢,而且Java語言效能穩定且擴充套件性比較強,採用Java語言的開發風險是比較小的。
學習Java語言可以分成三個階段來學習,第一個階段是學習Java的基本語法,重點在於對抽象的理解,包括封裝、繼承、多型等概念;第二個階段是學習Java的分散式開發,重點在於如何透過Java來整合資源,包括資料庫等;第三個階段是學習Java的Web開發,重點在於理解Web開發體系結構以及服務元件的開發。
在學習Hadoop開發的過程中需要掌握Hadoop平臺提供的API,透過大量的實驗逐漸掌握如何透過Java在Hadoop平臺下進行功能開發。
學大資料必須有Java基礎嗎?
學大資料是必須要學習Java的,目前大資料一些主流框架Hadoop、Spark、Flink
、Storm都是需要Java來開發的。
學大資料有哪些注意事項?大資料的開發根據應用方向又可以劃分為不同的方向,每一個方向也包含很多模組知識需要學習。學習者需要根據自己的工作方向選擇不同路線來逐步深入學習:
1.大資料之Linux
2.大資料之視覺化
3.大資料之人工智慧
4.大資料之雲計算