回覆列表
  • 1 # 渺茫之舟科技

    1. 大資料工程師

    《Hadoop權威指南

    《Hive程式設計指南》

    《Hbase權威指南》

    《大資料技術全解》

    《大資料挑戰NoSql》

    《Mahout實戰》

    2. 資料分析師:

    《機率論與數理統計》、《統計學》推薦David Freedman版、《業務建模與資料探勘》、《資料探勘導論》、《SAS程式設計與資料探勘商業案例》、《Clementine資料探勘方法及應用》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等。

    還有很多呢!

  • 2 # 程式設計師的自白

    只需要《Hadoop之路》和《spark大資料分析》,其他知識進了企業在工作中積累,大資料是原理很簡單,最重要的是經驗積累

  • 3 # 科技要述

    事實上大資料技術體系龐大,包括的知識較多,從最基礎的程式設計基礎到資料處理分析及各種工具的運用,整個學習的內容還是很多的,從易到難可以分為4個階段:

    第1階段:大資料基礎語言的學習

    Java是大資料學習需要的程式語言基礎,因為大資料的開發基於常用的高階語言。而且不論是學習hadoop,還是資料探勘,都需要有程式語言作為基礎。因此,如果想學習大資料開發,掌握Java基礎是必不可少的。

    經典圖書推薦:Java 高效程式設計(Effective Java)

    第二階段:大資料核心知識學習

    如果把大資料比作容器,那麼這個容器的容量無限大,什麼都能往裡裝,大資料離不開物聯網,移動網際網路,大資料還和人工智慧、雲計算和機器學習有著千絲萬縷的關係,大資料海量資料儲存要高擴充套件就離不開雲計算,大資料計算分析採用傳統的機器學習、資料探勘技術會比較慢,需要做平行計算和分散式計算擴充套件。

    Hadoop生態系統;HDFS技術;HBASE技術;Sqoop使用流程;資料倉庫工具HIVE;大資料離線分析Spark、Python語言;資料實時分析Storm;訊息訂閱分發系統Kafka等。

    經典圖書推薦:

    《Hadoop權威指南》《Hive程式設計指南》《Spark 快速大資料分析》《Spark機器學習:核心技術與實踐》

    第三階段:專案實踐

    大資料學習除了各種工具和語言要掌握,還要有良好的數學功底。數學知識是資料分析師的基礎知識。對於資料分析師,瞭解一些描述統計相關的內容,需要有一定公式計算能力,瞭解常用統計模型演算法。而對於資料探勘工程師來說,各類演算法也需要熟練使用,對數學的要求是最高的。

    經典圖書推薦:

    《機率論與數理統計》、《統計學》推薦David Freedman版、《業務建模與資料探勘》、《資料探勘導論》、《SAS程式設計與資料探勘商業案例》、《Clementine資料探勘方法及應用 》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等。

    第四階段:大資料分析 —人工智慧(AI)

    大資料學習最終的目的是應用,大資料技術可以應用在各個領域,比如公安大資料、交通大資料、醫療大資料、就業大資料、環境大資料、影象大資料、影片大資料等等,應用範圍非常廣泛, 大資料分析技術離不開人工智慧。

    經典圖書推薦:

    《機器學習》《模式分類》《統計學習方法》《資料探勘實用機器學習技術》《人工智慧及其應用》、《機率圖模型》

    當然,“紙上得來終覺淺,絕知此事要躬行”,大資料學習重要的是練習、練習、再練習,將學到的知識與實際應用場景相結合。事實上,對於零基礎的朋友來說,光是看這些書籍是遠遠不夠的,個人建議還是找一家培訓機構,邊學邊看邊練,然後找一些好的大資料分析公司參加一些實習,跟大牛學習,從專案中鍛鍊。

  • 中秋節和大豐收的關聯?
  • 腰椎間盤突出症患者怎樣睡才好?