回覆列表
  • 1 # 西線學院

      熱誠推薦看過的幾本經典。

      一、資料分析入門:

      《Head First Data Analysis》

      電子工業出版社的經典書目系列,從資料分析基本步驟開始、實驗方法、最最佳化方法、假設檢驗方法、貝葉斯統計方法、主觀機率法、啟發法、直方圖法、迴歸法、誤差處理、相關資料庫、資料整理技巧一一講到。圖比較多,適合入門。

      《Head First Statistics》

      推薦理由同上,適合入門者的經典教材。

      《R in Action-Data Analysis and Graphics with R》

      R是屬於GNU系統的一個自由、免費、原始碼開放的軟體,用於統計計算和統計製圖。這本書從實用的統計研究角度逐例分析R在資料處理、模型構建、以及圖形操作上的由淺入深的結合,堪稱經典。

      《資料之魅-基於開源工具的資料分析》

      作者是華盛頓大學理論物理學博士。這本書是資料分析的經典之一,包含大量的R語言模擬過程及結果展示,例舉了很多資料分析例項和程式碼。

      《資料探勘-市場營銷、銷售與客戶關係管理領域應用》

      作者是Data Miners的創辦人,有二十多年的營銷和客戶關係管理結合資料探勘的經驗。詳細介紹了作為一個數據挖掘團隊需要的知識體系,包括資料庫、SAS使用、統計學、機器學習、資料視覺化、如何訪問使用者收集需求、如何寫論文與溝通等等。有條件的建議看英文原版。

      《Data Analytics for Beginners: Basic Guide to Master Data Analytics》

      入門五星推薦。裡面很多圖表例項,手把手教你如何EXCEL畫圖,對各種知識點(平均值,模式,中值,方差,標準偏差)的講解相當的到位,比起大學裡的各種課本靠譜。

      先把這些花時間啃啃,資料分析的理論部分就基本入門了,根據實際情況還需要結合你的業務需求來進行系統的學習。

      二、資料分析進階:

      《Doing Data Scienc》

      作者Cathy O’Neil是哈佛大學的博士,MIT的資料博士後,曾今作為一名Quant在對沖基金D.E. Shaw 工作,目前是一家紐約初創公司的Data scientist 。這本書需要有一定的程式設計和理論基礎,作為入門教材來說有點難,雖然只有400來頁,但是涉及的知識點很全面。每一章節的核心內容都附有程式設計案例,R/Python/Shell三種語言任君挑選。

      《Python for Data Analysis》

      Python資料分析必看,適合入行不久的資料分析師。作者有多年的Python資料分析工作經驗,對各種Pyhon包iPython,NumPy,pandas,matpotlib等有著很深的理解。看完這本,敲完程式碼,Python資料分析就算入行了。

      《Data Science for Business》

      很多牛人為之作序,資料科學如何與商業結合,相信這本書會給你一些啟發。

      《Python Data Science Handbook》

      2016年6月出版的,500頁保質保量,作者(Jake VanderPlas)是華盛頓大學電子科學研究所的高階資料科學研究員,研究領域包括天文統計學、機器學習和可擴充套件計算。書的前半部分介紹了用於資料分析和一般的科學計算的基本Python庫,後面從實際應用的角度使用Python庫scikit-learn開始機器學習實踐。適合有一定Python基礎人(或者R基礎),並且想學習如何使用Python進行資料分析的人。

      《Storytelling with Data》

      作者Cole NussbaumerKnaflic,私募分析師,前Google人力分析團隊總監。本書展示瞭如何高效率展示量化資訊,如何用豐富的資料講故事。Google內部的資料視覺化課程講師,之前也在Maryland Institute College of Art兼職講師。如果你想知道如何以圖敘事,這邊好書不容錯過。

  • 2 # 路人甲

    如果不喜歡看影片學習,看書籍也是一個很好的選擇。畢竟紙質感的書籍允許我們在上面寫寫畫畫,做讀書筆記和歸納總結。

    但是做讀書筆記的時候要注意,不要在第一遍的時候歸納知識點,因為第一遍的時候什麼都不會就很容易變成抄書了。

    迴歸正題,推薦幾本經典的資料分析書籍,這幾本書都不會很深奧,但對學習資料分析一定有幫助。

    1.《深入淺出資料分析》

    這本書非常淺顯易懂,以類似“章回小說”的活潑形式向讀者展現優秀的資料分析人員應知應會的技術:資料分析基本步驟、實驗方法、最最佳化方法、假設檢驗方法、貝葉斯統計方法、主觀機率法、啟發法、直方圖法、迴歸法、誤差處理、相關資料庫、資料整理技巧;

    其中統計知識如果不會可以跳過,這個需要有部分統計學基礎,建議從頭開始系統性的學習。

    2.《利用Python進行資料分析》

    大家都知道Python的應用領域非常廣泛,不僅可以爬蟲,在資料視覺化、以及資料分析還有人工智慧庫領域應用也比較多。像我就是用Python做的資料分析,這本書裡面有大量具體的實踐建議,以及大量綜合應用方法,可以說是Python領域中技術計算的權威指南。

    看這本書籍需要掌握Python的基礎知識,建議還要學習一些Python爬蟲。

    3.《精益資料分析》

    這本書更側重於商業的資料分析和資料模型,他展示瞭如何用資料分析驗證自己的設想、找到真正的客戶、打造能賺錢的產品,以及提升企業知名度。裡面有30多個案例分析,說白了就是如何實現用資料驅動增長。

    這本書學習的不是知識和技術,我們需要從中學習的是他們資料分析的思維模式以及其中的商業模型。更簡易偏向金融類資料分析領域的資料分析人員學習。

  • 3 # 千鋒頭號粉絲

    大資料學習路線及各階段學習書籍推薦!廢話不多說,直接切入主題,有需要的小夥伴可以參考學習!

    階段一、大資料基礎——java語言基礎方面

    (1)Java語言基礎

    Java開發介紹、熟悉Eclipse開發工具、Java語言基礎、Java流程控制、Java字串、Java陣列與類和物件、數字處理類與核心技術、I/O與反射、多執行緒、Swing程式與集合類

    (2) HTML、CSS與JavaScript

    PC端網站佈局、HTML5+CSS3基礎、WebApp頁面佈局、原生JavaScript互動功能開發、Ajax非同步互動、jQuery應用

    (3)JavaWeb和資料庫

    資料庫、JavaWeb開發核心、JavaWeb開發內幕

    推薦書籍:

    《Effective Java中文版》(第2版)

    本書為我們帶來了共78條程式設計師必備的經驗法則,針對你每天都會遇到的程式設計問題提出了有效、實用的解決方案。

    書中的每一章都包含幾個“條目”,以簡潔的形式呈現,自成獨立的短文,它們提出了具體的建議,對於Java平臺精妙之處的獨到見解,以及優秀的程式碼範例。每個條目的綜合描述和解釋都闡明瞭應該怎麼做,不應該怎麼做,以及為什麼。

    階段二、 Linux&Hadoop生態體系

    Linux體系、Hadoop離線計算大綱、分散式資料庫Hbase、資料倉庫Hive、資料遷移工具Sqoop、Flume分散式日誌框架

    推薦書籍:

    1、《Big Data》

    在大資料的背景下,我很少看到關於資料建模,資料層,資料處理需求分析以及資料架構和儲存實現問題。這本書卻提供了令人耳目一新的全面解決方案。

    2、《Hadoop權威指南》

    《Hadoop權威指南(中文版)》從Hadoop的緣起開始,由淺入深,結合理論和實踐,全方位地介紹Hadoop這一高效能處理海量資料集的理想工具。

    3、《Hive程式設計指南》

    《Hive程式設計指南》是一本Apache Hive的程式設計指南,旨在介紹如何使用Hive的SQL方法HiveQL來彙總、查詢和分析儲存在Hadoop分散式檔案系統上的大資料集合。

    階段三、 分散式計算。

    (1)分散式計算框架

    Python程式語言、Scala程式語言、Spark大資料處理、Spark—Streaming大資料處理、Spark—Mlib機器學習、Spark—GraphX 圖計算、實戰一:基於Spark的推薦系統(某一線公司真實專案)、實戰二:新浪網(www.sina.com.cn)

    (2)storm技術架構體系

    Storm原理與基礎、訊息佇列kafka、Redis工具、zookeeper詳解、實戰一:日誌告警系統專案、實戰二:猜你喜歡推薦系統實戰

    推薦書籍:

    1、《Learning Spark》

    《Spark 快速大資料分析》是一本為Spark 初學者準備的書,它沒有過多深入實現細節,而是更多關注上層使用者的具體用法。不過,本書絕不僅僅限於Spark 的用法,它對Spark 的核心概念和基本原理也有較為全面的介紹,讓讀者能夠知其然且知其所以然。

    2、《Spark機器學習:核心技術與實踐》

    本書採用理論與大量例項相結合的方式幫助開發人員掌握使用Spark進行分析和實現機器學習演算法。透過這些示例和Spark在各種企業級系統中的應用,幫助讀者解鎖Spark機器學習演算法的複雜性,透過資料分析產生有價值的資料洞察力。

    階段四、 大資料專案實戰(一線公司真實專案)

    資料獲取、資料處理、資料分析、資料展現、資料應用

    階段五、 大資料分析 —AI(人工智慧)

    主要是講解Data Analyze資料分析基礎、資料視覺化、sklearn中三類樸素貝葉斯演算法以及python機器學習等提升個人能力的內容!

  • 中秋節和大豐收的關聯?
  • 為什麼鋼鐵俠與奇異博士能夠在泰坦星自由呼吸?泰坦星的大氣環境與地球一模一樣嗎?