回覆列表
  • 1 # 柳3歲

    作為一個從超級菜鳥階段過來的人,也曾迷茫,也曾面對一大堆資料不知所措,從無到有踩過太多的坑,在這裡分享一下我總結出來的資料分析學習路徑,為了讓你少走彎路,避免選擇困難,能用一本書搞定的我絕不會給你推薦其他多的書。即使是超級菜鳥,只要你認真按照下面的路徑進行學習,我保證你能夠有所收穫。

    在我看來,菜鳥入門資料分析所需要學習的內容依次可以分為三個方面:統計學知識、程式設計技能以及資料分析的方法論。

    一、統計學

    學習統計學知識並不是讓你生啃一本如《統計學原理》或《數理統計》的教科書,如果真是這樣,大多數人怕是直接從入門到放棄了。這裡推薦一本書:

    《深入淺出統計學》

    我一直認為統計理論要與日常生活結合起來,才能理解得更直觀、透徹。這本書運用充滿互動性的真實世界情節,教給你有關統計學的所有基礎知識,如資訊視覺化、機率計算、幾何分佈、二項分佈及泊松分佈、正態分佈、統計抽樣、置信區間的構建、假設檢驗、卡方分佈、相關與迴歸等等。

    二、程式設計技能

    在學習了一些統計學的基本知識後,進入程式設計技能的學習,資料分析主要用到的程式設計技能有Excel、SQL、Python/R(我推薦學Python)。Excel由於大家或多或少都會用,上手也比較容易,在這裡不過多討論。這裡主要討論SQL和Python應該如何進行學習。

    SQL

    SQL是什麼?SQL全稱是”結構化查詢語言(Structured Query Language)”,是一種資料庫查詢和程式設計語言,用於存取資料以及查詢、更新和管理關聯式資料庫系統。實際業務中要進行資料分析,首先得把資料從資料倉庫中提取出來,SQL乾的就是這個。

    軟體安裝:

    對於剛剛接觸SQL的同學,可能裝個Mysql都需要花費很多的時間,這裡為大家找了兩份Mysql的安裝指南。

    mysql安裝 - www.cnblogs.com

    MySQL安裝和使用 - 夢想雲端 - 部落格園www.cnblogs.com

    軟體裝好了,就可以開始學起來了,針對SQL的學習,可以分為入門階段和進階階段。

    入門階段:

    推薦書籍:MySQL必知必會

    對入門者很照顧的一本書,與其說是一本書不如說是一本小冊子,不到250頁的小冊子,實踐性很強,基本沒有什麼理論的堆砌,完完全全就是一本實踐指南,教會你怎麼用SQL語句操作MySQL。看完這本書基本就可以說是入門了。看書之餘不要忘了勤加練習,這裡也為大家找了一份Mysql入門練習題。

    進階階段:

    此時的你已經掌握了SQL的基本語法,能對資料庫進行基本的增刪改查,但當你面對的資料量較大時,最佳化就顯得很重要了。下一步就是要學會如何去最佳化SQL程式碼的執行效率。

    推薦書籍:高效能MySQL

    軟體安裝:

    python好用的IDE(簡單說就是寫程式碼的平臺)有很多,但對於學習資料分析的初學者而言,我還是牆裂推薦你裝Anaconda,並使用jupyter作為練手的IDE,聽我的錯不了!(自己一開始學的時候在命令列那裡敲程式碼,對新手而言體驗極差……)

    Anaconda是什麼?怎麼安裝?(安裝前先下載個谷歌瀏覽器)

    Anaconda 的安裝教程(圖文)blog.csdn.net將Chrome設定為Jupyter_notebook的預設瀏覽器 - 雲+社群 - 騰訊雲cloud.tencent.com

    安裝好Anaconda並配置好jupyter之後,就可以開啟jupyter開始學習Python啦,可以花一點時間稍微熟悉一下jupyter的使用,jupyter的介面如下圖所示。

    基礎語法:

    安裝完軟體之後,就可以開始學習Python的基礎語法啦,這方面的教程比較多,這裡就給大家推薦一下我覺得還不錯的,書和影片各一個。

    推薦書籍:Python程式設計從入門到實踐

    再次注意,這本書也是有選擇地看,直接看第二章(變數和簡單資料型別)到第九章(類),其他的可以直接忽視。建議在看書時,將示例程式碼全部自己敲一遍,對程式碼而言,無他,唯手熟爾,待你將第二章到第九章的程式碼都敲過並理解了之後,你也就基本掌握了Python的主要資料型別,列表、字典、元組的主要操作,條件語句,迴圈語句,類和函式的使用,Python也算基本入門了。

    如果有時候看書看不下去,也可以選擇對應章節的影片課程,這裡就給大家推B站的這個影片吧,也算是B站人氣比較高的python入門影片課程。

    如果覺得書中的例子不過癮,想多多鞏固剛學的Python語法,這裡也為你準備了Python的100個小例題。

    Python 100例 | 菜鳥教程www.runoob.com

    Python資料分析核心工具——pandas

    當你已經掌握Python的基本語法之後,就可以直接開始學pandas這個資料分析庫了,怎麼學呢,這裡就推薦一本書。

    書籍推薦:利用Python進行資料分析 原書第2版

    本書由pandas專案創始人Wes McKinney親筆撰寫,詳細介紹利用Python進行操作、處理、清洗和規整資料等方面的具體細節和基本要點。不僅有主要方法的操作演示,還有相關案例的實踐。把這本書吃透,基本上你就可以靈活地使用Python對資料進行處理了。

    其實,如果你認認真真走完上面SQL的學習路徑,學習pandas的時候進度會很快,因為很多地方都是相通的,這篇文章總結了pandas和SQL在使用方法上的對比,學完SQL後學pandas,看看這個,你會恍然大悟。

    pandas與sql 對比,持續更新blog.csdn.net

    另外:建議在閱讀這本書的時候,不僅把書上的程式碼吃透,最好還能找個自己感興趣的資料集開始試著練手分析分析。不知道去哪裡找資料集?下面給你整理了幾個常見的找資料集的網站:

    和鯨社群 - Kesci.comwww.kesci.com天池資料集Datasets | Kagglewww.kaggle.com

    不知道該怎麼著手分析?下面是我整理的50個數據分析實戰專案,你可以看看別人的分析思路,再將之運用到分析你的資料集上。

    易執:乾貨!Python資料分析50個實戰專案(持續更新……)zhuanlan.zhihu.com

    至此,你已經基本掌握了資料分析的基本工具,接下來就得開始學習如何結合實際業務去分析問題,學習一些資料分析的思維。

    三、資料分析方法論

    這裡直接推薦兩本自己看過的不錯的書

    1、精益資料分析

    這本書展示瞭如何驗證自己的設想、找到真正的客戶、打造能賺錢的產品,以及提升企業知名度。30多個案例分析,全球100多位知名企業家的真知灼見,為你呈現來之不易、經過實踐檢驗的創業心得和寶貴經驗,其中的資料分析思路值得仔細揣摩。

    2、增長駭客

    作為最早提出“增長駭客”概念的理論先驅、帶領Dropbox實現500%增長的實戰領軍人物,作者在書中分享瞭如何跨部門搭建增長駭客團隊,以及實現使用者和利潤雙增長的具體行動指南。這本書適合入門者理解增長駭客的原理與操作體系。

    如果你已經走到最後這個階段了,那麼再往下繼續深入,就得在實際專案中結合業務自己學習領悟了,或許,這也正是資料分析獨特的魅力所在!

  • 中秋節和大豐收的關聯?
  • 為什麼現在實體店生意越來越難做?中年人做什麼行業比較好?