回覆列表
-
1 # IT人劉俊明
-
2 # 加米穀大資料
資料分析入門不算難,但進階蠻難的
學會Python numpy,Pandas這些工具的使用,這只是入門;
好點的資料分析師,對統計學,數學都有一定的熟悉,能熟練運用模型來對一堆資料建模分析。
Python資料分析學習
https://www.toutiao.com/i6735341654099624452/
資料分析入門不算難,但進階蠻難的
學會Python numpy,Pandas這些工具的使用,這只是入門;
好點的資料分析師,對統計學,數學都有一定的熟悉,能熟練運用模型來對一堆資料建模分析。
Python資料分析學習
https://www.toutiao.com/i6735341654099624452/
首先,資料分析還是具備一定難度的,但是隻要透過一個系統的學習過程,大部分人能夠掌握一定的資料分析知識。
資料分析的核心並不是程式語言,而是演算法設計,不論是採用統計學的分析方式還是機器學習的分析方式,演算法設計都是資料分析的核心問題。所以,進行資料分析要具備一定的數學基礎,包括高等數學、線性代數、機率論等。當然,如果透過工具進行資料分析,即使數學基本比較薄弱,也能夠完成一些基本的資料分析任務,比如BI工具就能夠完成大量的企業級資料分析任務。
採用Python語言實現資料分析是目前大資料領域比較常見的解決方案,透過Python來實現基於機器學習方式的資料分析需要經過多個步驟,分別是資料收集、資料整理、演算法設計、演算法實現、演算法驗證和演算法應用。通常需要掌握一些常見的機器學習演算法,包括knn、決策樹、支援向量機、樸素貝葉斯等,採用Python來完成這些演算法還是比較方便的,因為Python中的Numpy、Matplotlib、Scipy、pandas等庫會提供強大的支撐。看一個來自Matplotlib簡單的例子:
由於Python語言自身語法比較簡單,所以學習Python的過程相對來說還是比較輕鬆的,難點在於演算法的學習,如何在不同的場景下選擇不同的演算法是重點問題。另外,學習資料分析通常要對行業知識有一定的瞭解,不同行業對於資料分析維度有不同的要求,這些知識需要在工作中不斷積累,在產業網際網路發展的大背景下,行業知識是比較重要的。