作者按:
在工作中,不免進行一些數據的整理分析,從而來定位問題並解決,提高工作或者業務效率。發現新的機會點,保持持續的競爭優勢。那麼就來研究一下如何利用合適的工具,提升數據分析的效率。
1、流程
至於數據分析是什麼以及有哪些種類,應該都有所瞭解,那麼至於分析常規流程有哪些呢。一般包含如下步驟:
(1)目的明確,知道要分析什麼
(2)知道數據如何獲取
(3)處理獲取到的數據
(4)分析數據
(5)得出分析結果
(6)驗證
(7)展示分析結果
這些過程中,都離不開工具的幫助,熟練合理的運用分析工具就會事半功倍更好的處理數據並分析。
2、工具
一般數據分析工具離不開excel以及三方工具,但今天我們介紹的三方工具就是python,相信大家也很熟悉,因為excel可以通過人工鼠標鍵盤操作數據,而python可以通過代碼直接操作excel,比如導入或者導出數據,在批量操作執行方面,python是佔據優勢的。
data = pd.read_excel(filepath+”cilliantest.xlsx”)讀取.xlsx文件
3、工具下載安裝
這裡我們就不介紹如何安裝官方版python,因為從官方下載後,雖然有很多現成的模塊,但在調用之前需要自己手動安裝需要的模塊,這裡對於初學python數據分析的小白還是不太友好,那麼有沒有直接安裝打包好常用庫的python工具呢,當然有,這裡就來介紹一下Anaconda,這個工具其實就是python的一個開源版本,它的好處有啥呢,就是它自帶一些常用的Python庫,不需要自己手動安裝,下面就介紹一下具體安裝流程:
(2)選擇合適的系統和對應軟件
我這是windows 64位的,大家不要選錯哦
(4)安裝完成後,在電腦開始界面就會看到新添加的程序,看到這些說明python已經安裝好了
4、jupter notebook使用
說到這裡,就得說一下,ide和idel,ide表示集成開發環境,就是用來提供開發環境的程序,一般會包含編輯器、編譯器、調試器、UI界面等,idel是ide中最簡單基礎的一種,其他例如vscode、pycharm、spyder、jupter notebook都是idel,數據分析方面,大家用的比較多的就是jupter notebook
(2)編寫程序文件
(3)編寫並運行第一段代碼
(4)新建後,文件名字還沒定,可以重命名並保存
5、python基礎
到了這裡就得開始學習python的一些基礎知識了,學好之後就可以利用python進行數據操作分析。
需要知道這麼幾個概念:列表、字典、數組、字符串、循環語句、函數、模塊
6、pandas、numpy、matpotlib
學會以上的基礎概念之後,就可以正式開始數據分析的操作了,這裡會用到pandas、numpy、matplotlib這幾個模塊,直接導入即可
>>>import pandas as pd
>>>import numpy as np
>>>import matplotlib.pyplot as plt