聽說最近車釐子的價格突然猛跌,之前很多人夢寐以求的“車釐子自由”,現在都能實現了。其實車釐子的價格下降,主要原因是進口貨運成本的大大降低,為了找到車釐子最佳的購買方式,我決定用python+BI進行資料分析。
因此我在淘寶上用python爬取了3000條資料,然後匯入到了FineBI中進行視覺化分析,最終制作出了下面這樣一份視覺化報告:
下面我展示一下操作過程:
一、資料獲取用Python在淘寶上進行資料爬取是老生常談的操作了,直接在淘寶上搜索“車釐子”,在下面的商品頁中可以看到,我們這次主要爬取的標籤是“商品名稱”、“價格”、“付款人數”、“店鋪名稱”、“發貨地址”等:
按下F12,調出後臺檢視原始碼,找到不同的商品標籤程式碼,比如價格是“price g_price g_price-highlight">”,付款人數是“deal-cnt”等:
瞭解了網頁的程式碼結構之後,下一步就可以在python裡直接編寫程式碼了,具體過程不詳細介紹了,部分程式碼如下:
爬取完資料之後匯入到Excel裡,然後在Excel裡經過簡單的資料清洗和處理,最終得到一份完成的資料表:
二、資料分析python雖然也能實現資料分析的功能,但是需要敲程式碼,學習成本和難度都比較大,不如直接利用專業的資料分析工具進行分析,比如常見的比如FineBI、Tableau、PowerBI等。
下面我直接以FineBI為例,FineBI是國內知名度比較高的本土資料分析工具,比起tableau這些國外工具最大的優點就是簡單、靈活,只需要用滑鼠拖拽就能實現各種分析操作,基本不需要寫程式碼,對新手非常友好。
其實FineBI本質上屬於企業級的業務資料分析平臺,除了資料分析之外,還能實現資料管理、資料平臺搭建等功能,這裡就不詳細介紹了,大家感興趣的話我下一篇再介紹。
有了excel源表,首先我們將Excel匯入到FineBI中:
下一步進入到儀表板進行視覺化操作,基本步驟是“選擇圖表型別——選擇指標和維度——拖拽到指定座標軸——美化細節”,比如我想要建立一張視覺化地圖,首先要先選擇圖表型別為“區域地圖”,然後要選擇指標和維度,但是原資料表裡沒有地理緯度,因此需要自己建立:
最後,我們再拖拽到指定座標軸,然後美化細節就可以完成一張視覺化地圖了:
以此類推,其他的視覺化圖表也能夠按照我們自己的需求進行製作,這裡不詳細講了。
三、資料視覺化1、車釐子銷量分佈情況
可以看出來國內車釐子最大的銷量來自上海,以及浙江、廣東兩省,西藏、青海、內蒙古等省份都沒有銷量,基本上來說沿海地區的銷量要高於內陸。
2、各省份銷量情況
透過條形圖就更明顯了,上海的銷量有20多萬,幾乎是浙江、廣東、四川的總和。
3、各城市的銷量情況
篩選出了銷量前十的城市,以及每個城市平均的車釐子價格,可以看出來上海的銷量和價格都是最高的,可以看出上海的購買力有多強了;
4、車釐子的價格區間情況
資料表裡將價格區間分為“50以下”、“50-100”、“100-150”、“150-200”、“200-500”、“500以上”等,可以看出來佔比最大的價格區間是“50-100”,這應該屬於平民價格了;值得注意的是“200-500”的價格佔比也高於“100-150”。
5、各門店的銷量與價格情況
可以看出銷量最高的基本都是旗艦店,最高的平均價格基本在600-800左右;
四、總結因為資料不算多,所以這次沒有做太深的資料分析,大家可以自己拿資料,在FineBI裡進行更多的分析,文中涉及到的工具和資料表,回個“車釐子”就能得到。