-
1 # 最全面的大資料教學
-
2 # 資料鍊金術師
首先可以肯定的是:
Python視覺化包太多了
舉幾個自己常用的包
比如:Matplotlib、Seaborn 和 Pandas
把這三個包放在一起有幾個原因:首先Seaborn 和 Pandas 是建立在 Matplotlib 之上的,當用 Seaborn 或 Pandas 中的 df.plot() 時,用的其實是Matplotlib 寫的程式碼。因此,這些圖在美化方面是相似的,自定義圖時用的語法也都非常相似,我稱之為“視覺化三劍客”,也是最常用最通用的包。
比如: ggplot2,從R裡遷移過來的
ggplot2的特點是用「圖形語法」來構建圖片。基本前提是你可以例項化圖,然後分別新增不同的特徵;也就是說,你可以分別對標題、座標軸、資料點以及趨勢線等進行美化,個人感覺幾乎和R相同效果
比如:pyecharts,Bokeh和Plotly
它們的特點是製作互動式商業報表的絕佳工具,自由度和美感都不錯
當然高度的自定義化也代表著你的程式碼量的暴增,一張圖隨隨便便幾十行
比如:Networkx
特點是製作關係網狀圖,個人用的時候不多,屬於特定用途的包
比如:cutecharts
和 Matplotlib 、pyecharts 等常見的圖表不同,使用這個包可以生成下面這種看起來像手繪的各種圖表,在一些場景下使用效果可能會更好,是個很神奇的包
以上都是自己用過和嘗試過的
現在視覺化工具發展很快,應接不暇
其實我不建議過分關注工具️
因為這太浪費時間精力
相信你肯定有自己的視覺化方法和習慣
至於是否需要使用Python視覺化
可能不是核心問題所在
畢竟真正商用視覺化最多是Excel
Excel視覺化效率很高,也實用
而Python的優勢是資料清洗處理效率
反觀Python畫圖的code量並不樂觀
那麼資料視覺化的關鍵是什麼?
這個關鍵,是你的分析目的和用途
一般視覺化用途分為以下幾種
然後根據用途不同
來確定不同的圖表型別
比如:
看趨勢,一般選擇折線圖
看對比,選擇條形圖
看分佈,選擇散點和直方圖
具體的圖表選擇指南如下圖:
在選擇了正確圖表後才會涉及工具問題:
視覺化工具,一般可分為四大類
1.軟體類,如Excel,Tableau,powerbi
2.外掛類,如datachart,thinkcell
3.線上類,如鏑數,圖表秀,花火
4.程式碼類,如Python,R,上面提到過了
至於選擇何種工具最合適
與個人技術,工作內容,時間緊張程度密切相關
把資料洗好,從目的出發,工具實用即可
希望回答文字,能幫到你
-
3 # 奧威軟體大資料BI
主要有三類資料採集方式,分別是爬蟲、填報、對接。
爬蟲可爬指定第三方平臺上的指定資料;
填報,想Excel一類的資料就能迅速填報進去;
對接,像ERP、電商ERP、電商平臺(京東等)就能對接資料。
資料視覺化分析工具推薦以下兩個:
SpeedBI資料分析雲,無程式碼做資料視覺化分析,線上登入使用。
OurwayBI,奧威軟體產品,無程式碼做資料視覺化分析,有標準解決方案和行業通用解決方案,預設分析模型,做企業級大資料智慧視覺化分析的話可大大縮短週期,降低風險成本。
回覆列表
你好,我是一名大資料專業的學生,我們一般採用 pyecharts 來對資料進行視覺化,但是企業一般是Python的 flask+百度 echarts 這樣的視覺化更加的形象具體。