首頁>Club>
如題
7
回覆列表
  • 1 # 帆軟軟體

    R-ggplot2

    ggplot2是R語言最為強大的作圖軟體包,強於其自成一派的資料視覺化理念。當熟悉了ggplot2的基本套路後,資料視覺化工作將變得非常輕鬆而有條理。

    技術相關

    核心理念

    1. 將資料,資料相關繪圖,資料無關繪圖分離

    這點可以說是ggplot2最為吸引人的一點。眾所周知,資料視覺化就是將我們從資料中探索的資訊與圖形要素對應起來的過程。

    ggplot2將資料,資料到圖形要素的對映,以及和資料無關的圖形要素繪製分離,有點類似java的MVC框架思想。這讓ggplot2的使用者能清楚分明的感受到一張資料分析圖真正的組成部分,有針對性的進行開發,調整。

    2. 圖層式的開發邏輯

    在ggplot2中,圖形的繪製是一個個圖層新增上去的。舉個例子來說,我們首先決定探索一下身高與體重之間的關係;然後畫了一個簡單的散點圖;然後決定最好區分性別,圖中點的色彩對應於不同的性別;然後決定最好區分地區,拆成東中西三幅小圖;最後決定加入迴歸直線,直觀地看出趨勢。這是一個層層推進的結構過程,在每一個推進中,都有額外的資訊被加入進來。在使用ggplot2的過程中,上述的每一步都是一個圖層,並能夠疊加到上一步並可視化展示出來。

    3. 各種圖形要素的自由組合

    由於ggplot2的圖層式開發邏輯,我們可以自由組合各種圖形要素,充分自由發揮想象力

    基本開發步驟

    1. 初始化 – ggplot()

    這一步需要設定的是圖的x軸,y軸和”美學特徵”。基本形式如下:

    p <- ggplot(data = , aes(x = , y = ))

    這一步裡,設定x軸和設定y軸很好理解。那麼”美學特徵”又是什麼呢?

    舉個例子來說,下面這張散點圖裡,x軸表示年齡,y軸表示身高,很好理解:

    但這張圖除了展示年齡和身高的關係,還展示出每個樣本點的體重:顏色越深表示體重越大。因此體重資訊和年齡身高一樣,也需要繫結到一個具體的列。這一列就是散點圖中的”美學特徵”。

    來看看R語言繪製程式碼:

    ggplot(heightweight, aes(x=ageYear, y=heightIn, colour=weightLb))+geom_point()

    其中的colour引數就是該圖的”美學特徵”。

    再比如,下面這張柱狀圖中,x軸表示日期,y軸表示權重,很好理解:

    但這張圖中每個日期對應了兩個不同的權重並採用兩個柱狀來對比,那麼這個劃分依據也是另一個“美學特徵”。

    再看看繪製程式碼:

    ggplot(cabbage_exp, aes(x=Date, y=Weight, fill=Cultivar))+geom_bar(position="dodge", stat="identity")

    其中的fill引數就是該圖的”美學特徵”。

    綜上所述,圖中的每個樣本點除了透過它的座標位置,還可以以其他形式展示資訊,比如大小,色深,分組等。而這些新形式需要繫結的列,便叫做”美學特徵”。

    “美學特徵”的形式和x,y軸一樣是以列的形式給出,且列中元素個數和x,y軸列必然相等。它的設定也和x,y軸一樣在ggplot()函式的aes引數括號內進行。

    2. 繪製圖層 – geom_bar()/geom_line()等等

    上一步的主要工作是為資料視覺化配置好了資料,接下來便可根據業務的需要來繪製不同的圖,如折線圖/柱狀圖/散點圖等等。具體的實現方法在後面的章節中會細緻講解,這裡重點提一下繪圖函數里的stat引數。這個引數是對沖突樣本點做統計,該引數預設為identity,表示保留樣本點原(y)值,還可以是sum,表示對出現在這點的(y)值進行求和等等。

    3. 調整資料相關圖形元素 – scale系列函式、某些專有函式

    在ggplot2中,scale標尺機制專門負責完成資料到影象元素的對映。也許你會問,”美學特徵”不是已經定義好了這個對映嗎?然而事實是”美學特徵”只是選定了對映前的資料,並沒有說明具體對映到什麼圖形元素。

    舉個例子,假如某張表記錄了不同種類水池的長,寬,深資訊。現在需要繪製不同種類下水池長和寬關係的柱狀圖,那麼初始化完成的是這個對映:

    而scale函式完成的是這個對映:

    顯然a對映為了紅色,b對映為了藍色。

    也許你還會問,我的程式碼不用scale,那麼對映是如何完成的呢?答曰系統有預設對映的,就像繪圖函式都有預設引數stat=identity這樣。

    4. 調整資料無關圖形元素 – theme()、某些專有函式

    這部分包括設定圖片標題格式,文字字型這類和資料本身無關的影象元素。只需呼叫theme()函式或者某些專有函式(如annovate函式可為圖片添加註釋)便可實現。

    一個圖層繪製好後便可觀察調整,然後開始下一個圖層的製作,直到整幅圖繪製完畢。

    R語言視覺化成品圖

    說到工具,順帶提一下BI工具---FineBI

    FineBI是為大資料量提供資料處理、ETL、Dashboard報表展示、動態分析、報表管理的視覺化分析工具。優勢是:

    前端視覺化簡單操作(小試牛刀):1.新建分析新建分析包括兩種型別的分析:普通即時分析和實時報表。普通即時分析:是指普通的分析模板,從cube中獲取資料,進行資料分析;實時報表:是指做出來的即時分析模板,可以對資料進行實時檢視,保證資料的準確性報表建立完成之後,頁面進入資料分析設計介面,選擇元件佈局為自由佈局,如下圖:新增元件製作彙總表製作圖表元件佈局:自適應佈局&自由佈局自適應佈局,自動調節佈局自由佈局,自由選擇佈局

  • 2 # nnnnnuan

    最近經常用的一款簡單易上手的資料視覺化工具---BDP。

    真的只需要進行簡單的拖拽操作,就可呈現出直觀的視覺化效果。現在成了我們部門每天進行資料分析的必備工具了。

    我使用的是BDP個人版,完全不需要再用excel寫各種複雜的函式公式⬇️

    BDP個人版包括資料接入、資料處理、視覺化分析、資料報表等資料功能,資料可以集中管理。

    操作步驟:

    1⃣️資料接入:資料分析的第一步就是新增資料來源。

    2⃣️資料處理:整個頁面可以分為3個大區:工作表管理、工作表預覽和資料處理。

    左側:工作表管理,可以新增和檢視工作表,對工作表結構進行管理。

    中間:工作表預覽

    右上角:資料處理

    資料處理的具體功能。

    新建圖表:如果我想工作表上新建視覺化圖表,點選“新建圖表”;上傳資料:可以直接匯入本地資料,不用再跳轉到資料來源頁面去新增。建立合表:即資料處理,包括多表關聯、資料聚合、追加合併、SQL合表和二維轉一維5種處理方式,拖拽就能實現,尤其是多表關聯特別好用!

    3⃣️視覺化分析:圖表型別有30多種,不僅製作簡單,呈現出來的結果清晰、非常美觀。

    資料分析:BDP是不需要寫函式公式,在數值欄處選擇分析方式,有求和、計數、平均值等常見計算,也有同環比、留存率、重複率等高階計算。

    視覺化:再根據資料的適用情況選擇想要的視覺化圖表,有普通圖表和經緯度地圖,經緯度地圖我覺得是一個很高階的功能,所以放特色功能來講。普通圖表除了常見的柱圖、條形圖、折線圖等,還有一些稍高階的圖表,如瀑布圖、詞雲、漏斗圖、行政地圖、樹圖等。

    瀑布圖:

    詞雲:

    矩形地圖:

    經緯度地圖:

    熱力地圖:

    4⃣️資料報表(儀表盤)

    資料製作成圖表後,會統一地展示在儀表盤,也就是”資料報表“。

    上面這個好看的資料報表,是BDP工具提供的示例。

    儀表盤分類:普通儀表盤&高階儀表盤,普通儀表盤能較快速生成一張好看的報表,高階儀表盤還能插入文字、圖片、影片等多元素,使整個報表更豐富。

    儀表盤設計:做好的圖表都在儀表盤裡,可以設計儀表盤,讓做出來的圖表更美觀。直接拖拽圖表位置,將圖表拖到想要放的位置,達到想要的效果。這個真的太重要了,尤其是每次開會需要向很多領導展示資料的時候,一份美觀、直觀的報表真的能夠為業績加分哦~

    圖表設定:有匯出圖片、移動圖表、聯動設定等。

    儀表盤匯出:可以將做好的資料報表匯出來,支援PNG和PDF,可以作為彙報的素材。

    比較特色的功能,就是圖表聯動、多層下鑽等,。

    下鑽是透過增加圖層從彙總資料深入到細節資料進行觀察。透過逐層下鑽,讓我們對資料更加一目瞭然。

    上面兩個功能真的很有意思,感興趣的朋友一定要去試試。比如,我做了一個比較複雜的曲線圖,如何在一堆繁雜的資料曲線中快速展示某一專案的趨勢,就要用圖表聯動啦~

    BDP真的是不用寫函式,也不用寫SQL,不懂技術也可輕鬆搞定資料處理~

  • 3 # 嗯好行是

    給你推薦一個大資料分析的工具——DataViz(https://cloud.neusoft.com/pages/product/p_dataviz)。

    推薦DataViz的原因有3個:

    1.這款工具不需要技術開發人員和專業的資料分析師就可以使用;

    2.DataViz對於大資料可進行視覺化分析,使結果一目瞭然,更具參考意義;

    3.它支援如Oracle、 MySQL、 SQL Server等、文字資料來源如Excel、 Csv等多種資料來源,並有60多種圖表可供使用。

    接下來我們看看幾個示例圖:

  • 4 # 加米穀大資料

    1. Infogr.am

    在Infogr.am網站中,你可以使用30多種圖形和6種主題建立互動和可嵌入的圖表。

    2. Fusion Tables

    谷歌Fusion Tables是一款資料管理應用,透過Fusion Table,使用者可以快速生成相惜的圖表,圖形或者地圖。使用者還可以將圖表與其他人協作並支援使用共有資料或私有資料。英國的《衛報》(Guardian)也使用這個工具哦~

    3. Piktochart

    Piktochart擁有大量免費的優質模版,可用於圖表,報告,banner和演講。

    4. dygraphs

    dygraphs是個開源的Javascript圖表庫,透過呼叫介面,使用者可以直接把大型資料集製作成任何想要的形式。

    5. Timeline

    Timeline是由Simile發明的,可以讓使用者透過簡單的滾動和水平拖拽而生成簡單的互動時間軸。

    6. Leaflet

    Leaflet也是個開源的javascript庫,使用者可以建立友好互動的地圖。

    7. D3.JS

    D3.JS 是主要為基於HTML,SVG和CSS的操縱型文件設計的JavaScript庫。

    8. Tagxedo

    Tagxedo 是一款簡單的詞雲生成器。對於任意文字,都可以將單詞提取出來,並根據其出現的頻率調整單詞的大小。

    9. Easel.ly

    Easel.ly是一款非常簡單好用的資訊圖形生成器,擁有好幾百個模版,當然,如果你喜歡,也可以不用模版哦~

    10. Creately

    Creately 可以製作有50多種圖,包含幾千個例子和形狀庫,支援實時協作。

    相關:有哪些好用的資料視覺化工具推薦?

    https://www.toutiao.com/i6701210982703694347/

  • 5 # 使用者3570305182541

    上手簡單可以選擇DataViz(https://cloud.neusoft.com/pages/product/p_dataviz),操作簡單,上百種圖表可選擇,支援大屏展示,還有云版本可供選擇,註冊即可使用。

  • 中秋節和大豐收的關聯?
  • 如果讓你上戰場,你是願意當一個機槍手,還是步槍手?