首頁>Club>
3
回覆列表
  • 1 # 小小猿愛嘻嘻

    這裡介紹2種python視覺化的方法,分別是seaborn和pyecharts,這2個庫簡單易學、容易上手,可以快速繪製出簡潔、漂亮的圖表,而且程式碼量少,使用起來非常方便,下面我簡單介紹一下這2個庫的安裝和使用,實驗環境win10+python3.6+pycharm5.0,主要內容如下:

    seaborn:這是一個基於matplotlib的視覺化庫,是對matplotlib的更高階封裝,極大地方便了我們的資料視覺化,省去了許多matplotlib預設引數的配置,程式碼量少,而且製圖漂亮,下面我簡單介紹一下這個庫:

    1.安裝seaborn,這個直接在cmd視窗中輸入命令“pip install seaborn”就行,如下:

    2.安裝成功後,我們可以進行一下簡單的測試了,主要程式碼如下(官方示例):

    程式執行截圖如下,製圖效果還不錯:

    3.至於更多的示例的話,可以檢視一下官網的教程,種類繁多,註釋清楚,介紹詳細,很適合開發者來學習:

    pyecharts:這個是echarts的一個python介面,藉助echarts,我們可以快速繪製出簡潔、漂亮的視覺化圖表。易學易懂、上手簡單、使用方便,非常適合資料視覺化,下面我簡單介紹一下這個庫:

    1.下載安裝pyecharts,這個直接在cmd視窗輸入命令“pip install pyecharts”就行,如下:

    2.安裝成功後,我們就可以進行簡單的測試了,主要程式碼如下:

    程式執行截圖如下:

    更多示例,也可以參考一下pyecharts官網教程,相關引數和程式碼都有很詳細解釋、說明,非常適合初學者來學習。

    至此,2種python視覺化的方法就介紹完畢了。總的來說,這2個視覺化庫使用起來都非常方便,簡單易學、容易上手,感興趣的話,可以參考一下官網教程,嘗試一下,當然,你也可以使用matplotlib,ggplot2等視覺化庫,只要適合自己的專案,都行,網上也有相關教程和資料,感興趣的可以搜一下,希望以上分享的內容能對你有所幫助吧,也歡迎大家評論、留言。

  • 2 # 程式設計字典

    仔細學教程:http://www.codingdict.com/tutorials#Python%E6%95%99%E7%A8%8B

  • 3 # 阿Yge

    使用python完成資料視覺化,可以選擇的庫非常多,比如matplotlib、pyecharts、seaborn、ggplot、Plotly,以及在完成詞雲圖的WordCloud庫。

    在這裡建議一定要學matplotlib,原因有以下幾點:

    seaborn、ggplot、Plotly等視覺化庫是基於matplotlib庫開發的,地位不可撼動;

    matplotlib應用廣泛,拜讀大佬的程式的時候會經常看到該庫

    就要說到Python之所以應用廣泛是因為Python在大資料、機器學習、人工智慧等領域應用具有很大的優勢,而在這些行業中會經常使用matplotlib畫圖

    當然會用了matplotlib還是不足的,還需要學習簡單易懂、效果炫酷的其他視覺化庫,這裡建議學習pyecharts。

    pyecharts 是一個用於生成 Echarts 圖表的類庫。Echarts 是百度開源的一個數據視覺化 JS 庫。用 Echarts 生成的圖視覺化效果非常棒,為了與 Python 進行對接,方便在 Python 中直接使用資料生成圖。

    pyecharts操作比較簡單,官方中文網站介紹的非常詳細,適合新手學習資料視覺化。但是目前開發團隊正在開發V1.0版本(還未正式釋出),並且與先前的版本不相容,會有很大改進,值得我們期待。

    建議新手可以先學習0.5.11版本的pyecharts

    安裝方法為:在cmd視窗中輸入命令 pip install pyecharts==0.5.11。安裝完成,就打開了全新的視覺化方法的大門。

    當然喜歡嘗新的,還是推薦使用1.0版本的pyecharts。

  • 4 # 軟體測試開發技術棧

    補充推薦一個Python 新資料視覺化模組——Plotly Express 。

    補充推薦一個Python 新資料視覺化模組——Plotly Express 。

    Plotly Express

    Plotly Express是一個新的高階Python資料視覺化庫,它是Plotly.py的高階封裝,它為複雜的圖表提供了一個簡單的語法。只需一次匯入,大多數繪圖只要一個函式呼叫,接受一個整潔的Pandas dataframe,就可以建立豐富的互動式繪圖。

    Plotly Express 安裝

    慣例,使用 pip進行安裝。

    pip install plotly_expressPlotly Express支援構建圖表型別scatter:在散點圖中,每行data_frame由2D空間中的符號標記表示。scatter_3d:在3D散點圖中,每行data_frame由3D空間中的符號標記表示。scatter_polar:在極座標散點圖中,每行data_frame由極座標中的符號標記表示。scatter_ternary:在三元散點圖中,每行data_frame由三元座標中的符號標記表示。scatter_mapbox:在Mapbox散點圖中,每一行data_frame都由Mapbox地圖上的符號標記表示。scatter_geo:在地理散點圖中,每一行data_frame都由地圖上的符號標記表示。scatter_matrix:在散點圖矩陣(或SPLOM)中,每行data_frame由多個符號標記表示,在2D散點圖的網格的每個單元格中有一個,其將每對dimensions彼此相對繪製。density_contour:在密度等值線圖中,行data_frame被組合在一起成為輪廓標記,以視覺化該值的聚合函式histfunc(例如,計數或總和)的2D分佈z。density_heatmap:在密度熱圖中,行data_frame被組合在一起成為彩色矩形瓦片,以視覺化該值的聚合函式histfunc(例如,計數或總和)的2D分佈 z。line:在2D線圖中,每行data_frame表示為2D空間中折線標記的頂點。line_polar:在極線圖中,每行data_frame表示為極座標中折線標記的頂點。line_ternary:在三元線圖中,每行data_frame表示為三元座標中折線標記的頂點。line_mapbox:在Mapbox線圖中,每一行都data_frame表示為Mapbox地圖上折線標記的頂點。line_geo:在地理線圖中,每一行都data_frame表示為地圖上折線標記的頂點。parallel_coordinates:在平行座標圖中,每行data_frame由折線標記表示,該折線標記穿過一組平行軸,每個平行軸對應一個平行軸 dimensions。parallel_categories:在並行類別(或平行集)圖中,每行data_frame與其他共享相同值的行組合,dimensions然後透過一組平行軸繪製為折線標記,每個平行軸對應一個dimensions。area:在堆積區域圖中,每行data_frame表示為2D空間中折線標記的頂點。連續折線之間的區域被填充。bar:在條形圖中,每行data_frame表示為矩形標記。bar_polar:在極座標圖中,每一行都data_frame表示為極座標中的楔形標記。violin:在小提琴圖中,將data_frame行分組成一個曲線標記,以便視覺化它們的分佈。box:在箱形圖中,行data_frame被組合在一起成為盒須標記,以顯示它們的分佈。strip:在條形圖中,每一行都data_frame表示為類別中的抖動標記。histogram:在直方圖中,行data_frame被組合在一起成為矩形標記,以視覺化該值的聚合函式histfunc(例如,計數或總和)的1D分佈y(或者x如果orientation是"h")。choropleth:在等值區域圖中,每行data_frame由地圖上的彩色區域標記表示。gapminder資料集說明

    我們使用gapminder資料集進行體驗 Plotly Express 。

    gapminder資料集顯示2007年按國家/地區的人均預期壽命和人均GDP 之間的趨勢:包含1952~2007年世界各國家人口、GDP發展與/地區的人均預期壽命和人均GDP 之間的趨勢。

    Country:國家,ChinaContinent:洲,AsiaYear:年份,1952LifeExp:預期壽命,44POP:人口,556263527GdpPercap:分均 GDP,400.448611iso_alpha:國家編碼,CHNiso_num:國家程式碼,156上手體驗一下,輕鬆地進行資料視覺化。散點圖scatter

    常用引數說明:

    data_frame: 一個"整潔" pandas.DataFramex:(字串:列的名稱data_frame)此列中的值用於沿笛卡爾座標沿x軸定位標記。對於水平histogram()s,這些值用作輸入histfunc。y:(字串:列的名稱data_frame)此列中的值用於沿笛卡爾座標中的y軸定位標記。對於垂直histogram()s,這些值用作輸入histfunc。color:(字串:列的名稱data_frame)此列中的值用於為標記指定顏色。size:(字串:列名稱data_frame)此列中的值用於指定標記大小。color_continuous_scale:(有效CSS顏色字串列表)此列表用於在表示的列color包含數字資料時構建連續顏色標度。plotly_express.colors子模組中有各種有用的色標,特別plotly_express.colors.sequential是plotly_express.colors.diverging和plotly_express.colors.cyclical。title:(字串)圖示題。template:(字串或Plotly.py模板物件)圖模板名稱或定義。width:(整數,預設None)圖形寬度(以畫素為單位)。height:(整數,預設600)圖形高度(以畫素為單位)。

    使用散點圖描述華人口與GDP增長趨勢圖

    地理散點圖scatter_geo

    常用引數說明

    data_frame:“整潔”pandas.DataFramelat:(字串:data_frame)此列的值用於根據地圖上的緯度定位標記。lon:(字串:data_frame)此列的值用於根據地圖上的經度定位標記。locations:(字串:data_frame)該列中的值將根據locationmode並對映到經度/緯度。locationmode:(字串,“ISO-3”、“美國-州”、“國家名稱”之一)確定用於匹配locations地圖上的區域。color:(字串:data_frame)此列的值用於為標記指定顏色。size:(字串:data_frame)此列的值用於分配標記大小。color_continuous_scale:(有效的css-顏色字串列表)此列表用於在color包含數字資料。中提供了各種有用的色標。plotly_express.colors子模組,特別是plotly_express.colors.sequential, plotly_express.colors.diverging和plotly_express.colors.cyclical.title:(字串)圖形標題。width:(整數,預設)None)以畫素為單位的圖形寬度。height:(整數,預設)600)以畫素為單位的圖形高度。

    使用地理散點圖描述全球人口與GDP

    折線圖(line)

    常用引數說明

    data_frame:“整潔”pandas.DataFramex:(字串:data_frame)該列的值用於在笛卡爾座標中沿x軸定位標記。臥式histogram(),這些值用作histfunc.y:(字串:data_frame)該列的值用於在笛卡爾座標中沿y軸定位標記。垂直histogram(),這些值用作histfunc.color:(字串:data_frame)此列的值用於為標記指定顏色。facet_col:(字串:data_frame)此列中的值用於在水平方向平面子圖分配標記。title:(字串)圖形標題。width:(整數,預設)None)以畫素為單位的圖形寬度。height:(整數,預設)600)以畫素為單位的圖形高度。

    使用折線圖描述1952~2007中國與美華人口增長趨勢圖

    條形圖(bar)

    常用引數說明

    data_frame:“整潔”pandas.DataFramex:(字串:data_frame)該列的值用於在笛卡爾座標中沿x軸定位標記。臥式histogram(),這些值用作histfunc.y:(字串:data_frame)該列的值用於在笛卡爾座標中沿y軸定位標記。垂直histogram(),這些值用作histfunc.color:(字串:data_frame)此列的值用於為標記指定顏色。facet_row:(字串:data_frame)此列的值用於向垂直方向上的平面子圖分配標記。facet_col:(字串:data_frame)此列中的值用於在水平方向平面子圖分配標記。text:(字串:data_frame)此列的值以文字標籤的形式顯示在圖中。title:(字串)圖形標題。template:(String或Plotly.py模板物件)圖形模板名稱或定義。width:(整數,預設)None)以畫素為單位的圖形寬度。height:(整數,預設)600)以畫素為單位的圖形高度。

    使用條形圖描述1952~2007中國與美華人口增長趨勢圖

    等值區域圖(choropleth)

    常用引數說明

    data_frame:“整潔”pandas.DataFramelat:(字串:data_frame)此列的值用於根據地圖上的緯度定位標記。lon:(字串:data_frame)此列的值用於根據地圖上的經度定位標記。locations:(字串:data_frame)該列中的值將根據locationmode並對映到經度/緯度。locationmode:(字串,“ISO-3”、“美國-州”、“國家名稱”之一)確定用於匹配locations地圖上的區域。color:(字串:data_frame)此列的值用於為標記指定顏色。size:(字串:data_frame)此列的值用於分配標記大小。color_continuous_scale:(有效的css-顏色字串列表)此列表用於在color包含數字資料。中提供了各種有用的色標。plotly_express.colors子模組,特別是plotly_express.colors.sequential, plotly_express.colors.diverging和plotly_express.colors.cyclical.title:(字串)圖形標題。width:(整數,預設)None)以畫素為單位的圖形寬度。height:(整數,預設)600)以畫素為單位的圖形高度。

    使用等值區域圖描述各個國家人口數量

  • 中秋節和大豐收的關聯?
  • 流浪人沈大師為什麼非要蓬頭垢面?收拾乾淨點不是更舒服嗎?