-
1 # 簡單AI實驗室
-
2 # 程式設計字典
Pandas處理以下三種資料結構 -
序列資料幀面板這些資料結構建立在Numpy陣列的頂部,這意味著它們很快。
尺寸和說明
考慮這些資料結構的最佳方式是高維資料結構是其較低維資料結構的容器。例如,DataFrame是Series的容器,Panel是DataFrame的容器。
資料結構外形尺寸描述序列11D標記的同質陣列,sizeimmutable。資料幀2一般的二維標籤,大小可變的表格結構,具有潛在的非均勻型別列。面板3一般3D標籤,大小可變的陣列。
構建和處理兩個或更多維陣列是一項單調乏味的任務,使用者在編寫函式時需要考慮資料集的方向。但是使用Pandas資料結構,使用者的心理努力會減少。
例如,使用表格資料(DataFrame)時,思考 索引 (行)和 列 而不是軸0和軸1時語義上更有用。
可變性
所有Pandas資料結構都是可變的(可以更改),除了Series都是可變大小的。序列大小不可變。
注 - DataFrame被廣泛使用並且是最重要的資料結構之一。 面板用得少得多。
序列
序列是一種具有同質資料結構的一維陣列。例如,以下序列是整數10,23,56 ...的集合
10235617526173902672關鍵點
同質資料大小不可變資料可變的值資料幀
DataFrame是一個具有異構資料的二維陣列。例如,
名稱年齡性別評分史蒂夫32男3.45利亞28女4.6VIN45男3.9凱蒂38女2.78
該表格表示一個組織的銷售團隊的總體績效評級資料。資料以行和列表示。每列代表一個屬性,每行代表一個人。
資料型別的列
四列的資料型別如下 -
柱型別名稱串年齡整數性別串評分浮動關鍵點
異構資料大小可變資料可變面板
面板是具有異構資料的三維資料結構。圖形表示很難代表面板。但是面板可以作為DataFrame的容器來說明。
關鍵點
異構資料大小可變資料可變教程:http://codingdict.com/article/8273
-
3 # 小知PHM
pandas是python中非常強大的資料分析庫,下面我來說說我的看法,供大家參考參考:
1. pandas的兩大函式(Series 和 DataFrame函式,series 做序列處理,dataframe 做表格方面處理)
2. 資料表資訊檢視(如:data.shape 檢視維度;data.info 檢視基本資訊;data.dtype檢視列的型別)
3.pandas 做資料清洗(如:data.isnull() 判斷是否有空值;data.fillna(value=0) 填充空值等)
在這裡不一一詳細講解,想深入瞭解的朋友,請看我的“pandas知識大總結”的文章,文章連結在文末。
4.pandas做資料預處理
5.pandas做資料提取工作
6.pandas做資料彙總
7.pandas做資料統計
8.pandas讀取 csv 和 Excel 表格的資訊
9.pandas寫入資訊進 csv 和 Excel 表格中。
回覆列表
Pandas 入門
概述:
Pandas 是一種列存資料分析 API。它是用於處理和分析輸入資料的強大工具,很多機器學習框架都支援將 pandas 資料結構作為輸入。 雖然全方位介紹 pandas API 會佔據很長篇幅,但它的核心概念非常簡單,我會在下文中進行說明。有關更完整的參考,請訪問 pandas 文件網站,其中包含豐富的文件和教程資源。
知識點:
前往www.easyailab.cn可線上除錯實驗