首先是引入pandas和numpy,這是經常配合使用的兩個包,pandas依賴於numpy,引入以後我們可以直接使用np/pd來表示這個兩個模組
先建立一個時間索引,所謂的索引(index)就是每一行資料的id,可以標識每一行的唯一值
為了快速入門,我們看一下如何建立一個6x4的資料:randn函式用於建立隨機數,引數表示行數和列數,dates是上一步建立的索引列
我們還可以使用字典來建立資料框,例如建立一個列名為a的資料框,索引是自動建立的整數
這又是一個字典建立dataframe的例子
假如字典內的資料長度不同,以最長的資料為準,比如b列有4行:
可以使用dtypes來檢視各行的資料格式
接著看一下如何檢視資料框中的資料,看一下所有的資料
使用head檢視前幾行資料(預設是前5行),不過你可以指定前幾行
檢視前三行資料
使用tail檢視後5行資料
檢視資料框的索引
檢視列名用columns
檢視資料值,用values
檢視描述性統計,用describe
使用type看一下輸出的描述性統計是什麼樣的資料型別——dataframe資料
使用t來轉置資料,也就是行列轉換
對資料進行排序,用到了sort,引數可以指定根據哪一列資料進行排序
首先是引入pandas和numpy,這是經常配合使用的兩個包,pandas依賴於numpy,引入以後我們可以直接使用np/pd來表示這個兩個模組
先建立一個時間索引,所謂的索引(index)就是每一行資料的id,可以標識每一行的唯一值
為了快速入門,我們看一下如何建立一個6x4的資料:randn函式用於建立隨機數,引數表示行數和列數,dates是上一步建立的索引列
我們還可以使用字典來建立資料框,例如建立一個列名為a的資料框,索引是自動建立的整數
這又是一個字典建立dataframe的例子
假如字典內的資料長度不同,以最長的資料為準,比如b列有4行:
可以使用dtypes來檢視各行的資料格式
接著看一下如何檢視資料框中的資料,看一下所有的資料
使用head檢視前幾行資料(預設是前5行),不過你可以指定前幾行
檢視前三行資料
使用tail檢視後5行資料
檢視資料框的索引
檢視列名用columns
檢視資料值,用values
檢視描述性統計,用describe
使用type看一下輸出的描述性統計是什麼樣的資料型別——dataframe資料
使用t來轉置資料,也就是行列轉換
對資料進行排序,用到了sort,引數可以指定根據哪一列資料進行排序