經常會遇到的情形是:我們有其他格式的資料,需要匯入到 STATA 中進行分析,建議大家此時將其他格式資料複製到分析資料的檔案目錄下,然後直接用STATA 的匯入資料檔案命令匯入原始資料,用程式模式進行處理,然後匯出處理結果.這樣做的最大好處是:既不會破壞最原始的資料檔案,又使我們的每一步資料處理和分析過程都有跡可循.
1 insheet 命令
示例:3origin.xls”資料,將其開啟並另存為“3origin.csv” ,(另存時請注意要選擇“儲存型別”下拉單,選擇 CSV(逗號分隔)這一項).然後在 STATA命令視窗中用下述命令匯入
insheet using 3origin.csv,clear
也可以先將“3origin.xls”資料開啟並另存為“3origin.txt” ,然後用下面的命令匯入
insheet using 3origin.txt,clear
當資料中某個變數的位數特別長或者對匯入資料的精度要求很高的時候,需要在該命令後面加double 選項.
insheet using 3origin.txt,double clear
2 infile命令
對於“3origin.txt”或“3origin.csv”,還可用 infile命令匯入 STATA,此時需要先指出變數名.尤其要注意,當變數為字元型時,要先指明.
infile id str10 name gender minority economy math using origin.txt,clear
或者
infile id str10 name gender minority economy math using origin.csv,clear
3 infix命令
還有一種標準化的資料,每個變數的位數是確定的,不足時,前面用0補齊,以 origin資料的後面四個變數為例,其資料格式為
114068
128052
029076
024390
037096
115385
028536
129565
如果遇到這種資料格式,需要對照資料說明匯入資料,相應的命令為:
infix gender 1 minority 2 economy 3-4 math 5-6 using origin.csv,clear
其中的數字為對應的數字位數.
4 outsheet 命令
與前述三個命令相反,有時我們需要將 STATA 資料匯出為其他格式資料,比如文字格式或字尾為 acs 的格式:此時需要使用outsheet 命令實現,該命令的基本格式如下.
outsheet using myresult.txt
outsheet using myresult.asc
此時建立的檔案 myresult.txt第一行為變數名,第2~6 行為變數值.變數列間用Tab鍵分隔.如果不希望在第一行儲存變數名,則可以使用nonames 選項.如果檔案已經存在,則需要使用 replace 選項,相應的命令分別為.
outsheet using myresult.asc,nonames
outsheet using myresult.asc,nonames replace
5 使用 transfer 軟體
經常會遇到的情形是:我們有其他格式的資料,需要匯入到 STATA 中進行分析,建議大家此時將其他格式資料複製到分析資料的檔案目錄下,然後直接用STATA 的匯入資料檔案命令匯入原始資料,用程式模式進行處理,然後匯出處理結果.這樣做的最大好處是:既不會破壞最原始的資料檔案,又使我們的每一步資料處理和分析過程都有跡可循.
1 insheet 命令
示例:3origin.xls”資料,將其開啟並另存為“3origin.csv” ,(另存時請注意要選擇“儲存型別”下拉單,選擇 CSV(逗號分隔)這一項).然後在 STATA命令視窗中用下述命令匯入
insheet using 3origin.csv,clear
也可以先將“3origin.xls”資料開啟並另存為“3origin.txt” ,然後用下面的命令匯入
insheet using 3origin.txt,clear
當資料中某個變數的位數特別長或者對匯入資料的精度要求很高的時候,需要在該命令後面加double 選項.
insheet using 3origin.txt,double clear
2 infile命令
對於“3origin.txt”或“3origin.csv”,還可用 infile命令匯入 STATA,此時需要先指出變數名.尤其要注意,當變數為字元型時,要先指明.
infile id str10 name gender minority economy math using origin.txt,clear
或者
infile id str10 name gender minority economy math using origin.csv,clear
3 infix命令
還有一種標準化的資料,每個變數的位數是確定的,不足時,前面用0補齊,以 origin資料的後面四個變數為例,其資料格式為
114068
128052
029076
024390
037096
115385
028536
129565
如果遇到這種資料格式,需要對照資料說明匯入資料,相應的命令為:
infix gender 1 minority 2 economy 3-4 math 5-6 using origin.csv,clear
其中的數字為對應的數字位數.
4 outsheet 命令
與前述三個命令相反,有時我們需要將 STATA 資料匯出為其他格式資料,比如文字格式或字尾為 acs 的格式:此時需要使用outsheet 命令實現,該命令的基本格式如下.
outsheet using myresult.txt
outsheet using myresult.asc
此時建立的檔案 myresult.txt第一行為變數名,第2~6 行為變數值.變數列間用Tab鍵分隔.如果不希望在第一行儲存變數名,則可以使用nonames 選項.如果檔案已經存在,則需要使用 replace 選項,相應的命令分別為.
outsheet using myresult.asc,nonames
outsheet using myresult.asc,nonames replace
5 使用 transfer 軟體