先說結論:根據需求和軟體操作能力,選用SPSS、STATA、SAS、R語言、Python中的一種或多種,這幾款都是主流的資料分析和統計軟體,對程式設計能力的要求依次提高,能完成複雜分析的能力、自由度也更高。
1. SPSS
優勢:易於學習
弱點:難以完成複雜操作、迴圈等自動化分析
推薦書目: 張文彤《SPSS統計分析基礎教程》
2. Stata
計量經濟學專業常用統計軟體,大部分操作可以通過點選滑鼠完成,但使用程式設計(do語句)更為快捷,do語句也很簡單,容易上手。尤其適合需要對資料進行基本清洗、需要大量回歸分析的使用者。
此外,stata有自己的社群和期刊,如果英語好幾乎能找到需要的所有解答。
優點:邏輯是變數和樣本,容易理解;資料管理能力強;直觀
缺點:複雜功能的實現不足;圖表不美觀
3. SAS
醫學、金融常用軟體,穩定可靠,有豐富的介面,和Stata類似,SAS也有自己的程式設計語法,但更為複雜,較難掌握。如果不是工作需要,不建議新手入門。
4. R
開源免費軟體,統計軟體中冉冉升起的新星。
優勢:
功能範圍非常大(有很多擴充套件包可以實現各種各樣豐富的功能)
畫圖非常好看
非常容易自動化和整合(與 Git、LaTeX、ODBC、Oracle 、Apache Hadoop等)
非常好的社群支援,以及通過第三方的支援
廣泛的幫助資源免費提供(手冊、教程等)
非常強大且靈活的指令碼語言(例如支援面向物件的程式設計)
支援所有通用平臺(Windows、Linux、MacOS...)
非常大的、活躍的開發人員社群,面向未來
弱點:
熟悉 R 語法較難
速度不夠快
使用非常大的資料集時,對電腦硬體要求高
推薦書目:R語言實戰
5. Python
最接近程式語言,統計和資料分析只是它的一小部分功能,不夠直觀但功能強大。學起來較難。
先說結論:根據需求和軟體操作能力,選用SPSS、STATA、SAS、R語言、Python中的一種或多種,這幾款都是主流的資料分析和統計軟體,對程式設計能力的要求依次提高,能完成複雜分析的能力、自由度也更高。
1. SPSS
優勢:易於學習
弱點:難以完成複雜操作、迴圈等自動化分析
推薦書目: 張文彤《SPSS統計分析基礎教程》
2. Stata
計量經濟學專業常用統計軟體,大部分操作可以通過點選滑鼠完成,但使用程式設計(do語句)更為快捷,do語句也很簡單,容易上手。尤其適合需要對資料進行基本清洗、需要大量回歸分析的使用者。
此外,stata有自己的社群和期刊,如果英語好幾乎能找到需要的所有解答。
優點:邏輯是變數和樣本,容易理解;資料管理能力強;直觀
缺點:複雜功能的實現不足;圖表不美觀
3. SAS
醫學、金融常用軟體,穩定可靠,有豐富的介面,和Stata類似,SAS也有自己的程式設計語法,但更為複雜,較難掌握。如果不是工作需要,不建議新手入門。
4. R
開源免費軟體,統計軟體中冉冉升起的新星。
優勢:
功能範圍非常大(有很多擴充套件包可以實現各種各樣豐富的功能)
畫圖非常好看
非常容易自動化和整合(與 Git、LaTeX、ODBC、Oracle 、Apache Hadoop等)
非常好的社群支援,以及通過第三方的支援
廣泛的幫助資源免費提供(手冊、教程等)
非常強大且靈活的指令碼語言(例如支援面向物件的程式設計)
支援所有通用平臺(Windows、Linux、MacOS...)
非常大的、活躍的開發人員社群,面向未來
弱點:
熟悉 R 語法較難
速度不夠快
使用非常大的資料集時,對電腦硬體要求高
推薦書目:R語言實戰
5. Python
最接近程式語言,統計和資料分析只是它的一小部分功能,不夠直觀但功能強大。學起來較難。