-
1 # 小知機器醫生
-
2 # 加米穀大資料
在資料科學方面選擇 Python 還是 R 程式語言?
R 語言R 是一種用於統計計算和圖的語言及環境。它是一個 GNU 專案,與貝爾實驗室的 John Chambers 及其同事開發的 S 語言及環境類似。R 可以視為 S 的一種不同實現。二者存在一些重要差異,但使用 S 寫的很多程式碼在 R 下執行時無需修改。
優點:
端到端開發到執行(一些 brokers package 允許執行,IB)
開發速度快(比 Python 的程式碼少 60%)
開源包多
成熟的量化交易包(quantstrat、quantmod、performanceanalyitics、xts)
社群最大
使用 rcpp 可以整合 R 和 C++/C
缺點:
比 Python 慢,尤其是在迭代迴圈和非向量化函式中
比 Matlab 繪圖差,難以實現互動式圖表
建立獨立應用程式的能力有限
PythonPython 是一種用於通用程式設計的解釋型高階程式語言,由 Guido van Rossum 建立並於 1991 年首次釋出。Python 的設計強調程式碼可讀性,使用了大量空格。它的結構使其在大規模和小規模程式設計中都能清晰明瞭。
優點:
端到端開發到執行(一些 brokers package 允許執行,IB)
開源包(Pandas、Numpy、scipy)
交易包(zipline、pybacktest、pyalgotrade)
最適合一般程式設計和應用程式開發
可連線 R、C++ 和其他語言的「膠水」語言
總體速度最快,尤其是在迭代迴圈中
缺點:
有一些不成熟的包,尤其是交易包
有些包與其他包不相容或包含重疊
在金融領域的社群比 R 小
與 R 或 Matlab 相比,相同操作需要更多程式碼
追蹤靜默錯誤(silent error)可能需要很長時間(即使使用視覺化偵錯程式/IDE)
如何比較 R 和 Python下面是這兩種語言之間一些值得比較的因素,這並不是一個完全的列表。
• 歷史:R 和 Python 具有明顯不同的歷史,有時候會交叉。
• 社群:透過實際調查發現的很多複雜的社會人類學因素。
• 效能:詳盡的比較以及為什麼比較起來這麼難。
• 第三方支援:模組,程式碼庫,視覺化,儲存庫,組織和開發環境。
• 用例:有些任務和工作型別適合其中一種或者另一種。
全文:大資料科學領域,程式語言你該選 Python 還是 R?
https://www.toutiao.com/i6582361752531370500/
相關:
除了R、Python,這些資料科學工具也重要
https://www.toutiao.com/i6624359252272087559/
回覆列表
在現在的時代,資料=金錢,資料的潛在價值非常大,可以幫助我們更精準的商業決策、政府決策。下面我來說說我的看法,供大家參考參考:
1. 我個人比較推薦Python語言,為什麼?(Python語言簡潔,開發成本低,門檻低,維護成本低,利於更新升級。現在Python領域的投資也在不斷的增加,很多公司都在用Python做研發,而且現在Python也列入了中學生的教程,由此可見Python是挺有分量的)
2. Python最大的優勢就是資料科學這個方面做的挺好的(Python是資料科學方面的首選語言,也是資料科學家必備的開發語言)
3. Python大資料方面的知識是:
(1)首先,採集資料作為樣本資料(這裡用到了Python爬蟲,大家都知道Python爬蟲是很容易入門和掌握的,這對於研發也有很大的便利)
(2)其次,處理資料。(這裡用到了Python資料分析,Python有非常強大的資料分析庫,如numpy、matplotlib視覺化,pandas,還有機器學習庫等,這些都是Python的優勢所在)
(3)最後,使用資料建模(這裡用到了Python的機器學習演算法,要成為出色的“資料科學家”,機器學習,深度學習這些演算法類的知識肯定要認識和掌握的)