回覆列表
  • 1 # 小知機器醫生

    在現在的時代,資料=金錢,資料的潛在價值非常大,可以幫助我們更精準的商業決策、政府決策。下面我來說說我的看法,供大家參考參考:

    1. 我個人比較推薦Python語言,為什麼?(Python語言簡潔,開發成本低,門檻低,維護成本低,利於更新升級。現在Python領域的投資也在不斷的增加,很多公司都在用Python做研發,而且現在Python也列入了中學生的教程,由此可見Python是挺有分量的)

    2. Python最大的優勢就是資料科學這個方面做的挺好的(Python是資料科學方面的首選語言,也是資料科學家必備的開發語言)

    3. Python大資料方面的知識是:

    (1)首先,採集資料作為樣本資料(這裡用到了Python爬蟲,大家都知道Python爬蟲是很容易入門和掌握的,這對於研發也有很大的便利)

    (2)其次,處理資料。(這裡用到了Python資料分析,Python有非常強大的資料分析庫,如numpy、matplotlib視覺化,pandas,還有機器學習庫等,這些都是Python的優勢所在)

    (3)最後,使用資料建模(這裡用到了Python的機器學習演算法,要成為出色的“資料科學家”,機器學習,深度學習這些演算法類的知識肯定要認識和掌握的)

  • 2 # 加米穀大資料

    在資料科學方面選擇 Python 還是 R 程式語言?

    R 語言

    R 是一種用於統計計算和圖的語言及環境。它是一個 GNU 專案,與貝爾實驗室的 John Chambers 及其同事開發的 S 語言及環境類似。R 可以視為 S 的一種不同實現。二者存在一些重要差異,但使用 S 寫的很多程式碼在 R 下執行時無需修改。

    優點:

    端到端開發到執行(一些 brokers package 允許執行,IB)

    開發速度快(比 Python 的程式碼少 60%)

    開源包多

    成熟的量化交易包(quantstrat、quantmod、performanceanalyitics、xts)

    社群最大

    使用 rcpp 可以整合 R 和 C++/C

    缺點:

    比 Python 慢,尤其是在迭代迴圈和非向量化函式中

    比 Matlab 繪圖差,難以實現互動式圖表

    建立獨立應用程式的能力有限

    Python

    Python 是一種用於通用程式設計的解釋型高階程式語言,由 Guido van Rossum 建立並於 1991 年首次釋出。Python 的設計強調程式碼可讀性,使用了大量空格。它的結構使其在大規模和小規模程式設計中都能清晰明瞭。

    優點:

    端到端開發到執行(一些 brokers package 允許執行,IB)

    開源包(Pandas、Numpy、scipy)

    交易包(zipline、pybacktest、pyalgotrade)

    最適合一般程式設計和應用程式開發

    可連線 R、C++ 和其他語言的「膠水」語言

    總體速度最快,尤其是在迭代迴圈中

    缺點:

    有一些不成熟的包,尤其是交易包

    有些包與其他包不相容或包含重疊

    在金融領域的社群比 R 小

    與 R 或 Matlab 相比,相同操作需要更多程式碼

    追蹤靜默錯誤(silent error)可能需要很長時間(即使使用視覺化偵錯程式/IDE)

    如何比較 R 和 Python

    下面是這兩種語言之間一些值得比較的因素,這並不是一個完全的列表。

    • 歷史:R 和 Python 具有明顯不同的歷史,有時候會交叉。

    • 社群:透過實際調查發現的很多複雜的社會人類學因素。

    • 效能:詳盡的比較以及為什麼比較起來這麼難。

    • 第三方支援:模組,程式碼庫,視覺化,儲存庫,組織和開發環境。

    • 用例:有些任務和工作型別適合其中一種或者另一種。

    全文:大資料科學領域,程式語言你該選 Python 還是 R?

    https://www.toutiao.com/i6582361752531370500/

    相關:

    除了R、Python,這些資料科學工具也重要

    https://www.toutiao.com/i6624359252272087559/

  • 中秋節和大豐收的關聯?
  • 說的三種形式的句子?