回覆列表
  • 1 # 極客123456

    資料分析的方法都是一樣的。Python好用的話應該是在資料探勘機器學習等方面。Python的標準庫很好用,而且庫很專一內容很全。用過r,但覺得還是Python好用。再就是深度學習的庫基本都會支援Python,在Python上呼叫也很方便。

  • 2 # 安慶林奇

    真得只是工具而已,突破了傳統工具的一些限制。

    如果思路有限,會python也只是淪為分析的執行者而已,不能說是會分析。

  • 3 # 大資料研習社

    傳統的資料分析一般指透過Excel、SPSS或者SAS等工具,基於傳統的統計分析方法,對資料進行分析。

    相比Excel,Python能夠處理更大的資料集,還能夠建立複雜的機器學習模型。總結一下,用Python進行資料分析相對於傳統資料分析有以下三點優勢:

    豐富的資料分析擴充套件包

    Python有豐富的用於資料分析的第三方庫,例如Numpy、Pandas、Matplotlib、PyMySQL等。

    Numpy:開源的數值計算框架,能夠處理向量、矩陣等各種問題,相當於一個迷你MATLAB,小巧而且免費!

    Pandas:基於Numpy構建,為時間序列分析提供了很好的支援,對於資料的預處理、連線外部資料檔案等有強大的支援,藉助於Pandas,Python可以很方便地連線外部資料來源,例如csv、xlsx、json等檔案。

    Matplotlib:一個優秀的資料視覺化庫,能夠繪製常用的資料分析圖表,還能夠繪製三維圖形。

    PyMySQL:可以讓Python很方便地連線MySQL資料庫,對資料庫中的資料進行分析。

    簡單來說,Excel能做到的Python都能做到,但是Excel不能進行強大的程式設計及複雜的分析。但要說明的是,有些情況下,Python雖然能做到,但是不如Excel方便。

    強大的機器學習演算法庫

    很多資料分析問題,光憑傳統的統計分析方法已經無法解決,還需要藉助於更強大的機器學習演算法,而Python中的scikit-learn幾乎能夠實現所有的機器學習演算法,呼叫起來非常方便。

    監督學習演算法:線性迴歸,分類演算法如K近鄰演算法、決策樹、邏輯迴歸、SVM及整合學習方法。

    無監督學習演算法:聚類分析、關聯分析。

    大資料平臺下的分析

    隨著資料量的日益增多,很多公司採用大資料技術來處理資料,如Hadoop、Spark等。

    Python結合Spark,能夠在大資料平臺下進行海量資料的分析與挖掘。

    最後,也是最重要的,Python是免費的,絕大多數資料分析工具都是收費的,而且價格不低。

  • 中秋節和大豐收的關聯?
  • 長安九里優缺點?