首頁>Club>

回覆列表
  • 1 # 南京中博軟體

    1、Numpy:

    Numpy是Python的一個科學計算的庫,提供了矩陣運算的功能,特別是陣列介面。很多框架都是基於此庫建立的,如:tensflow

    2、SciPy:

    Scipy是致力於科學計算中常見問題的各個工具箱(基於Numpy),類似於Matlab。Scipy包含了優化器、線性代數、積分、插值、快速傅立葉變換、訊號和影象處理、統計等子模組。

    3、Pandas:

    pandas主要用於資料分析(基於Numpy),是一個最具有統計意味的工具包,某些方面優於R軟體。它提供了各種高階的工具用於進行資料分析,它可以用一兩行程式碼就能實現複雜的資料操作。Pandas有許多內建的方法用於分組統計、合併資料、資料篩選、以及時間序列操作。所有的這些操作都有出色的效能表現。因此,使用Pandas通常用於資料探勘任務。

    4、Matplotlib:

    最著名的繪圖系統,很多其他的繪圖例如seaborn(針對pandas繪圖而來)也是由其封裝而成。創世人John Hunter於2012年離世。Matplotlib和R的ggplot,lattice繪圖相比起來,操作起來比較複雜。

    5、常見機器學習庫

    1)Scikits_Learn:

    Scikits-learn,又稱為sk-learn,是一個基於Numpy與SciPy的Python庫。Sk-learn被認為是用於處理複雜資料的最優秀的機器學習庫之一。它包含了大量用於實現傳統機器學習和資料探勘任務的演算法,比如資料降維、分類、迴歸、聚類、以及模型選擇等。

    隨著時間的發展,sk-learn不斷演進。其中包括它加入了交叉驗證功能,提供了使用多個衡量指標的能力。許多的訓練方法都得到了一定的改進,如邏輯迴歸、近鄰演算法(KNN)等。

    Gradient Boosting是最好和最受歡迎的機器學習庫之一,它通過使用重新定義的基本模型和決策樹來幫助開發人員構建新演算法。 因此,有專門的庫被設計用於快速有效地實現該方法。這些庫包括LightGBM, XGBoost, 和CatBoost。這些庫互為競爭對手,同樣使用了幾乎相同的思路來解決一個共同問題。這些庫都提供了高度可擴充套件,優化和快速的梯度增強實現,使其在機器學習開發人員中很受歡迎。 因為大多數機器學習開發人員通過使用這些演算法贏得了機器學習競賽。

    6、常見深度學習庫

    1)tensorflow:

    Tensorflow把神經網路運算抽象成運算圖(Graph),一個運算圖中包含了大量的張量(Tensor)運算(而張量實際上就是N維資料的集合)。神經網路運算的本質是通過張量運算來擬合輸入張量與輸出張量之間的對映關係。

    並行運算是Tensorflow的主要優勢之一。也就是說你可以通過程式碼設定來分配你的CPU、GPU計算資源來實現並行化的圖運算。

    Tensorflow使用了類似XLA(Accelerated Linear Algebra/加速線性代數)等技術對運算過程進行過優化,以保證其能夠靈活地呼叫計算資源的同時保持高效的運算速度。

    Tensorflow框架中所有的工具庫都是用C或者C++來編寫,但它提供了用Python來編寫的介面封裝。事實上,你用Python編寫的神經網路模型最終會呼叫基於C和C++編寫的Tensorflow核心來執行運算。

    2)Keras:

    Keras本質上是對Tensorflow、Theano等基礎框架作進一步的封裝,以提供統一的API來簡化神經網路的構建與訓練。如果你打算以Tensorflow作為後端基礎框架,則必須遵循以下架構圖:

    keras提供了非常簡明的機制來表達神經網路結構,也提供了許多工具用於神經網路模型的編譯、資料的處理、以及網路結構的視覺化等等。

    再有,Keras提供了許多預處理的資料集,比如MNIST,和預訓練的模型,比如VGG、Inception、 ResNet等等。

    3)Theano:

    Theano 的工作原理與 Tensorflow 相似,但要比Tensorflow 低效。因此它不適用於生產環境。

    4)PyTorch:

    PyTorch是最大的深度學習庫,允許開發人員通過加速GPU執行張量計算,建立動態計算圖,並自動計算梯度。 除此之外,PyTorch還提供豐富的API,用於解決與神經網路相關的應用問題。

    這個深度學習庫基於Torch,這是一個用C語言實現的開源機器庫,以Lua語言作了封裝。與Tensorflow的區別在於Tensorflow用的是“靜態計算圖”的概念,而PyTorch用的是“動態計算圖”的概念。最直觀的感受是,用PyTorch來編寫的神經網路模型程式碼更像常見的Python程式碼。PyTorch是在2017年推出的,自成立以來,該庫越來越受歡迎並吸引了越來越多的機器學習開發人員。

  • 2 # python小白社群

    人工智慧現在有2個方向。

    一。機器學習

    機器學習首先要介紹的是sklearn,這個是開源的基於python語言的機器學習工具包。其中包含了有分類、迴歸、聚類、降維、模型選擇、預處理等大多數機器學習演算法包和資料處理包。

    預處理:特徵提取和歸一化。

    分類:識別某個物件屬於哪個類別

    迴歸:預測與物件相關聯的連續值屬性

    聚類:將相似物件自動分組

    降維:減少要考慮的隨機變數的數量

    模型選擇:比較,驗證,選擇引數和模型。

    每種演算法庫具體包含的具體演算法如下。

    除了sklearn外,機器學習三大神器GBDT、XGBoost、LightGBM也是參加競賽和優化演算法的必備。

    GBDT用來做迴歸預測,調整後也可以用於分類。

    XGBoost能自動利用cpu的多執行緒,而且適當改進了gradient boosting,在代價函式里加入了正則項,用於控制模型的複雜度。

    lightGBM:基於決策樹演算法的分散式梯度提升框架。相比於xgboost,速度更快 記憶體消耗更低。是現在最常用的競賽快速提升神器。

    說完了機器學習,就進入人工智慧的最神奇的深度學習了。

    二。深度學習

    在Python範圍內,深度學習的框架真是百花齊放。最正統的就是TensorFlow。Google出品,出身名門。當然,大宅門裡不一定最好用,一直盯住TensorFlow使用中為人詬病的艱難語法,有好心人出了一個優化版本,Keras,非常好用。在TensorFlow 2.0中乾脆將Keras納入豪門,和TF合二為一了。

    Theano 是諸多學習框架的“發言人”,用他寫程式碼,可以保證你的深度學習程式碼靈活實現演算法,但這個框架學習比較困難。

    如果搞科研,亞馬遜(Amazon)選擇的深度學習庫,並且也許是最優秀的庫。但Mxnet幣Theano還難學,大家掂量著來吧。

    另外,好用強大的FaceBook出品Pytorch你一定要試試。它完全地對動態圖的支援讓人耳目一新。

  • 3 # 噔噔Toast

    簡短的說吧。

    流行的python人工智慧框架有:Sklearn,tensorflow,pytorch。

    大多人數建議從Sklearn框架開始學習。

  • 中秋節和大豐收的關聯?
  • 三星s8贈送的AKG耳機素質如何?