回覆列表
  • 1 # 你看我獨角獸嗎

    自動化機器學習提供了一些方法和過程,使非機器學習專家可以使用機器學習,以提高機器學習的效率並加速機器學習的研究。

    近年來,機器學習(ML)取得了相當大的成就,並且越來越多的學科依賴它。但是,這一成功關鍵取決於人類機器學習專家來執行以下任務:

    預處理並清理資料。選擇並構建適當的功能。選擇合適的模型系列。最佳化模型超引數。後處理機器學習模型。嚴格分析獲得的結果。自動化機器學習的工作原理

    使用Machine Learning,您可以按照以下步驟設計和執行自動ML培訓實驗:

    確定要解決的機器學習問題:分類,預測或迴歸。

    配置用於模型訓練的計算目標,例如本地計算機,機器學習計算,遠端VM或Azure Databricks。

    配置自動機器學習引數,這些引數確定不同模型上的迭代次數,超引數設定,高階預處理/功能化以及確定最佳模型時要檢視的指標。

    提交訓練引數執行即可。

    在訓練模型期間,機器學習模型會建立許多並行管道,以嘗試不同的演算法和引數。一旦達到實驗中定義的退出閾值,它就會停止並儲存模型。

    您還可以檢查記錄的執行資訊,其中包含執行期間收集的指標。訓練執行將生成一個.pkl包含模型和資料預處理的Python序列化物件(檔案)。

    在自動進行模型構建的同時,您還可以瞭解特徵對所生成模型的重要性。

    預處理

    在每個自動機器學習實驗中,您的資料都使用預設方法進行預處理,也可以選擇透過高階預處理方式進行預處理。

    自動化的機器學習預處理步驟(功能歸一化,處理缺失資料,將文字轉換為數字等)成為基礎模型的一部分。使用模型進行預測時,將在訓練期間應用的相同預處理步驟自動應用於輸入資料。自動預處理(標準)

    在每個自動化的機器學習實驗中,您的資料都會自動縮放或標準化,以幫助演算法表現良好。在模型訓練期間,以下縮放或標準化技術之一將應用於每個模型。

    由於這些任務的複雜性通常超出了非ML專家的範圍,因此機器學習應用程式的快速增長產生了對現成的機器學習方法的需求,這些方法可以輕鬆使用而無需專家知識。我們將最終的研究領域稱為針對機器學習AutoML的漸進自動化。

  • 中秋節和大豐收的關聯?
  • 奧林匹克的意義?