首頁>Club>

59
回覆列表
  • 1 # AI應用前沿

    機器學習面臨許多重要的研究挑戰。

    第一個挑戰是改進無監督學習(unsupervised learning)和強化學習(reinforcement learning)的方法。

    幾乎所有最近的研究進展都集中在所謂的“監督學習”方面,即“老師”告訴計算機每個訓練示例的正確答案。可是在許多問題上我們缺少老師,卻擁有大量資料。比如當我們試圖檢測異常交易或欺詐交易時,就需要開發可以從資料中學習而無需老師監督的“異常檢測”演算法。普遍而言,有許多類別的“無監督”學習演算法可以在沒有老師的情況下學習。

    需要更多研究的另一個領域是強化學習。強化學習通過給予獎勵或懲罰來訓練電腦執行復雜任務。在許多問題中,計算機可以自己計算獎勵,這使得計算機可以通過試錯(trial and error)而不是老師提供的例子來學習。強化學習在解決控制問題(如自動駕駛汽車、機器人以及我前面提到的火災管理問題)方面特別有價值。強化學習的方法仍然很慢且很難應用,所以研究人員正試圖尋找使其加速的方法。此外,現有的強化學習演算法只在單一時間尺度上執行,這使得這些方法難以在涉及不同時間尺度的問題中學習。例如,學習將所駕駛的汽車保持在行車道內的強化學習演算法,無法同時學習規劃從一個地點到另一個地點的路線,因為這些決策在非常不同的時間尺度上發生。分層強化學習(hierarchical reinforcement learning)研究正在試圖解決這個問題。

    機器學習的第二個主要研究挑戰是驗證(verification)、確認(validation)和信任(trust)問題。

    傳統的軟體系統經常包含錯誤(bugs),但由於軟體工程師可以讀取程式程式碼,所以他們可以設計好的測試來檢查軟體中的問題。可是機器學習的結果是一個“黑箱”(black box)系統,它接受輸入併產生輸出,但難以從外部進行檢查。因此,機器學習研究中一個非常活躍的課題是開發使機器學習系統更加容易被理解的方法(例如通過提供解釋或將其結果轉化為易於理解的形式)。還有驗證和確認黑箱系統的自動化方法的研究。最有趣的新方向之一是建立試圖破壞機器學習系統的自動化“對手”,它們常常可以發現導致已學習程式(learned program)失敗的輸入。

    與此相關的一個研究領域是“魯棒機器學習”(robust machine learning)。我們尋求即使在其預設被違反時仍然能良好工作的機器學習演算法。機器學習中最大的假設是,訓練資料是獨立分佈的且是未來系統輸入的典型範例。幾位研究人員正在探索使機器學習系統在這種假設不成立時更加穩健(魯棒)的方法。

    機器學習的第三個主要挑戰是偏見問題。

    採集資料的方式往往受到偏見的影響。例如關於新藥有效性的試驗可能只在男性中進行。機器學習系統可能會因此學習到,這些藥物只對35歲以上的人有效。但在女性中,效果可能會完全不同。一家公司可能從現有的客戶那裡採集資料,但這些資料對於預測新客戶的行為方式可能並沒有用,因為新客戶可能在某些重要的方面和舊客戶有所不同(更年輕、更熟悉網際網路等)。目前的研究正在開發一些方法來檢測這類偏見,並創造擺脫其影響的學習演算法。

  • 中秋節和大豐收的關聯?
  • Java語言可以在工業網際網路中使用到嗎?