準確來講,AI演算法在理論分類上應該是基於資料的(data-based)演算法,傳統演算法更多的是基於模型的(model-based)演算法,其演算法出發點就不同。
這個問題其實挺有意思的,我也一直有這方面的疑問。最近研究生的學習我感覺人工智慧演算法在傳統控制方面,至少線性系統研究較少的原因我感覺有以下幾點
1.人工智慧演算法基於大資料訓練,而現有的運動控制中,比如飛控,拿到實際實驗資料的成本極高,大資料的獲取非常困難。2.現在控制界對穩定性的數學證明有一種近乎極端的偏執,而人工智慧演算法在穩定性上很難進行數學證明。3.對於線性系統或者近似線性系統,魯棒容錯控制的研究已經比較透徹,能夠對系統進行數學上的一種最優抗干擾設計。而ai演算法,當訓練資料集不夠精確的時候,其抗干擾能力有多強,還沒有一個數學上的證明。這一點也是未來ai演算法的一個主要研究方向吧。
基於以上,ai演算法的優勢應該在於強耦合強非線性系統控制,對於這樣的系統控制我接觸的也比較少,還需要其他大佬們介紹。
————————————————————————————
以上為原答案,工作了幾年接觸了很多強非線性的機器人控制,對這個問題有一些新的感悟吧。
現如今對於機器人控制能使用的機器學習基本已經比較明確了。首先說一下控制機器人運動的三個步驟,分別是感知、決策與執行。
感知層包括視覺定位、慣性導航甚至slam等一系列的導航定位方法,這一層使用一般的深度學習是可行的,特別是基於視覺等的定位技術,機器學習的引入極大的提升了機器人的感知導航定位能力。
決策層包括路徑規劃、軌跡規劃與避碰等。這一層普通的用於影象處理的深度學習不太行,如果考慮機器學習的話更多的是利用強化學習,搭建模擬環境、物理環境給agent進行自我學習進化(但對於機器人來說模擬環境本來就是不準確的,當環境不準確時強化學習的抗干擾性如何這又是一個研究內容,如果使用物理環境的話可能會出現不可預見的機器人損壞,畢竟這裡的物理環境下強化學習不像Alpha Go可以全靠計算機實現了)。當然這一層傳統最佳化與搜尋演算法研究的也很多,算是機器學習與傳統演算法二者55開的領域。
最後一層是執行層,這就是傳統控制演算法大放異彩的領域了,機器學習方法在這一層與傳統演算法在穩定性、魯棒性分析以及工程應用上差距極大,暫時沒有能替代傳統演算法的趨勢。
準確來講,AI演算法在理論分類上應該是基於資料的(data-based)演算法,傳統演算法更多的是基於模型的(model-based)演算法,其演算法出發點就不同。
這個問題其實挺有意思的,我也一直有這方面的疑問。最近研究生的學習我感覺人工智慧演算法在傳統控制方面,至少線性系統研究較少的原因我感覺有以下幾點
1.人工智慧演算法基於大資料訓練,而現有的運動控制中,比如飛控,拿到實際實驗資料的成本極高,大資料的獲取非常困難。2.現在控制界對穩定性的數學證明有一種近乎極端的偏執,而人工智慧演算法在穩定性上很難進行數學證明。3.對於線性系統或者近似線性系統,魯棒容錯控制的研究已經比較透徹,能夠對系統進行數學上的一種最優抗干擾設計。而ai演算法,當訓練資料集不夠精確的時候,其抗干擾能力有多強,還沒有一個數學上的證明。這一點也是未來ai演算法的一個主要研究方向吧。
基於以上,ai演算法的優勢應該在於強耦合強非線性系統控制,對於這樣的系統控制我接觸的也比較少,還需要其他大佬們介紹。
————————————————————————————
以上為原答案,工作了幾年接觸了很多強非線性的機器人控制,對這個問題有一些新的感悟吧。
現如今對於機器人控制能使用的機器學習基本已經比較明確了。首先說一下控制機器人運動的三個步驟,分別是感知、決策與執行。
感知層包括視覺定位、慣性導航甚至slam等一系列的導航定位方法,這一層使用一般的深度學習是可行的,特別是基於視覺等的定位技術,機器學習的引入極大的提升了機器人的感知導航定位能力。
決策層包括路徑規劃、軌跡規劃與避碰等。這一層普通的用於影象處理的深度學習不太行,如果考慮機器學習的話更多的是利用強化學習,搭建模擬環境、物理環境給agent進行自我學習進化(但對於機器人來說模擬環境本來就是不準確的,當環境不準確時強化學習的抗干擾性如何這又是一個研究內容,如果使用物理環境的話可能會出現不可預見的機器人損壞,畢竟這裡的物理環境下強化學習不像Alpha Go可以全靠計算機實現了)。當然這一層傳統最佳化與搜尋演算法研究的也很多,算是機器學習與傳統演算法二者55開的領域。
最後一層是執行層,這就是傳統控制演算法大放異彩的領域了,機器學習方法在這一層與傳統演算法在穩定性、魯棒性分析以及工程應用上差距極大,暫時沒有能替代傳統演算法的趨勢。