我們只談移動嵌入式裝置。
首先明確一點,目前希望在嵌入式裝置上做訓練是不可能的,算力和功耗都難以達到要求。
目前能做的是什麼呢?在雲端訓練推送parameter到嵌入式裝置或者將訓練好的parameter內建在裝置中。目前國內基於深度學習的人臉識別已經在手機上實現。但是速度和功耗都不理想。目前很多廠商都在推出手機端的深度學習晶片,準確的說,是深度預測晶片。框架的支援不是問題,有直接自己porting的,也有直接用tensor flow lite的。需要解決的有兩個問題,一是晶片的運算速度和功耗的權衡,二是和系統整合後的功耗和運算速度。大家可能覺得這兩點不是一樣嗎?大不一樣,一即便能做好,二也很難做好。手機攝像頭是工作時啟動的,所以功耗相對經濟。如果要做人臉解鎖,camera始終處於工作態是使用者體驗最好的。但這樣帶來的功耗增加包括camera本身的功耗和ISP的功耗。這是其一,parameter動輒幾十兆,load速度是個問題。運算採用專用晶片後倒問題不大。另外,有些專家談到的閉環人工智慧,使用使用者的裝置來採集資料也是難以實現的,影象資料上傳到雲端這是很差的使用者體驗。
我們只談移動嵌入式裝置。
首先明確一點,目前希望在嵌入式裝置上做訓練是不可能的,算力和功耗都難以達到要求。
目前能做的是什麼呢?在雲端訓練推送parameter到嵌入式裝置或者將訓練好的parameter內建在裝置中。目前國內基於深度學習的人臉識別已經在手機上實現。但是速度和功耗都不理想。目前很多廠商都在推出手機端的深度學習晶片,準確的說,是深度預測晶片。框架的支援不是問題,有直接自己porting的,也有直接用tensor flow lite的。需要解決的有兩個問題,一是晶片的運算速度和功耗的權衡,二是和系統整合後的功耗和運算速度。大家可能覺得這兩點不是一樣嗎?大不一樣,一即便能做好,二也很難做好。手機攝像頭是工作時啟動的,所以功耗相對經濟。如果要做人臉解鎖,camera始終處於工作態是使用者體驗最好的。但這樣帶來的功耗增加包括camera本身的功耗和ISP的功耗。這是其一,parameter動輒幾十兆,load速度是個問題。運算採用專用晶片後倒問題不大。另外,有些專家談到的閉環人工智慧,使用使用者的裝置來採集資料也是難以實現的,影象資料上傳到雲端這是很差的使用者體驗。