自動駕駛的深度學習,還有多大的提升空間?
近日,特斯拉宣佈收購專注於開發計算機視覺技術的初創公司DeepScale(成立4年、擁有約40名員工,目前累計融資2000萬美元左右),似乎給出了上述問題的答案。
當談到自動駕駛量產時,對於深度學習或者神經網路來說,必須要解決兩個問題:一是能夠降低功耗;二是能否降低記憶體和算力的要求。
這對於一貫“精打細算”的特斯拉來說,至關重要。因為一些行業人士將特斯拉“拒絕使用鐳射雷達”與目前該感測器高昂的成本掛鉤。
而堅持端到端深度學習(從感知到決策)的特斯拉,仍然需要一些演算法上的改進,並且充分利用其不斷累積的車主駕駛資料,這些資料其中還有大量的邊緣資料。
DeepScale或許正是解決特斯拉目前遭遇到的技術和量產瓶頸的幫手之一。該公司創始人Forrest Iandola宣佈,他已加入特斯拉的自動駕駛團隊,成為高階機器學習科學家。
DeepScale在小型、低成本的汽車級感測器和處理器上使用高效的深度神經網路(DNNs)來轉換感知系統的準確性,這些系統實時地解釋和分類感測器資料。在此過程中,DeepScale正將駕駛員協助和自動駕駛技術應用到所有價位的量產汽車上。
DeepScale聯合創始人兼執行長Forrest Iandola在加州大學伯克利分校獲得博士學位,研究深度神經網路和計算機視覺系統。在與他的指導老師,現在的聯合創始人Kurt Keutzer一起工作的時候,Forrest在可擴充套件的訓練和深度神經網路的高效實現方面取得了一定的成績。
比如,Forrest釋出的一種名為SqueezeNet的小型DNN,已經成為將深度學習應用於智慧手機的遊戲規則改變者。而DeepScale的目標,就是將小型DNN注入量產汽車。
目前,Squeezenet已經衍生出一系列應用於自動駕駛感知的各種DNN,包括用於物件檢測的SqueezeDet和用於鐳射雷達資料語義分割的SqueezeSeg,以及一個更簡單的影象分類網路,可以為移動和嵌入式硬體(稱為SqueezeNext)進行優化。
今年1月,DeepScale釋出了它的第一款正式車載產品,一個名為Carver21的用於駕駛員輔助系統的模組化深度學習感知軟體組合,專門用來優化自動駕駛汽車前置攝像頭的資料處理。
在這款軟體的模組化和效率方面,三個DNN在NVIDIA Drive AGX Xavier處理器上並行執行,DeepScale聲稱,Carver21只需使用Xavier 2%的處理能力(功耗小於5W),就可以實現“高速公路自動駕駛和自動泊車等功能”。
此前,DeepScale與一級供應商、汽車製造商和半導體供應商建立了多項戰略合作伙伴關係,提供自動駕駛感知解決方案,其中包括偉世通和海拉,此外還有福特、博世和三星的合作。
這些企業的共同目標就是,找到一條降低成本的途徑,將人工智慧真正量產到各個價位的車型。尋求與DeepScale的合作,這些企業看中了這家初創公司既可以提供整套感知軟體堆疊,也可以提供模組化解決方案補充現有系統。
這種對高效能、低資源、開放式的自動駕駛計算機視覺的技術研發實力,使DeepScale非常適合特斯拉雄心勃勃的、以視覺為中心的自動駕駛技術開發方法。此外,有訊息稱,DeepScale還可能為特斯拉帶來一種新的測試方法,類似於功能安全評估。
對於特斯拉來說,面臨著最短時間內實現最艱鉅目標的巨大壓力(年底或明年推出全自動駕駛),尤其是試圖通過一個有限的感測器組合(低成本),為完全自動駕駛提供一個“量產解決方案”。
尤其是去年夏天,在埃隆·馬斯克迫使自動駕駛部門負責人斯圖爾特·鮑爾斯(Stuart Bowers)離開公司後,特斯拉的自動駕駛團隊接連失去數員大將以及一部分工程師。
人才流失引發了特斯拉投資者對該公司雄心勃勃的自動駕駛計劃的不確定未來的猜測和恐慌。或許,此時選擇收購也是另一種“無奈之舉”。
當然,從另一角度來說,特斯拉收購DeepScale反映出全球自動駕駛技術領域對人才的激烈競爭,這已經促使早些時候蘋果公司收購了drive.ai和Waymo將收購Anki,並可能會看到更多的類似案例。
這也說明了人工智慧初創公司同樣面臨“商業化”落地的瓶頸,“大魚吃小魚”或將成常態。
和DeepScale類似,Drive.ai(今年被蘋果公司收購)也成立於四年前的2015年4月,一開始是和很多人工智慧初創公司一樣做計算機視覺,隨後開始把深度學習軟體應用到自動駕駛汽車,從識別物體到做出決策。
Drive.ai成型的產品是一個人工智慧工具包,包括一個硬體和軟體平臺:控制系統、感測器和一個人機介面。此前,Lyft也和Drive.ai有合作關係,雙方在2017年曾探討組建了一個10輛自動駕駛車組成的免費出行服務車隊。
Drive.ai還建立了一些原創的模擬程式,為其車輛引入了一些不尋常的情況,比如駕駛雙停或轉向急轉彎的車輛。它還建立了場景,包括“不太可能”的人類行為,比如人們衝到車流前面和物體滾到路上。
然而,自動駕駛擴張之路充滿無數障礙,尤其是對於一些初創公司來說,更是如此。
以Drive.ai從事的端到端深度學習技術為例,面臨的最大挑戰之一是,用於該技術的深度學習演算法採用了黑盒方法。這意味著只有輸入和輸出是可知的,而使用的過程從未被揭示。
就我們目前對電腦科學的理解而言,這些系統的過程要麼是無法觀察到的,要麼是無法解釋的。深度學習的另一個挑戰或限制是長尾問題。在這種情況下,每次罕見的事件都需要大量的資料來理解它或成功地規避。
這意味著深度學習在自動駕駛上的大規模應用,仍需要大量的資料訓練、研發資金和量產經驗的支援。而在這個領域,特斯拉是目前為止最為激進的支持者(端到端深度學習),或許DeepScale只是一個開端。