“任何依靠激光雷達(開發自動駕駛)的企業註定完蛋。這些昂貴的傳感器毫無必要,就像是長了個昂貴的闌尾。”——馬斯克
早在2019年的Autonomy Day大會上,特斯拉CEO馬斯克就公開質疑過激光雷達的實用性,並率先放棄使用毫米波雷達。
目前,隨著毫米波雷達和激光雷達性能的不斷提高,成本的不斷降低,不少知名企業紛紛選擇了裝載雷達系統,特斯拉還是要堅持在純視覺的路上一直“頭鐵”?
純視覺和多傳感器融合的方案到底哪個靠譜?
實際上,答案很簡單:小孩才做選擇,成年人都要。
感知是自動駕駛的前提
自動駕駛是智能汽車的核心,要想實現自動駕駛,有兩大部分十分關鍵,一是算法,二是感知。
實際上,自動駕駛與非自動駕駛的最主要區別在於把駕駛員去掉了,那麼新增的部分就得替代人的基本功能。
而人在駕駛的過程中,主要使用的是三部分,一部分是感知,包括眼睛耳朵,一部分是大腦,進行決策,還有一部分是手腳,負責執行大腦的決策。
目前來說手腳的功能很容易替代,早就有了適合殘疾人開的車,基本原理很簡單,技術上很容易實現,只需要把決策系統用電線連上機械系統即可。
所以,眼睛耳朵,以及大腦是最為重要的部分。而且二者的關係是非常緊密的,因為大腦作為操作系統,不能做無米之炊的事情。需要依賴於人的感官系統提供的各種數據。數據的準確與否,將決定決策的質量。
所以,感知是實現自動駕駛的前提。
純視覺——人類模擬系統
在汽車感知領域,存在兩種路線。一種是特斯拉主導的純視覺系統,一種是多傳感器融合路線。
有人會覺得,純視覺怎麼可以?攝像頭很依賴光線,在天氣不好,光線差的時候收集到的信息是相對有限的,甚至可能是錯的。實際上我的第一感覺也是如此,但是仔細一想,純視覺路線的確有著強大的理論基礎。
因為我們駕駛時主要依賴的感知就是我們的眼睛,不也是一個攝像頭嗎?既然人可以利用眼睛駕駛,那麼汽車就可以依賴攝像頭駕駛。
而系統需要做的就是不斷學習。
攝像頭一個很大的缺陷在於不能測距離,或者說不準確。但是人眼同樣不具備測距的能力,兒童也會撞到物體,但是通過不斷的學習,人的大腦就有了感覺,雖然也會出錯,但已經在可容忍的範圍內。而且,隨著經驗的累積,錯誤的幾率會日益下降。
而且,人活了幾十年後就掛了,車的系統可以連續學習不止,白天學晚上學,在沙漠中學,在暴雨中學,可學習場景遠高於人類。
所以,純視覺系統具有實現的理論基礎,甚至可以說是駕駛行為模擬系統。
但是純視覺系統有兩個潛在的問題:
第一個是系統能否達到大腦的功能,需知人腦可以說是這個世界上最複雜的系統,即使駕駛功能只是用到大腦算力的一部分,那是否是人類目前技術所能達到的呢?這就很考驗車企在系統算力方面的能力,以及數據收集能力,這對於小廠商來說是不太友好的。
從這個角度來看,特斯拉目前已經實現的功能證明,純視覺路線具有可行性,且具有成長性。
第二個是攝像頭能否達到人眼的功能。人類眼睛的像素為5.76億,目前手機的像素最高也就4000萬左右,還有較大差距。不過問題不大,有些人近視了照樣可以開車,人眼強在大腦。
所以,系統和算力是純視覺系統的核心。
多傳感器融合——白要白不要
不過雷達在汽車感知中的作用要遠大於耳朵在汽車感知中的作用。雷達在測距方面的精準度和距離是人耳無法替代的,可以獲得遠比人耳更加豐富的位置信息。
雷達可以通過位置探測構建空間模型,抓住汽車在空間中所處的位置。
但是雷達並不能單獨存在,因為雷達無法識別物體,比如信號燈,指示牌等。它只能探測那有個東西,但不能探測是什麼東西,技術先進後也許可以通過構建三維來識別,但對於平面物體卻無能為力。
比如汽車感知到前方有兩塊屏幕,一塊是高價值的玻璃,一塊是廣告牌,馬上就要撞上,光靠雷達能幫助決策撞上哪一個嗎?
所以,在未來的智能汽車時代,純視覺路線應該可以實現自動駕駛功能,是可以獨立於雷達存在的自動駕駛功能,但雷達是不能獨立於視覺系統的。
所以,問題的答案就很清楚了,在純視覺的基礎上加上雷達,有什麼不好?雷達有雷達的優勢,可以彌補視覺上的缺陷,讓自動駕駛變得更加安全可靠。
所以,未來多傳感器融合是主流,畢竟都是大人,誰做選擇。有耳朵,為什麼不要耳朵?
因此,成本對汽車並不形成明顯制約,但純視覺方案並非沒有價值。特斯拉只需要妥協一下,再加上雷達就可以了,但是其他車企想要特斯拉的純視覺系統,就比較費勁了,這是壁壘。