圖 4:無人駕駛汽車 IARA 使用的道路網格地圖和 RDDF 路徑。綠色和紅色區域表示道路網格地圖,黑點是 RDDF 路徑點,這是從道路網格地圖中自動提取出來的。
圖 5:自動車輛專案 [BEN14] 使用的 lanelet(車道片段)地圖的圖模型。紅色和綠色點分別表示車道片段 A、B、C 的左和右路沿。該圖展示了 A 和 C 交匯成 B 的情況。
2) 道路地圖建立
D 移動目標跟蹤
移動目標跟蹤(MOT)子系統(也被稱為檢測與跟蹤多目標/DATMO)負責檢測和跟蹤自動駕駛汽車所處環境中的移動障礙物的姿態。這個子系統對自動車輛的決策而言至關重要,能幫汽車避免與可能移動的物體(比如其它汽車和行人)發生碰撞。移動障礙物隨時間的位置變化通常是根據測距感測器(比如 LIDAR 和 RADAR)或立體相機捕獲的資料估計的。來自單目相機的影象能提供豐富的外觀資訊,這可用於改善對移動障礙物的假設。為了應對感測器測量的不確定性,可將貝葉斯濾波器(比如卡爾曼或粒子濾波器)用於狀態預測。文獻中已提出了多種用於 MOT 的方法。這裡我們將給出近十年最新發表的相關文獻。更早期的研究可參閱 Petrovskaya et al. [PET12]、Bernini et al. [BER14] 和 Girão et al. [GIR16]。
自動駕駛載具或將引爆人類的下一次出行方式革命,而我們目前又已經走到了哪一步?近日,巴西聖埃斯皮裡圖聯邦大學的研究者在 arXiv 上釋出了一篇自動駕駛汽車研究情況總結,並簡單梳理了產業界的進展。本文摘取了其中的主幹部分,更詳細的論述請參閱原文。
論文地址:https://arxiv.org/abs/1901.04407
我們調查了有關自動駕駛汽車的研究文獻,重點關注的是自 DARPA 挑戰賽以來開發的配備有可歸類為 SAE 3 級或更高階的自主系統的自動汽車。自動駕駛汽車的自主系統的架構通常可分為感知系統和決策系統。感知系統通常分為負責自動駕駛汽車定位、靜態障礙物地圖測繪、移動障礙物檢測與跟蹤、道路地圖測繪、交通訊號檢測與識別等多種任務的許多子系統。決策系統通常也分為許多子系統,分別負責路線(route)規劃、路徑(path)規劃、行為選擇、運動規劃、控制等。在本調查報告中,我們會介紹自動駕駛汽車的自主系統的典型架構。我們還會總結在感知和決策相關方法方面的研究成果。此外,我們還將詳細描述巴西聖埃斯皮裡圖聯邦大學(UFES)的汽車 IARA 的自主系統的架構。最後,我們會列出科技公司開發的和媒體報道的突出的自動駕駛研究汽車。
1 引言自動汽車(也被稱為無人駕駛汽車和自動駕駛汽車)自 1980 年代中期以來已經得到了全球很多大學、研究中心、汽車公司和其它行業公司的研究和開發。過去二十年裡重要的自動駕駛研究平臺案例有德國慕尼黑聯邦國防軍大學的汽車 [DIC87]、Navlab 的移動平臺 [THO91]、慕尼黑聯邦國防軍大學和戴姆勒-賓士的汽車 VaMP 和 VITA-2 [GER14]、義大利帕維亞大學和帕爾馬大學的汽車 ARGO [BRO99]、慕尼黑聯邦國防軍大學的載具 VaMoRs 和 VaMP [GRE00]。
為了促進自動駕駛汽車技術的發展,美國國防高階研究計劃局(DARPA)在 2000 年代組織了三次競賽。第一次名為 DARPA Grand 挑戰賽,於 2004 年在美國莫哈維沙漠舉辦,要求無人駕駛的汽車在 10 小時的時間限制內跑完一條沙漠通道中的長 142 英里的道路。所有參賽車輛都在前幾英里內失敗了。
DARPA Grand 挑戰賽 [BUE07] 在 2005 年再次舉辦,要求機器人車輛跑過一條長 132 英里的路線,其中有平地、乾涸湖床和山路,包含 3 個狹窄通道和超過 100 個左右急轉彎。這次比賽共有 23 輛決賽者,其中 4 輛車在規定時間內跑完了賽道。斯坦福大學的汽車 Stanley [THR07] 獲得了第一名,卡內基·梅隆大學的汽車 Sandstorm 和 H1ghlander 分列第二和第三名。
第三場比賽名為 DARPA Urban 挑戰賽 [BUE09],於 2007 年在美國加州前喬治空軍基地舉辦,要求無人駕駛車輛透過一條長 60 英里的模擬城市環境的路線,其中也有其它無人駕駛車輛和人類駕駛的汽車,時間限制為 6 小時。這些汽車必須遵守加州的交通規則。這場比賽有 11 輛決賽者,其中 6 輛在規定時間內跑完了路線。卡內基·梅隆大學的汽車 Boss [URM08] 獲得第一,斯坦福大學的汽車 Junior [MON08] 第二,弗吉尼亞理工大學的汽車 Odin [BAC08] 第三。儘管這些比賽中的挑戰遠比人們日常交通中所遇到的情況簡單,但它們已被譽為自動駕駛汽車發展的里程碑。
自 DARPA 這些挑戰賽以來,又出現了很多自動駕駛汽車競賽和試驗。相關的案例包括:從 2006 年舉辦至今的歐洲陸地機器人試驗(ELROB)[ELR18]、2009 年到 2013 年舉辦的智慧載具未來挑戰賽 [XIN14]、2009 年到 2017 年舉辦的自動化載具競賽 [AUT17]、2010 年的現代自主汽車挑戰賽 [CER11]、2010 年的 VisLab 洲際自主汽車挑戰賽 [BRO12]、2011 年和 2016 年的大型合作駕駛挑戰賽(GCDC)[GCD16]、2013 年的公共道路城市無人駕駛汽車測試 [BRO15]。同時,全世界的學術界和產業界都在加速研究無人駕駛汽車。研究機器人汽車的重要大學包括卡內基·梅隆大學 [CAR18]、斯坦福大學 [STA18]、麻省理工學院 [MIT17]、弗吉尼亞理工大學 [VIR18] 和 FZI 資訊科技研究中心 [FZI18]。主要公司包括谷歌 [WAY18]、Uber [UBE18]、百度 [APO18]、Lyft [LYF18]、Aptiv [APT18]、特斯拉 [TES18]、英偉達 [NVI18]、Aurora [AUR18]、Zenuity [ZEN18]、戴姆勒和博世 [BOS18]、Argo AI [ARG18]、Renesas Autonomy [REN18]、Almotive [AIM18]、AutoX [AUT18]、Mobileye [MOB18]、Ambarella [AMB18]、Pony.ai [PON18]、京東 [JD18]、Idriverplus [IDR18]、豐田 [TOY18]、福特 [FOR18]、沃爾沃 [VOLV18]、梅賽德斯-賓士 [MER18]。
儘管大多數有關自動駕駛汽車的大學研究都來自美國、歐洲和亞洲,但巴西等國家也有一些相關研究。巴西的自動駕駛汽車研究平臺相關案例包括米納斯·吉拉斯聯邦大學(UFMG)的汽車 CADU [LIM10] [SAB10] [LIM13] [DIA15a]、聖保羅大學的汽車 CARINA [FER14] [MAS14] [SHI16] [HAT17] 和聖埃斯皮裡圖聯邦大學(UFES)的汽車 IARA [MUT16] [CAR17] [GUI16] [GUI17]。IARA 是巴西首輛在城市道路和公路上自動行駛了 74 公里的無人駕駛汽車。
為了衡量自動駕駛汽車的自主水平,SAE International(之前簡稱 SAE,即汽車工程師學會)釋出了一個基於人類駕駛員干預量和人類注意需求量的分類體系,其中自動駕駛汽車的自主程度可劃分為 0 級(汽車的自主系統會發出警報,也許還能臨時干預,但無法維持對汽車的控制)到 5 級(任何情況下都無需人類干預)[SAE16]。在這篇論文中,我們調查了釋出在文獻中的自動駕駛汽車研究,重點關注的是自 DARPA 挑戰賽以來開發的配備有可歸類為 SAE 3 級或更高階的自主系統的自動汽車 [SAE16]。
自動駕駛汽車的自主系統的架構通常可分成兩大類:感知系統和決策系統 [PAD16]。感知系統通常分為負責自動駕駛汽車定位、靜態障礙物地圖測繪、移動障礙物檢測與跟蹤、道路地圖測繪、交通訊號檢測與識別等多種任務的許多子系統。決策系統通常也分為許多子系統,分別負責路線(route)規劃、路徑(path)規劃、行為選擇、運動規劃、控制等。但是這樣的劃分方式有些模糊,文獻中也還存在一些不同的劃分方式 [PAD16]。
在這項調查中,我們給出了自動駕駛汽車的自主系統的典型架構。我們還總結了感知和決策相關方法的研究。
2 自動駕駛汽車架構概述這一節將概述自動駕駛汽車的自主系統的典型架構,並將介紹感知系統、決策系統以及它們的子系統所負責的任務。
圖 1:典型的多層式的自動駕駛汽車架構。TSD 表示交通訊號檢測,MOT 表示移動目標跟蹤。
圖 1 展示了自動駕駛汽車的自主系統的典型架構,其中不同顏色的模組分別表示感知系統和決策系統 [PAD16]。感知系統負責估計汽車的狀態和創造環境的內部表徵(指自動駕駛汽車系統內部),這要用到機載感測器(比如光探測和測距(LIDAR)、無線電探測和測距(RADAR)、相機、全球定位系統(GPS)、慣性測量單元(IMU)、里程錶等)收集的資料和有關感測器模型、道路網、交通規則、車輛動態等的先驗資訊。決策系統負責將車輛從初始位置駕駛到使用者定義的終點,這需要考慮汽車的狀態和環境的內部表徵,還要考慮交通規則和乘客舒適度等情況。
為了在環境中駕駛汽車,決策系統需要知曉汽車所在的位置。定位器(Localizer)模組負責估計與環境的靜態地圖相關的汽車狀態(姿態、線速度、角速度等)。這些靜態地圖(即圖 1 中的 Offline Maps)會在自動操作前自動計算得到,通常會使用自動駕駛汽車自身的感測器,但通常也需要人工標註(比如人行橫道或交通燈的位置)或編輯(比如移除感測器捕獲的非靜態目標)。自動駕駛汽車可能使用一個或多個不同的離線地圖來進行定位,比如佔用情況網格地圖、緩解地圖或地標地圖。我們將在第 3.B 節介紹用於生成這些地圖的方法的相關文獻。
定位器模組的輸入包括離線地圖、感測器資料和平臺的里程資料,生成的輸出是自動駕駛汽車的狀態(圖 1)。需要重點指出,儘管 GPS 也許有助於定位過程,但由於高大樹木、建築、隧道等造成的干擾會使得 GPS 定位不可靠,在城市環境中只使用 GPS 是不足以合適定位的。我們將在第 3.A 節介紹有關定位技術的文獻。
地圖測繪器(Mapper)模組以離線地圖和車輛狀態為輸入,生成線上地圖。這個線上地圖通常是離線地圖與使用感測器資料和汽車當前狀態線上計算出的佔用情況網格地圖中的資訊的融合。我們將在第 3.B 節介紹計算線上地圖的方法的相關文獻。可以預期這個線上地圖僅包含環境的靜態表徵,因為這可能有助於決策系統的某些模組的運作。為了實現檢測以及移除線上地圖中的移動目標,通常會使用一個移動目標跟蹤(Moving Objects Tracking/MOT)模組(圖 1)。第 3.D 節介紹的文獻的主題即為自動駕駛汽車的移動目標檢測和跟蹤方法。
自動駕駛汽車要必須能識別和遵守水平(車道線)和垂直(即限速標誌、交通訊號燈等)的交通訊號。交通訊號檢測(Traffic Signalization Detection/TSD)模組負責交通訊號的檢測和識別。我們將在第 3.E 節介紹交通訊號檢測和識別方法相關文獻。
給定使用者在離線地圖中定義的終點(Final Goal),路線規劃器(Route Planner)會在離線地圖中計算出一條從當前狀態到達終點的路線。路線(route)是指一系列路徑點的序列,其中每個點都是離線地圖中的一對座標。我們將在第 4.A 介紹路線規劃方法的文獻。
給定一條路線,路徑規劃器(Path Planner)模組會根據汽車狀態和環境的內部表徵以及交通規則計算一組路徑。路徑(path)是指一系列姿態(pose)的序列,其中每個姿態都是離線地圖中的一個座標對和汽車在該座標對定義的位置所需的方位。中間的路徑 P_c 是路線儘可能最好的路徑,其左側的路徑和右側的路徑都是與 P_c 起始姿態相同的路徑,向左或向右的路徑具有不同的激程序度。我們將在第 5.B.1 節介紹有關路徑規劃方法的文獻。
行為選取器(Behavior Selector)模組負責選擇當前的駕駛行為,比如車道保持、交叉路口處理、交通燈處理等。其做法是選擇一條路徑,當前狀態之前幾秒(大約 5 秒)的一個姿態——決策範圍,和在該姿態所需的速度。姿勢和相關聯的速度的配對被稱為目標(Goal)。行為選取器選擇目標時會在決策時間範圍內考慮當前的駕駛行為以及避免與環境中的靜止和移動障礙物相撞。
運動規劃器(Motion Planner)模組負責計算一個從汽車的當前狀態到當前目標的軌跡,這個軌跡遵循行為選取器定義的路徑,滿足汽車的運動學和動力學約束條件,並能保證乘客舒適。軌跡 T 是一個指令序列 c_k = (v_k, φ_k, t_k),其中 v_k 是在時間 t 的所需速度,φ_k 是在時間 t 的所需轉向角度,t_k 是 c_k 的持續時間。一個軌跡能讓汽車平滑且安全地從當前狀態到達目標。我們將在第 4.B.2 節介紹有關運動規劃的方法的文獻。
避障器(Obstacle Avoider)模組接收運動規劃器計算出的軌跡,並在有必要時對其進行修改(通常是降低速度)以避開障礙物。有關執行避障功能的方法的文獻不多。我們將在第 4.B 看到一些相關文獻。
最後,控制器(Controller)模組根據被避障器修改後的運動規劃器軌跡計算併發送工作指令,以控制方向盤、油門和剎車的執行器,使車輛能以物理世界允許的方式儘可能好地執行修改後的軌跡。我們將在第 4.C 節介紹低階汽車控制方法的相關文獻。
下面我們將按感知系統和決策系統兩大組別詳細介紹各個模組和用於實現它們的技術及變體技術。
3 感知在這一節,我們將介紹文獻中為自動駕駛汽車的感知系統提出的重要方法,包括定位器(或定位)、離線障礙物地圖測繪、道路地圖測繪、移動障礙物跟蹤、交通訊號檢測與識別。
A 定位
定位模組負責估計自動駕駛汽車相對於地圖或道路(比如表示成路沿或其它道路標記)的姿態(位置和方向)。大多數通用的定位子系統都基於 GPS。但是,總的來說,這些系統不能用於城市中的自動駕駛汽車,因為在有遮擋的區域不能確保有 GPS 訊號,比如樹下、城市峽谷(大型建築之間的區域)、隧道。
文獻中已經提出了多種不依賴 GPS 的定位方法。它們主要可分為三類:基於 LIDAR 的方法、基於 LIDAR 加相機的方法、基於相機的方法。基於 LIDAR 的定位方法僅依靠 LIDAR 感測器,這種方法測量準確且易於處理。但是,儘管 LIDAR 行業確實在努力降低生產成本,但與相機相比仍然價格高昂。在典型的基於 LIDAR 加相機的定位方法中,LIDAR 資料僅被用於構建地圖,估計自動駕駛汽車相對於地圖的位置則會使用相機資料,這能夠降低成本。基於相機的定位方法很便宜廉價,但通常沒那麼精確可靠。
1) 基於 LIDAR 的定位
2) 基於 LIDAR 加相機的定位
3) 基於相機的定位
B 離線障礙物地圖測繪
離線障礙物地圖測繪子系統負責計算自動駕駛汽車所在環境中的障礙物地圖。這個子系統是基礎系統,讓自動車輛有能力安全地駛過公共道路而不與障礙物(比如標牌、路沿)發生碰轉。障礙物地圖包含汽車也許可以駛過或不能駛過的位置的資訊,並區分了自由區域(可通行)與已佔用區域。汽車必須一直處於自由區域內。障礙物地圖是根據地圖測繪階段的感測器資料構建的,並會被儲存起來以待自動操作階段使用。
狀態空間的表徵形式通常可分為拓撲表徵 [CUM08] [MIL12] [FORE18] 和度量表徵 [HOR13] [MUT16] [SCH18]。拓撲表徵是將狀態建模為圖(graph),其中節點代表重要的位置(或特徵),邊表示它們之間的拓撲關係(比如位置、方向、接近程度和連通性)。這些分解的解析度取決於環境的結構。度量表徵通常是將狀態空間分解成規則間隔的單元。這種分解形式並不取決於特徵的位置和形狀。度量表徵的空間解析度往往高於拓撲表徵的。其易變性和高效性使其成為了最常用的空間表徵。要了解用於建立拓撲表徵的主要的基於視覺的方法,讀者可參閱 Garcia-Fidalgo and Ortiz [FID15]。這裡我們總結了用於計算度量表徵的最重要方法,這些方法又可進一步分為離散和連續空間表徵。
1) 離散空間度量表徵
2) 連續空間度量表徵
C 道路地圖測繪
道路測繪子系統負責收集自動駕駛汽車周圍的道路和車道資訊,並使用幾何和拓撲屬性將它們表示在地圖中,包括互連的區域和受限區域。道路地圖測繪子系統的主要主題是地圖表徵和地圖建立。
1) 道路地圖表徵
圖 4:無人駕駛汽車 IARA 使用的道路網格地圖和 RDDF 路徑。綠色和紅色區域表示道路網格地圖,黑點是 RDDF 路徑點,這是從道路網格地圖中自動提取出來的。
圖 5:自動車輛專案 [BEN14] 使用的 lanelet(車道片段)地圖的圖模型。紅色和綠色點分別表示車道片段 A、B、C 的左和右路沿。該圖展示了 A 和 C 交匯成 B 的情況。
2) 道路地圖建立
D 移動目標跟蹤
移動目標跟蹤(MOT)子系統(也被稱為檢測與跟蹤多目標/DATMO)負責檢測和跟蹤自動駕駛汽車所處環境中的移動障礙物的姿態。這個子系統對自動車輛的決策而言至關重要,能幫汽車避免與可能移動的物體(比如其它汽車和行人)發生碰撞。移動障礙物隨時間的位置變化通常是根據測距感測器(比如 LIDAR 和 RADAR)或立體相機捕獲的資料估計的。來自單目相機的影象能提供豐富的外觀資訊,這可用於改善對移動障礙物的假設。為了應對感測器測量的不確定性,可將貝葉斯濾波器(比如卡爾曼或粒子濾波器)用於狀態預測。文獻中已提出了多種用於 MOT 的方法。這裡我們將給出近十年最新發表的相關文獻。更早期的研究可參閱 Petrovskaya et al. [PET12]、Bernini et al. [BER14] 和 Girão et al. [GIR16]。
用於 MOT 的方法主要可分為六類:
1)基於傳統方法的 MOT
2)基於模型的 MOT
3)基於立體視覺的 MOT
4)基於網格地圖的 MOT
5)基於感測器融合的 MOT
6)基於深度學習的 MOT
E 交通訊號檢測與識別
交通訊號檢測與識別子系統負責檢測和識別交通規則定義的訊號,使汽車可以遵守交通法規做出正確的決策。與交通訊號相關的任務有很多,本文將介紹這三大主要主題:
1) 交通訊號燈檢測與識別
2) 交通標誌檢測與識別
3) 路面標記檢測與識別
4 決策在這一節,我們將給出自動駕駛汽車決策系統文獻中報告的相關技術,包含路線規劃、行為選取、運動規劃和控制子系統。
A 路線規劃
路線規劃子系統負責計算出一條穿過道路網的路線,讓自動駕駛汽車能從起始位置到達使用者操作者定義的終點位置。如果將道路網表示為一個加權的有向圖,其邊權重表示遍歷一個道路片段的成本,則計算路線的問題就可約簡為在一個加權有向圖中尋找最短路徑的問題。但是,對於大型道路網,經典最短路徑演算法(比如 Dijkstra [DIJ59] 和 A* [HAR68])的複雜性時間是不實用的。
用於道路網中路線規劃的方法能在查詢時間、預處理時間、空間用量、對輸入變化的穩健性等方面提供不同的權衡。這些方法主要可分為四類 [BAS15]:目標導向的方法、基於分割因子的方法、分層方法、bounded-hop 方法;也可以組合這些方法。
表 1:西歐的路線規劃技術的表現 [BAS15]
B 運動規劃
運動規劃子系統負責計算一條路徑或軌跡,使自動駕駛汽車能從當前狀態到達行為選取子系統定義的下一個區域性目標狀態。運動規劃執行的是區域性駕駛行為,滿足汽車的運動學和動力學限制,保證乘客舒適,以及避免與環境中的靜止和移動障礙物碰撞。
運動規劃可以是路徑或軌跡。路徑是一個汽車狀態序列,不是定義汽車狀態隨時間變化的方式。這個任務可以委託給其它子系統(比如行為選取子系統),或者可將速度分佈定義為曲率以及與障礙物的接近程度的函式。軌跡是指定了汽車狀態隨時間的演變情況的路徑。
文獻中提出了多種用於運動規劃的方法。我們將介紹為路上運動規劃設計的且使用真實自動車輛實驗評估過的方法。讀者可參閱 González et al. [GON16] 和 Paden et al. [PAD16] 瞭解對這些方法的更全面的總結。
1) 路徑規劃
2) 軌跡規劃
C 控制
在自動駕駛汽車領域,控制是指工程開發領域的自動控制背後的理論,這涵蓋了沒有連續直接人類干預的操作和調節過程的機制的應用。在最簡單的自動控制形式中,控制子系統會比較該過程的輸出與預期輸入,並使用其中的誤差(該過程的輸出與預期輸入的差異)來修改該過程的輸入,使得該過程即使在存在擾動時也能保持在設定點。在自動車輛中,通常會將自動控制理論應用於路徑跟蹤和硬體驅動方法。路徑跟蹤方法的作用是在汽車模型等地方存在不準確的情況時穩定運動規劃的執行。硬體驅動控制的作用是在汽車模型等地方存在不準確的情況時計算執行運動規劃的轉向角度、油門和剎車制動器輸入。
路徑跟蹤方法也被稱為控制技術,因為其使用了自動控制理論,並將路徑視為所要控制的訊號。但是,在自動駕駛領域將其稱為路徑跟蹤方法更合適,以便將它們與硬體驅動方法分開。
1) 路徑跟蹤方法
圖 6:Pure Pursuit 方法的幾何描述
2)硬體驅動控制方法
5 UFES 汽車 IARA 的架構我們將在這一節詳細描述 UFES 的汽車 IARA 的自主系統的架構。
圖 7:智慧和自動機器人汽車(IARA)是巴西首輛在城市道路和公路上行駛了 74 公里的自動駕駛汽車。這裡有一段 IARA 自動執行的影片:https://youtu.be/iyKZV0ICysc
6 產業界開發的自動駕駛汽車有很多公司展現了研發自動駕駛汽車和/或投資相關技術的興趣,以期從中獲利。相關企業既有汽車製造商與生產感測和計算硬體的公司,也有開發輔助駕駛和自動駕駛、娛樂和車載廣告公司軟體的公司。
所涉及的公司包括 Torc、谷歌、百度、Uber、Lyft、Aptiv、滴滴、特斯拉、樂視、英偉達、Aurora、Zenuity、戴姆勒、博世、Argo AI、Renesas Autonomy、本田、Visteon、AImotive、AutoX、Mobileye、Ambarella、Pony.ai、Navya、Transdev、京東、豐田、福特、沃爾沃和梅賽德斯-賓士。