首頁>科技>

隨著汽車智慧化演進,未來軟體在汽車上佔的比重會越來越大,“軟體定義汽車”正愈發成為人們關注的時代趨勢。

近日,量子位以“重啟 | 重塑 | 重構”為主題,發起第一屆 MEET 2021 智慧未來大會。地平線聯合創始人兼技術副總裁黃暢應邀參加活動並發表主題演講,分享了在軟體 2.0 時代 AI 晶片企業將面臨的挑戰以及相關解決方案。

地平線聯合創始人兼技術副總裁 黃暢

AI 正規化演進:

利用機器替代人做更多的事情

人工智慧從上世紀 60 年代誕生至今,經歷了基於規則、人工設計特徵、淺層學習、深度學習等正規化的演進,未來正規化還可能繼續革新。黃暢指出,正規化持續推進,但核心理念都是用機器替代人實現更多事情,包括學習本身。

以機器視覺的一個經典課題——識別圖片中的貓狗為例,傳統計算機視覺先驅提出的框架是:首先對影象邊緣進行提取,基於影象邊緣構造二維物體得到 2.5D 資訊,之後進一步構造三維模型。從輸入影象到場景理解,這是一個完整的、理想的計算機視覺鏈路。

但黃暢指出,該方案的每個步驟都有大量不確定性,因此係統可用性並不高。因為現實生活中,每個物體的高度、被遮擋情況不一,即便是同一個物體也存有許多差異。更重要的是,計算機視覺對光照條件有很強的依賴性,而現實世界是一個非線性變化的構成,極其複雜。

後來,機器視覺摒棄了基於規則的方案,進入人工設計階段。專家們透過簡單的特徵設計,讓機器進行淺層學習。這條路徑從低維走向高維,在高維的稀疏空間中試圖用線性方法來解決問題。但遺憾的是,這仍是一個淺層的框架應用,提升空間非常有限。

從 2012 年開始,機器視覺領域進入深度學習階段。發展至今,基於深度學習的影象識別精度一直在提升,同時配合特定的硬體設計,機器運算效率越來越高。透過 AI 進行自動化搜尋,自動進行關鍵特徵的提取最終得到識別結果,由此大大降低人工參與度。

黃暢指出,當下只需用約幾百分之一的計算量就能達到 8 年前影象識別的精度。演算法的進化速度甚至超過了半導體的摩爾定律,因為深度學習的優勢在於,儘可能地利用了大資料、大模型和大計算。

目前,深度學習也被廣泛應用在自動駕駛領域。由於現實世界非常複雜,透過單純的端到端演算法在模擬器裡進行感知、決策、控制訓練,然後部署在自動駕駛車輛的方法是不可行的。因此必須將 AI 系統建立在真實物理世界之中,並持續迭代演進,這就是軟體 2.0 時代。

黃暢表示,這是目前最可行的一個大規模、持續迭代的人工智慧系統。在這個自動化平臺上,透過構造資料閉環,將物理世界資料進行提取,送入後端訓練迭代模型,提升整個系統的精度與效率,再返回到前端,透過 OTA 更新前端模型,從而打造一個完整的資料閉環。這個過程需要一套非常完整的體系,包含資料系統和計算系統。

以資料系統為例,以往的訓練模型裡資料都是停滯的。但真正的大資料閉環依賴於訓練模型透過 OTA 伺服器部署到車輛,採集更多資料,透過資料探勘送到閉環資料系統中進行快速迭代,一個小閉環+大閉環才構成完整的軟體 2.0 開發系統。

軟體 2.0 時代:

算力並非晶片唯一評估標準

黃暢指出,儘管近年來軟體演算法的演進非常快,每 10-14 個月,相同的計算精度計算量可以下降一半。但這種提升是以演算法設計的越發巧妙作為前提的,而演算法的巧妙設計會對計算架構提出巨大的挑戰,尤其是對傳統通用的並行架構而言。

這也意味著,自動駕駛領域的專門處理器架構設計變得尤為重要,如果繼續沿用通用計算架構,會使得更先進的自動駕駛演算法無法高效執行。對此,地平線認為,基於軟硬結合晶片設計理念的計算架構最佳化對於提升晶片效能有重要作用。因此,地平線自主研發了 AI 專用處理器架構 BPU,並規劃了高斯、伯努利和貝葉斯三代 BPU 架構。

黃暢認為,晶片處理器的設計有三個指標:Performance、Power、Area。其中 Power、Area定義了晶片的使用成本和製造成本,但最重要的是 Performance。如果沒有 Performance,晶片無論功耗再低、面積再小、成本再低,也是無用的。

但同時,單純依賴這三個指標容易衍生“算力至上”的效能評估方法。但事實上,算力並非晶片唯一的評估標準。為此,地平線提出了一個 MAPS(Mean Accuracy-guaranteed ProcessingSpeed)概念和評估方法,以此作為檢驗 AI 效能的真正標準。通俗來說,就是在特定的 AI 應用領域,看晶片處理 AI 任務的速度和精度,即“多快”和“多準”。

以知名的 ImageNet 影象分類任務為例,透過地平線征程 3、征程 5 和基於 GPU 的晶片相比,可以發現地平線征程 3 用 8% 的功耗能就能達到 50% 的 MAPS 處理器效能,而征程 5 可以用 50% 功耗達到 500% 的 MAPS 效能。

然而,自動駕駛領域中的物體檢測是比影象分類更復雜的任務。不僅要識別物體,還要識別位置和大小,此外路面上還有車輛、行人、車道線等各種障礙物。在這個任務中,地平線征程 5 和友商晶片同樣是 50% 的功耗,但地平線的效能提升了 13 倍。這也反映了,地平線將先進演算法和先進處理器架構設計結合在一起,最終實現功耗、效能(包含速度和精度)等方面的最優解。

征程 5 即將到來:

為軟體 2.0 時代強勢賦能

在地平線看來,汽車終將成為四個輪子上的超級計算機,車載 AI 晶片是智慧汽車的數字發動機,也是整個 AI 行業的珠穆朗瑪峰。

為攀上這座高峰,在今年北京車展上,地平線除了推出了新一代車規級 AI 晶片征程 3,明年年初,面向下一代智慧駕駛場景的征程 5 晶片也將會發布,屆時 AI 效能將比肩特斯拉 FSD。

從 MAPS 的跑分結果來看,征程 5 的 MAPS 跑分可高達 3026FPS,征程 5P 的 MAPS 效能為 6391FPS,可滿足車廠高級別自動駕駛的量產需求。目前征程 5 已經斬獲車型定點。

面對智慧駕駛的時代浪潮,地平線將始終定位為 Tier2 供應商, 堅持以“晶片+演算法+開發平臺”為基礎平臺,更結合整套資料閉環的能力進行底層技術開放賦能。

在實際落地層面,地平線征程 2 賦能長安 UNI-T 實現了中國車規級 AI 晶片的首次上車量產,在今年開啟了車規級 AI 晶片的前裝量產元年。

未來,地平線將同長安、上汽、廣汽、一汽、理想汽車、奇瑞汽車、長城汽車等國內主機廠以及奧迪、大陸集團,佛吉亞等國際知名主機廠及 Tier1 持續深度合作、加速智慧汽車芯生態搭建,透過發揮自身的核心技術優勢,攜手合作夥伴共贏產業變革轉型之戰。

9
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 驍龍888基本確認:約等於降頻A14!蘋果碾壓性優勢不復存在