加州初創公司Recogni成立已有三年,Recogni主要開發基於人工智慧的視覺處理器。他們正吸引越來越多的風險投資家、一級汽車廠商和OEM的關注。近日,Recogni宣佈已獲得4890萬美元B輪融資。
推理引擎啟用影象感測器效能
Recogni全新AI處理器是一個推理引擎,針對的是下一代駕駛員輔助和自動駕駛汽車“邊緣”的推理引擎。這家初創公司的目標是提供一種基於人工智慧的視覺處理器,以極低的功耗提供高效能算力。
自動駕駛Recogni公司:L2級車輛變革者
Recogni公司創立於2017年,其總部位於美國加州,在德國慕尼黑設有分支機構。該公司旨在幫助汽車製造商實現L2級以上的汽車自動駕駛,技術定位為“L2級自動駕駛車輛的感知處理的變革者”。Recogni採用Vision Cognition處理器,旨在解決端點干擾問題,提升自動駕駛系統的效率,並改變L3、L4、L5級自動駕駛車輛的技術軌跡。
其實,在這個圈子裡,Recogni不算入行早的。
為了增強SoC中央計算能力,Recogni希望汽車製造商將他們的算力達到1000TOPS的處理器放在汽車邊緣處,也就是要臨近CMOS影象感測器。
據Recogni介紹,他們的晶片與感知感測器緊密結合後,將以高幀率、高解析度實時處理視覺資料。
考慮到自動駕駛平臺必須支援多種工作負載,SoC的原始處理速度TOPS不一定是最有用的衡量標準。然而,Recogni的建議是在每臺相機上安裝1000 TOPS級別的處理器,用於處理視覺資料,這與它的競爭對手的方法有很大不同。例如,英偉達正在推廣其Orin SoC,該SoC已達到200TOPS,以處理自動駕駛汽車中同時執行的眾多應用和深度神經網路。
Recogni宣稱其感知處理器是“唯一一種專為物體識別而設計的多眼相機系統架構,能夠在畫素級上提取被動立體深度。”
Recogni介紹,它的處理器“透過將物件庫的權值(引數)儲存在晶片上,從而實現了更高的處理效率和速度,在晶片上執行計算分析。”
Recogni表示,其模組“以每秒60幀的速度處理超過800萬畫素的影象,能夠識別(檢測、分割和分類)物體,將深度感測器資訊融合到物體中,並在幾毫秒內為中央系統提供智慧資訊。”
資深汽車行業分析師Egil Juliussen表示:“將處理器與感測器靠近意義非凡。它可大大減少需要傳輸的資料,打開了從感測器到中央計算機的路徑。從Recogni宣告來看, Recogni的感知處理器似乎有一個片上儲存器。“這是人工智慧處理的一大優勢”。
Recogni創始人兼執行長R K Anand拒絕透露處理器架構細節。不過,他也解釋了他的團隊所認為的汽車製造商在開發ADAS和自動駕駛汽車時面臨的“難題”。在他看來,問題在於“以高幀率、高解析度來處理邊緣視覺資料”。這在全自動駕駛汽車中變得尤其困難,因為它必須實時進行。
VSI Labs的創始人兼總裁Phil Magney表示:“我們現在看到了許多旨在改善ADAS和自動駕駛應用的ML視覺流水線的創新。這適用於訓練和推理模型。”
Magney表示,儘管神經網路指令在能源效率和計算功率密度方面得到了更好的最佳化,“行業正在尋求對整個流水線的改進,並試圖找到在能量效率和計算能力密度方面更好的最佳化辦法。“考慮到它們必須處理大量的資料流,同時識別出需要儲存、下采樣和儲存的重要資料以供進一步的網路訓練,“其中一些資料被推到邊緣,常駐的模型可以決定哪些資料應該保留,哪些資料應該流向下游,這一點也不奇怪。”
為什麼要使用一個百萬畫素的感測器?
特斯拉Model 3的拆解顯示,它的三前向相機是三個ON Semi AR0136A - 3.75µm畫素的CMOS影象感測器,解析度在1280×960(120萬畫素)。特斯拉Model 3駕駛員輔助自動駕駛控制模組單元(或TM3DAACMU)提供250米的前置影象捕捉。
為什麼特斯拉要帶著100萬畫素的感測器到處跑? Anand表示:“這對我們來說毫無意義,因為我們口袋裡的這些手機的攝像頭就有1000或1200萬畫素的感測器。”
Anand表示,汽車製造商正在使用100萬畫素的感測器,不是因為它們成本更低,而是因為它們的汽車沒有足夠的處理能力。即使一些汽車製造商聲稱擁有200萬、400萬甚至800萬畫素的感測器,但他們的汽車也只是從新感測器中提取樣本資訊。
當被問及下采樣是否普遍時,VSI實驗室的Magney表示,“確實,而且已經持續了一段時間。新的GPU可以處理這個問題,但同樣,這些GPU並沒有針對嵌入式系統進行最佳化。”
換句話說,感測器的成本並沒有阻止汽車製造商使用高階影象感測器。“問題在於計算成本、計算量和算力。“如果這三個問題沒有解決方案,升級到更高階的感測器就沒有意義,”因為你無法處理它。Anand稱這是識別力領域的“珠穆朗瑪峰”。
解析度越高,推理效果越好
Anand說,推理與資訊負荷直接相關。“所以,當機器接受了更多的資訊訓練,你正確推斷它的可能性就越大。”
想象一下200米外的行人,一個停車標誌,或者一個足球從路邊彈回——這些都是重要的事情。 “如果你不盡早抓住它們,自動駕駛汽車就沒有時間停下來,因為停車純粹是物理問題。然而解析度越高,幀率越高,推理效果就越好。但這也意味著對計算機的需求將會越高。”
難道英偉達的SoC不能勝任這項工作嗎?
Anand表示:“英偉達在過去10到15年裡做出了驚人的創新。他們在晶片和軟體的開發方面都做得很出色。但他們告訴客戶在汽車上使用的晶片,是為批次處理資訊而設計的。”
在他看來,批處理在自動駕駛汽車上是行不通的,因為汽車需要實時操作。英偉達的架構、方法和軟體都是其障礙所在。換句話說,“英偉達不具備我們作為初創公司所擁有的那種奢侈——我們可以從頭開始考慮這個問題。”
那麼Mobileye呢?
“Mobileye略有不同,Mobileye是一家計算機視覺公司。他們在EyeQ4, EyeQ5和EyeQ6上採用的方法是處理器思維。所以,他們用了更多的處理器引擎來做人工智慧的工作。Mobileye是一家由“試圖成為人工智慧專家的傳統計算機視覺專家”組成的公司。
人工智慧網路的進步
Magney認為,由於ML方法的進步和視覺管道的最佳化,視覺處理一直在改善。然而,他表示:“你在開發系統上所能做的與系列產品是相距甚遠的。汽車製造商想要“能夠執行這些資料密集型ML應用程式的超級高效的計算平臺”。
Magney解釋,在這種背景下,“汽車製造商正在將一些處理方法推向邊緣”,而不是選擇“原始資料方法”。既然自動駕駛堆疊可能有幾十個神經網路,汽車製造商就會想,“為什麼不把這些網路推到專用處理器上,這樣就可以減少域控制器的負載呢?”
然而,類似於Recogni的解決方案——一種與感測器緊密結合的專有處理器和軟體將如何被Waymo、Argo、Cruise等自動駕駛先鋒接受還是個未知數。Juliussen想知道對於那些自動駕駛的先驅們來說,用Recogni的晶片取代他們現有的解決方案是否容易。Magney:“其實,時間會證明這一點。“
雖然Recogni正在推動其用於全自動駕駛汽車的新晶片,Magney有些擔心:“我認為對於ADAS應用來說,使用這些緊密耦合的架構會有更好的機會。對於L3-L5來說,你需要一個通用的計算架構,而整車廠在這一點上正在發揮更大的作用。”
大約一年前,Recogni的聯合創始人Ashwini Choudhary表示,Recogni正在開發的晶片將提供1000TOPS /10瓦效能。Anand證實,這仍然是目標,但拒絕透露其效能規格。該晶片將由臺灣半導體制造公司製造,採用7nm製程技術,它已“接近成型”。