Aspencore《電子工程專輯》分析師團隊對中國本土的AI晶片設計公司進行了第一手調查和網路彙編整理,從眾多AI晶片設計廠商中挑選30家,從核心技術、代表產品、典型應用場景等多個維度進行了分析。這是China Fabless系列調研分析報告的一部分,感興趣的朋友可以查閱其它類別的調研報告,或直接與我們聯絡。
已經發布的調研報告包括:
中國IC設計行業30家上市公司綜合實力排名30家國產MCU廠商綜合實力對比30家國產電源管理晶片和功率半導體廠商調研分析報告國產AI晶片廠商基本資訊統計無論雲端訓練和推理、邊緣計算還是終端AI,AI都需要高能效的算力支援,而AI晶片無疑是輸送算力的硬體保障。傳統的通用型CPU、GPU甚至FPGA難以滿足特定應用場景的AI需求,因此基於特定域架構(DSA)的AI晶片和深度學習加速器(DLA)便應運而生,這為專門開發AI晶片的初創公司帶來了發展機會,並在全球範圍催生了多家AI晶片獨角獸公司。
中國本土AI應用和AI晶片初創公司也隨著AI的熱潮和風投的關注而遍地開花。然而,經過幾年的喧鬧後,AI應用場景的落地成為最大難題。AI晶片的設計也不是簡單的高效能微處理器硬體設計,而是涉及應用場景特定需求和演算法的軟硬體一體化設計。那麼,中國本土AI晶片廠商的發展現狀?未來發展前景又如何呢?哪些AI晶片公司會脫穎而出?
《電子工程專輯》分析師團隊帶著這些問題,對30家國產AI晶片廠商進行了深入調查和分析。這是這些廠商的基本資訊一覽表:
在這30家中國本土AI晶片廠商中,有6家上市公司,4家是子公司。有2家是做比特幣礦機出身而擴充套件到AI晶片的。有一家是從光子晶片切入AI領域的,有2家採用的是資料流架構,而非傳統的馮諾依曼架構。
從公司總部所在地來看,北京有11家AI晶片公司,其中包括網際網路巨頭百度、老牌微處理器晶片設計公司北京君正,以及科創板上市的寒武紀。上海有9家,包括無線通訊處理器廠商紫光展銳,以及融資超過20億的初創公司壁仞科技。深圳有4家,包括華為海思,以及“AI四小龍”之一的雲天勵飛。此外,珠海和杭州各有2家,福州有1家。
從AI應用場景來看,智慧安防、物聯網和智慧語音是最為熱門的應用。雲端AI訓練和推理對算力效能和設計團隊的要求比較高,相應的AI處理器設計公司也不多。除了百度和阿里等網際網路巨頭外,遂原科技和天數智芯是針對這一高效能計算領域的初創公司。
30家AI廠商詳細資訊下面我們將從核心技術、代表產品、典型應用場景和競爭優勢等方面對這30家公司逐一分析。
華為海思
核心技術:自研華為達芬奇架構NPU、3D Cube技術;
代表產品:昇騰(Ascend)310是一款高能效、靈活可程式設計的人工智慧處理器,在典型配置下可以輸出16TOPS@INT8、TOPS@FP16,功耗僅為8W。全AI業務流程加速,大幅提高AI全系統的效能,有效降低部署成本。自研華為達芬奇架構NPU,在8W資料精度下算力可達16TOPS,高效能3D Cube計算引擎。
昇騰(Ascend)910是海思系列中算力最強的AI處理器,基於自研華為達芬奇架構3D Cube技術,實現最佳AI效能與能效平衡,架構靈活伸縮,支援雲邊端全棧全場景應用。在算力方面,昇騰910半精度(FP16)算力達到320 TFLOPS,整數精度(INT8)算力達到640 TOPS,功耗310W。
應用場景:海思以全場景AI晶片昇騰系列助力AI從中心側向邊緣側延伸,面向數字中心、邊緣、消費終端和IoT場景,可為平安城市、自動駕駛、雲業務和IT智慧、智慧製造、機器人等應用場景提供完整的AI解決方案。
紫光展銳
核心技術:異構雙核NPU架構、自研API
代表產品:虎賁T710採用異構雙核NPU架構,支援業界主流AI訓練框架,自研API可提高演算法效率。效能:4 x A75 @ 2.0GHz + 4 x A55 @ 1.8GHz;影像:4800萬(4in1)攝像頭、4K@30fps編解碼、超級夜景、防抖等功能。
應用場景:適用工業、商業、醫療、家居、教育等場景。
競爭優勢:擁有在人工智慧AI、安全性、連線、效能、功耗五大領域的突出優勢。在2019年8月蘇黎世聯邦理工學院AI Benchmark公佈的全球AI晶片效能榜單中,虎賁T710排名榜首。
地平線
核心技術:人工智慧專用計算架構 BPU(Brain Processing Unit)
代表產品:車規級AI晶片征程2/3;AIoT邊緣AI晶片平臺旭日2/3。
應用場景:汽車ADAS/自動駕駛、AIoT邊緣計算。地平線自主研發兼具極致效能與高效靈活的邊緣人工智慧晶片及解決方案,可面向智慧駕駛以及更廣泛的智慧物聯網領域,提供包括邊緣 AI 晶片、豐富演算法 IP、開放工具鏈等在內的全方位賦能服務。
競爭優勢:在智慧駕駛領域,地平線選擇從車載AI晶片(智慧汽車的數字發動機)這一最具挑戰性的邊緣晶片切入,具有領先的人工智慧演算法和晶片設計能力,是目前唯一能在基於視覺感知的車規級AI晶片競爭賽道上與Mobileye抗衡的公司。地平線征程 2 已經實現大規模前裝量產,與英特爾 Mobileye EyeQ4、英偉達 Xavier 並列成為業界僅有的三款量產級車規智慧駕駛晶片。
寒武紀
核心技術:智慧處理器微架構、智慧處理器指令集、SoC晶片設計、處理器晶片功能驗證、先進工藝物理設計、晶片封裝設計與量產測試、硬體系統設計等;程式設計框架適配與最佳化、智慧晶片程式語言、智慧晶片編譯器、智慧晶片高效能數學庫、智慧晶片虛擬化軟體、智慧晶片核心驅動、雲邊端一體化開發環境等。公司已獲授權的專利為110項,其中境內專利95項,境外專利15項。
代表產品:思元290/270/100/220系列AI晶片;終端智慧處理器IP、雲端智慧晶片及加速卡、邊緣智慧晶片及加速卡以及基礎系統軟體平臺。
應用場景:通用型雲端訓練和邊緣/終端推理AI方案。
競爭優勢:AI核心技術和人才團隊優勢;同時為雲端、邊緣端、終端提供全品類系列化智慧晶片和處理器產品的能力。
位元大陸
核心技術:自主研發雲端AI晶片,擁有完整的自主智慧財產權和專利
代表產品:雲端晶片算豐BM1680、算豐BM1682、算豐BM1684,終端晶片BM1880。最新一代算豐BM1684晶片聚焦於雲端及邊緣應用的人工智慧推理,採用臺積電12nm工藝,在典型功耗僅16瓦的前提下INT8算力可達17.6Tops,在Winograd卷積加速下,INT8算力更提升至35.2Tops,是一顆低功耗、高效能的SoC晶片。
應用場景:影片分析、雲+邊的“新基建”算力基礎設施建設
競爭優勢:擁有完整的自主智慧財產權和專利,同一套SDK和簡單易用的工具鏈支援多形態應用。
遂原科技
核心技術:可程式設計晶片設計理念、“馭算”計算及程式設計平臺支援主流深度學習框架,並針對邃思晶片進行了特定最佳化。
代表產品:邃思是針對雲端人工智慧訓練場景的高效能通用可程式設計晶片,支援CNN、RNN、LSTM、BERT等網路模型和豐富的資料型別(FP32/FP16/BF16/Int8/Int16/Int32等)。其計算核心包含32個通用可擴充套件神經元處理器(SIP),每8個SIP組合成1個可擴充套件智慧計算群(SIC)。SIC之間透過HBM實現高速互聯,透過片上排程演算法,資料在搬遷中完成計算,實現SIP利用率最大化。
公司已完成首款人工智慧高效能通用晶片“邃思”的研發和量產,並面向資料中心推出數款人工智慧算力加速產品,分別是:針對雲端訓練場景的“雲燧T10”和“雲燧T11”,針對雲端推理場景的“雲燧i10”,以及與產品配套的“馭算”軟體平臺。
應用場景:面向資料中心的高效能雲端訓練和雲端推理,可廣泛應用於網際網路、金融、教育、醫療、工業及政務等人工智慧訓練場景。
競爭優勢:同時擁有高效能雲端訓練和雲端推理產品。
雲天勵飛
核心技術:演算法晶片化的底層技術能力以及基於“端雲協同”技術路線所成功落地的大型解決方案經驗和系統落地工程能力。演算法晶片化不等於“演算法+晶片”,而是指一種演算法與晶片融合發展的設計理念和流程。雲天勵飛自2014年成立以來就踐行這套“場景定義演算法、演算法定義晶片”的思路方法。
代表產品:2017年,雲天勵飛第一代具有自主智慧財產權的神經網路處理器採用FPGA實現。2018 年,第二代具有自主智慧財產權的神經網路處理器晶片DeepEye1000採用 22nm 工藝投片。
應用場景:DeepEye1000可在智慧安防、新商業、智慧交通、智慧製造、智慧倉儲、智慧家居、機器人、智慧超算等多個行業及領域應用。
全志科技
核心技術:高畫質音影片編解碼技術、高畫質數字電視訊號解調技術
代表產品:主要產品是基於ARM架構的大型SoC,包括R329,R818等28nm的智慧語音晶片,以及A系列的平板處理器。R329是全志科技首款搭載Arm中國“周易”AIPU的多核異構處理器,具有高算力、低功耗、低成本等效能。R329擁有0.256 TOPS算力,800MHz頻率,能夠使用深度學習進行端到端的演算法,進一步提升AI語音的識別率和互動體驗。R329還集成了主頻為1.5GHz的雙核Arm Cortex-A53,使R329的整數算力比上一代R328晶片高出1.58倍,浮點算力高1.94倍;其DSP為400MHz的雙核HIFI4,擁有HIFi級演算法,能夠進行音訊前、後處理,提升音質效果。
應用場景:全志科技的SoC主要佈局物聯網,智慧家居等領域。作為智慧家居的入口,京東的智慧音箱搭載的是全志的SoC晶片,還有小米的智慧掃地機器人等智慧硬體產品。
瑞芯微
核心技術:應用處理器技術
代表產品:RK3399Pro AI晶片採用big.LITTLE大小核CPU架構,雙核Cortex-A72+四核Cortex-A53。其它產品還包括智慧應用處理器晶片、智慧物聯應用處理器晶片、電源管理晶片等。
應用場景:智慧物聯硬體
鯤雲科技
核心技術:自主研發推出定製資料流CAISA架構和編譯工具鏈RainBuilder
代表產品:資料流AI晶片CAISA搭載了四個CAISA 3.0引擎,峰值效能可達 10.9TOPs,具有超過1.6萬個MAC(乘累加)單元以及所有輔助邏輯。為支援較高的硬體資源利用率,同時設計了分散式資料流快取,為每個CAISA引擎提供超過340Gbps的頻寬,可實現最高95.4%的晶片利用率;CAISA引擎本身基於對常用神經網路模型的計算量統計進行最佳化,其不僅為常見的神經網路計算(如Pooling,ReLU等)實現了專用的硬體計算模組,且與卷積計算的比例經過平衡,可在常用AI演算法中實現最佳效能,滿足不斷增長的邊緣側和IDC算力需求,為客戶提供更高的算力價效比。
應用場景:基於CAISA晶片,鯤雲科技推出面向邊緣端、資料中心進行深度學習推斷的AI專用計算加速的星空加速卡X3,定位於高效能AI推斷加速,星空加速卡相容TensorFlow、PyTorch、Caffe、ONNX(MXNet) 等主流框架,可簡單快速實現AI演算法模型到硬體上的無縫遷移,充分體現其高算力價效比、高通用性和高軟體易用性。目前星空加速卡X3已應用於航空航天、智慧城市、安防、安全生產、電力、工業等領域。
競爭優勢: 鯤雲基於自身資料流AI晶片技術,提供從底層硬體到頂層演算法在內的軟硬體一體化人工智慧解決方案,推動人工智慧在電力、安防、安監生產、工業視覺等不同行業及領域的垂直落地。 在電力領域,鯤雲網面向輸配變場景提供人工智慧巡檢解決方案;在石油石化領域,鯤雲提供算力演算法一體化的智慧安監解決方案;在智慧製造領域,鯤雲提供AI加速卡為AOI檢測賦能算力,其星空加速卡基於資料流技術,對batchsize不敏感且處理延時低,在技術特性上適配產線實時檢測應用需求且為工業使用者提供具有更高算力價效比。 目前鯤雲的AI加速晶片及產品已在智慧城市、智慧製造、智慧遙感、安監生產等領域落地,與浪潮、飛騰、DELL和中國聯通等達成合作,加速資料流AI計算產業化落地。
作為首批參與AIIA DNN Benchmark 專案的AI晶片企業,鯤雲參與制定AI晶片行業基準測試標準,晶片產品經第三方認證已成為首批披露benchmark的AI加速產品,且AI加速產品目前已經同飛騰、麒麟、浪潮等完成了適配和國產化產品認證。
30家AI晶片廠商詳細資訊下面我們將從核心技術、代表產品、典型應用場景和競爭優勢等方面對剩下的20家公司逐一分析。
依圖科技核心技術:計算機視覺技術、語音識別技術、自然語言理解技術
代表產品:求索AI晶片,以及基於求索晶片的原石系列伺服器、前沿系列邊緣計算裝置。
應用場景:人臉識別、語音識別、醫療等。
競爭優勢:以人工智慧晶片技術和演算法技術為核心,研發及銷售包含人工智慧算力硬體和軟體在內的人工智慧解決方案。解決方案的形態主要包括軟體、硬體、軟硬體組合以及 SaaS 服務等。
2020 年,在ACM 國際多媒體會議(ACM MM)主辦的 “大規模複雜場景人體影片解析”挑戰賽中,公司獲得“行為識別”的單項第一名,其演算法指標將以往學術界中的基準演算法提升了近 3 倍;2018 年底,公司在全球最大開源中文資料庫的詞錯率測試上重新整理紀錄;2019 年,聲紋識別技術也在全球說話人識別挑戰賽(Voxsrc)中重新整理紀錄;2019 年 2 月,在世界頂級醫 學期刊 Nature Medicine 發表基於中文文字病歷做臨床智慧診斷的研究成果(影響因子 32.621),這是目前自然語言理解技術分析中文文字病歷發表的最高分文章。
啟英泰倫核心技術:腦神經網路處理器核(BNPU)、語音識別、聲紋識別、自然語言處理、麥克風降噪增強技術
代表產品:CI100X系列、CI110X系列、CI112X系列。二代語音晶片CI110X系列(CI1102/CI1103)效能較一代晶片有了很大提升,增加了聲紋識別、波束形成、語音定向、離線上識別、本地命令詞學習等更豐富的功能,成本也下降了很多,功耗甚至降到1/3。成本更低的升級版語音晶片CI1122,在演算法方面,5dB信噪比噪聲環境下識別率可以達到85%以上,意味著像油煙機這種高噪聲裝置都可以輕鬆進行語音控制。
應用場景:智慧語音、智慧家居。
知存科技核心技術:基於Flash的模擬存算一體技術
代表產品:MemCore系列晶片採用國際領先的模擬存算一體晶片架構,使用Flash單元完成8bit權重儲存和8bit * 8bit的模擬矩陣乘加運算。單一Flash陣列可並行完成200萬次矩陣乘加法運算,計算吞吐量相比DRAM和SRAM等儲存器頻寬高出100-1000倍。MemCore001/MemCore001P兩款智慧語音晶片可支援智慧語音識別、語音降噪、聲紋識別等多種智慧語音應用。
針對可穿戴和移動裝置的MemCore101晶片,針對電池驅動裝置所使用的智慧視覺晶片MemCore201晶片。這兩款晶片可在低功耗的情況下提高算力50倍,為電池驅動裝置賦能強力AI運算,延長待機時間的同時增加智慧化功能。
應用場景:智慧語音、智慧視覺、可穿戴裝置、移動裝置等。
競爭優勢:由於存算一體晶片還處於市場空白階段,並無頭部巨頭壟斷趨勢,較其他型別晶片生產週期更長,行業競品普遍產品化能力較弱,而知存科技已經歷六次流片,產品即將上市,具有明顯的先發優勢。在存算一體晶片研發中,“如何設計儲存器,使其具備處理器的運算能力”是最重要也是最難的部分。
億智電子核心技術:NPU、多場景AI演算法、數模混合類IP設計、作業系統及軟體技術
產品及應用:安防、車載、AIOT。SV系列晶片主要應用於視像安防領域,如:出入口閘機、考勤機、門禁機等;SA系列晶片主要應用於汽車電子,如:DMS+BSD,智慧DVR等;SH系列晶片主要應用於智慧硬體,如:智慧家電,教育類智慧硬體等。
應用及客戶:人臉面板機、AI IPC、智慧屏及OTT盒子、車載DMS、教育電子等。客戶有中科創達、漢王、多度、長視、銳穎、安威士等。
競爭優勢:以SoC級的晶片整合設計和AI演算法為核心的整體交付服務。
黑芝麻智慧核心技術:視覺感知技術、嵌入式影象和計算機視覺
代表產品:兩大自研核心演算法IP:NeuralIQ ISP影象訊號處理器及高效能深度神經網路演算法平臺DynamAI NN引擎。2020年6月釋出華山二號A1000晶片,具備40-70TOPS的強大算力,小於8W的功耗及優越的算力利用率,能支援L2+及以上級別自動駕駛。2020年9月,推出FAD(Full Autonomous Driving)全自動駕駛計算平臺,基於華山二號A1000晶片的雙芯級聯方案打造,算力最高可達140TOPS,支援L2+/L3級別自動駕駛場景。
應用場景:ADAS及自動駕駛。人工智慧系統級計算晶片(SoC),核心技術包括影象/影片處理、光學處理、感知理解演算法、深度神經網路和融合感知系統,相當於提供一個從感測器端到應用端的全棧式感知解決方案。針對車輛、行人、車道線、交通標識、訊號燈等資訊,透過感測器感知訊號,利用控光技術把光場進行處理,使得攝像頭能在各種特殊工況條件下成像,再透過毫米波雷達、超聲波雷達、GPS、IMU與攝像頭融合,把這些訊號傳入到黑芝麻感知系統,再透過最佳化的SoC計算平臺,把感知結果傳給自動駕駛企業去做決策和控制。
目前已和博世、一汽、通用、比亞迪等展開深入合作,提供視覺感知演算法和晶片商業應用。
競爭優勢:專注於視覺感知與AI晶片,開發基於影象處理和人工智慧的嵌入式晶片計算平臺,為ADAS及自動駕駛打造整體落地方案。
壁仞科技創立於2019年9月,致力於開發原創性的通用計算體系,建立高效的軟硬體平臺,同時在智慧計算領域提供一體化的解決方案。團隊由國內外晶片和雲計算領域核心專業人員、研發人員組成,在GPU、DSA(專用加速器)和計算機體系結構等領域具有深厚的技術積累和獨到的行業洞見。在成立不到一年的時間內,壁仞科技已經累計融資近20億元人民幣。
從發展路徑上,壁仞科技將首先聚焦雲端通用智慧計算,逐步在人工智慧訓練和推理、圖形渲染、高效能通用計算等多個領域趕超現有解決方案,實現國產高階通用智慧計算晶片的突破。
深聰智慧核心技術:全鏈路語音互動關鍵技術
代表產品:太行一代晶片TH1520 TH1520語音識別晶片。TH1520是公司第一代晶片產品,低功耗的優勢讓其場景適應能力更強,並已在眾多智慧終端產品中得以應用。
應用場景:智慧家居,智慧車載,智慧可穿戴。主要客戶包括美的集團,海信集團,盯盯拍,松下,美菱,海爾等。
競爭優勢:軟硬一體化,即“演算法+晶片”結合整體解決方案。
肇觀電子核心技術:人工智慧計算機視覺處理技術
代表產品:N系列、D系列、V系列晶片。N系列晶片是針對超高畫質AI智慧攝像頭產品開發的低功耗高效能SoC晶片,分別提供8M/4M/2M畫素級別影象採集處理能力,最高算力可達到2.4TOPS。支援高質量的ISP處理,內建3D降噪和動態對比度提升模組,並集成了HDR專利技術。D163A晶片是針對機器人和3D視覺智慧攝像頭產品開發的一款低功耗高效能SoC晶片。在N163晶片的基礎上,增加了高效能的雙目深度視覺處理的獨立硬體IP,能夠實時輸出深度影象。同時,提供了更加豐富的外圍介面,以適用機器人等智慧終端的開發需求。V163A 晶片在D163的基礎上,效能更進一步, 已透過AEC-Q100 Grade 2 標準。
可用於ADAS輔助駕駛等專業車載應用。
應用場景:專業安防、輔助駕駛、機器人、家用攝像、人臉識別等領域。
天數智芯核心技術:GPGPU高階大晶片及超級算力
代表產品:7奈米GPGPU高階自研雲端訓練晶片Big Island(簡稱BI),聚焦於雲端訓練及推理,透過自研指令集釋放強大的可程式設計性與應用通用性,提供業界領先的AI算力密度與能效比。
應用場景:應用於AI訓練、高效能計算(HPC)等場景,服務於教育、網際網路、金融、自動駕駛、醫療、安防等各相關行業。
探境科技核心技術:儲存優先的晶片架構SFA (Storage First Architecture ),以儲存驅動計算打破儲存牆針對AI計算“高差異、高併發、高耦合”特性。
代表產品:語音識別晶片音旋風611;具備AI雙麥降噪功能的語音識別方案--Voitist音旋風612;離線上一體的語音識別解決方案--Voitist音旋風621;Voitist 631--實時AI降噪;Voitist 711/712 – 本地自然語言處理(NLP);Imagist851 (12.8TOPS/ 3.2TOPS/ 1.6TOPS),支援影片結構化、人臉分析、人數統計、車牌分析等業務處理。
主要客戶:合作伙伴包括美的、海爾、TCL、歐普照明等知名廠商,並已同客戶合作開發20餘個智慧產品種類,包括空氣清淨機、智慧開關、茶吧機、智慧燈具、智慧空調等。
應用場景: 邊緣計算、安防。
嘉楠科技核心技術:基於RISC-V架構的邊緣智慧計算、神經網路加速器
代表產品:第一代AI晶片勘智K210,基於RISC-V架構自主智慧財產權商用邊緣AI晶片;第二代晶片勘智K510比一代晶片提升了3倍的算力,主要針對端側進行多路高畫質影片的處理。應用場景:智慧駕駛、智慧零售、智慧防盜及其他的智慧家居領域。
雲知聲核心技術:語音感知、認知和表達、超算平臺與影象、機器翻譯等多模態人工智慧硬核技術。
代表產品:蜂鳥晶片是專為智慧家居設計的異構SoC,是最新一代專門為離線上遠場語音互動場景設計的高效能、高整合度、低成本的語音智慧IoT晶片,主要面對智慧家電、小家電、燈具、智慧插座等產品領域。其特性如下:VAD+DSP+NPU+CPU 非同步低功耗架構;前端訊號處理DSP,效能是 HiFi4 的兩倍;提供更好的降噪,增強,BF等功能;高效神經網路處理器提供更快速和準確語音識別;內建1.5MB SRAM;支援安全啟動;支援100條本地離線指令識別;RTOS輕量系統;豐富的外圍介面;晶片正常工作功耗 100mW。
應用場景:提供跨硬體平臺、跨應用場景,端雲一體的人工智慧整體解決方案,廣泛應用於家居、醫療、金融、教育、交通、汽車、地產等領域。合作伙伴數量超 2 萬家,主要客戶涵蓋平安、世茂、吉利、格力、美的、海爾、華為、京東、360 等頭部企業。
競爭優勢:透過“雲端芯”一體化產品體系面向行業推出全棧式 AI 技術能力,打造從 AI 技術創新到產業應用的生態閉環。
清微智慧核心技術:動態可重構陣列技術(DCRA)--軟體程式設計和硬體程式設計兼備的可重構陣列,極大提高能效比;CGRA核心排程技術;動態寬電壓技術 DWVT逼近CMOS電壓閾值的技術。
主要產品:TX101智慧感測器;TX210智慧語音處理晶片;TX510智慧視覺處理晶片。
應用場景:新零售、智慧可穿戴裝置、智慧家居、安防監控、智慧家電、智慧車載裝置。
清微智慧源於清華大學微電子所魏少軍教授領導的可重構計算團隊,自2006年開始進行可重構計算理論和架構研究。2018年第三季度完成近億元級天使輪融資,投資方包括百度戰投、分眾傳媒、禧筠資本、國隆資本、西子聯合控股等。首席科學家尹首一博士為清華大學微電子所副所長、Thinker晶片團隊帶頭人;CTO歐陽鵬為清華大學博士,Thinker晶片主架構師。
酷芯微核心技術:視覺AI處理器平臺、高效能無線資料鏈路。
代表產品:AR9000系列高效能、低功耗Edge AI 邊緣智慧處理SoC,集成了自主研發的遠距離無線基帶和射頻、高效能ISP、神經網路專用加速器、影片編解碼等核心技術,並且整合有USB3.0、千兆乙太網、PCIE、CAN匯流排等豐富的外圍介面;AR9200系列晶片可應用於無人機、機器人、工業控制、輔助駕駛、智慧樓宇等多個領域。
應用場景:無人機、無人新零售、智慧安防、家庭服務機器人、工業視覺、IOT應用和通訊等市場。
杭州國芯核心技術:神經網路處理器gxNPU技術、數字電視、IoT AI
代表產品:GX8002 超低功耗AI語音晶片;GX8010 物聯網人工智慧晶片;GX8009 AI語音SoC晶片;GX8008 AI語音處理晶片;GX8001 YOC晶片。AI產品採用多核異構,有NPU、ARM、C-Sky、DSP等架構,低功耗語音喚醒演算法,雙麥陣列降噪演算法,VAD檢測演算法,離線ASR演算法,神經網路壓縮演算法。
應用場景:智慧車載、智慧音箱、智慧家居、智慧穿戴等多個應用領域。已和阿里巴巴、京東、百度、360、Rokid、出門問問、科大訊飛、聲智、思必馳、創維、TCL、海爾等公司達成深入合作。
耐能核心技術:可實時重構邊緣AI技術
代表產品:KL720 AI晶片支援4K影象,全高畫質(1080p)影片和自然語言音訊處理,從而使裝置可捕獲更多細節進行面部以及音訊識別;KL520 AI晶片加速了來自耐能以及第三方大眾裝置上的神經網路模型,從而方便了日常裝置中實現2D / 3D視覺識別以及音訊識別。
主要客戶:大唐、義隆、格力、搜狗。
應用場景:專注邊緣AI計算,廣泛應用於智慧家居、IP攝像頭、智慧安防以及移動應用等。
耐能獲得的融資額累計超過7300萬美元。將與鴻海共同合作開發汽車行業中的AI應用領域。此外,耐能和鴻海的合作也將共同推進工業4.0。耐能和華邦電子將致力於開發基於AI的微控制器(MCU)和記憶體計算(Memory Computing )。
平頭哥平頭哥半導體是阿里巴巴全資的半導體晶片業務主體,主要針對下一代雲端一體晶片新型架構開發資料中心和嵌入式IoT晶片產品。含光800 AI晶片的算力相當於10顆GPU。例如,實時處理杭州主城區交通影片,需要40顆傳統GPU,延時為300ms。而使用含光800僅需4顆,延時降至150ms。
百度百度自主研發的雲端AI通用晶片百度崑崙1已實現量產和應用部署,效能相比T4 GPU提升1.5-3倍;百度崑崙2預計2021年上半年實現量產,與百度崑崙1相比效能將提升3倍。
北京君正專業級視覺AI應用協處理器T02擁有高達8T的計算能力,全速執行情況下功耗僅需1.5W,可以搭配各大平臺實現影片結構化——車牌、車型、人臉、人形,一顆晶片完成人形、車輛、非機動車檢測及人臉識別、車牌識別、人車屬性分析。搭載T02協處理器的產品已經廣泛應用於平安城市、電力、學校等多種安防專案中。
最新一代智慧影片SoC晶片T31系列採用22奈米工藝,擁有高達1.8G的主頻,最高支援500萬25幀,並有BGA和QFN兩種封裝方式。T31系列晶片包括T31L和T31A,可在裝置端整合北京君正的系列深度學習演算法,包括深度學習的人形、人臉、車牌的檢測和識別。相較於傳統的CV演算法,北京君正深度學習演算法更高效,在複雜環境如遮擋、大角度等場景下更準確,解決了CV演算法的痛點,從容賦能端級AI。
使用北京君正影片晶片的產品包括華來大方小方、360智慧門鈴、HIVE智慧卡片機、熱成像與人臉識別一體機等。
光子算數核心技術:光電融合計算技術。
主要產品:基於自主研發的光子AI晶片,提供用於伺服器的光電融合AI計算板卡。板卡採用光電異構的智慧計算架構,用矽基整合光學的方法對AI計算的主要部分(矩陣運算)進行加速,相較於傳統純電的AI晶片方案可節省4/5的功耗。
可程式設計光子陣列晶片FPPGA(Field Programmable Photonic Gate Arrays),其中的光學單元可以透過電控,控制重新的連線組合方式,實現不同的複雜函式。也就是說,FPPGA具有可重構的特性。
光子算數與高校一起打造了面向伺服器的光電混合AI加速計算卡,目前已完成一些定製化加速任務,包括機器學習推理、時間序列分析等特定任務。
結語AI晶片是針對人工智慧領域的專用晶片,主要支撐AI演算法的執行,它是一種軟硬體全棧整合的專用處理器。除CPU和其他通用計算覆蓋的市場外,AI晶片是新興領域中需求量最大的計算處理晶片。隨著資料積累和更復雜演算法的出現,對計算能力的需求也在快速提高。同時,實時計算進一步增加了對計算晶片響應能力的需求。
AI晶片必須與特定應用場景的AI演算法配合起來才能真正實現AI的商業化落地,中國AI晶片廠商正從原來強調算力和獨特技術的傾向逐漸向針對特定應用場景而最佳化的方向轉變。隨著AI應用的普及和成效開始凸顯,國產AI晶片將迎來全面爆發和增長,多家AI晶片獨角獸也將慢慢浮出水面。