9月25日,一年一度的雲棲大會在杭州雲棲小鎮開幕。
本屆雲棲大會以“數·智”為主題,共設110餘場峰會和論壇,聚集了世界上幾十個國家的上千名科學家、CTO、企業家,以及對技術充滿熱情的超過6萬名從業者和愛好者。
作為阿里巴巴平頭哥晶片合作伙伴,雲天勵飛副Quattroporte李愛軍受邀出席平頭哥晶片生態專場並發表主題分享,與阿里巴巴集團副Quattroporte戚肖寧、臺積電(南京)有限公司總經理羅鎮球、新思科技中國董事長兼全球副Quattroporte葛群等行業專家一起探討5G時代晶片製造和架構設計的新思考與新實踐。
李愛軍在《高效能 AI 邊緣計算晶片架構與應用》的主題演講中提出, 5AIoT(5G+AI+IoT)時代將會帶來海量資料的處理需求,且實時處理的佔比大幅提升。實時處理的需求、複雜場景下的邊緣計算能力,尤其是基於深度學習的神經網路計算能力,對晶片計算架構提出了新的要求。
針對 5AIoT應用場景的這種需求,雲天勵飛推出了一款面向視訊影象分析應用、適合各種邊緣場景下深度學習神經網路推理加速的高效能異構平行計算SoC晶片——DeepEye1000。
異構多核平行計算架構
李愛軍表示,DeepEye1000採用異構多核平行計算架構設計,整合阿里平頭哥玄鐵處理器(CPU)、自主產權神經網路處理器(NNP)、智慧運算元引擎、視覺數字訊號處理器(DSP)、視訊編解碼器以及影象編碼器等多個核心和硬體加速單元。
自主神經網路計算引擎
李愛軍進一步指出,雲天勵飛自主產權神經網路處理器(NNP)採用自研ASIP深度定製指令集,支援靈活可程式設計計算流;支援高能效混合精度計算,同時保證演算法模型精度;通過計算儲存深度融合和動態儲存排程技術,外部儲存訪問頻寬可大幅降低約77%。
與通用GPU相比,DeepEye1000單位效能提升20倍,單位能效提升100倍,系統時延降低200倍,具有低功耗、高能效、智升級、可程式設計等特點。
智慧任務排程
李愛軍介紹,通過自主設計的神經網路處理器以及智慧排程機制,DeepEye1000可以高效執行各種演算法的推理計算,實現高效能、低功耗的CNN網路模型推理計算加速。
相比中斷處理機制,採用智慧排程機制使檢測演算法、跟蹤演算法、識別演算法的執行時間分別減少約25%、35%、40%。
開放工具鏈
為了方便DeepEye1000的使用,雲天勵飛為DeepEye1000提供了基於TVM打造的晶片工具鏈和軟體開發包(SDK),支援Caffe、MxNET、TensorFlow、ONNX等深度學習框架,支援一鍵部署。
“1+1+N”的AI城市綜合服務體系
分享最後,李愛軍稱,雲天勵飛的目標是構建“1+1+N”的AI城市綜合服務體系。將通過5G+AI+IoT的智慧感知網路觸角得到的資料,經過基於AI OS的城市大腦進行分析、判斷和決策,最終應用到城市大腦、新零售、工業檢測、機器人、智慧倉儲、智慧家居等城市綜合服務的多種應用場景中。
與阿里平頭哥深度合作
此外,在下午舉辦的媒體見面會上,李愛軍強調,DeepEye1000 晶片集成了阿里平頭哥的玄鐵 810 處理器。利用雲天勵飛的神經網路處理器設計能力,結合平頭哥提供的 CPU 處理器能力,賦能高效、異構多核視覺AI計算,Linux視覺框架助力AI應用極簡開發,雙方協作,成功打造了雲天勵飛面向視覺應用的神經網路推理加速晶片。
雲天勵飛副Quattroporte李愛軍(右二)出席媒體見面會
同時,李愛軍表示非常認可平頭哥“無劍“平臺的服務,本地化服務貼心、工具鏈升級快,對平頭哥一直積極打造行業生態非常讚賞。
雲棲大會的十年,見證了中國數字經濟的大發展,更成為數字經濟未來的風向標。未來5G時代,雲天勵飛將繼續與阿里巴巴平頭哥進一步加強AI晶片領域的創新合作,為打造“中國芯”共同發力。