首頁>科技>

面對巨頭環伺的雲端AI晶片戰場,一家中國AI晶片創企剛剛吹響衝鋒的號角。

就在昨日,燧原科技官宣了其首款雲端訓練晶片邃思DTU、雲端訓練加速卡雲燧T10及計算及程式設計平臺馭算,雲燧T10單卡單精度算力達到20TFLOPS,放在全球雲端訓練晶片中比較也絲毫不落下風。

技術難、成本高、風險大、回報週期漫長等因素宛如一座座高山,將許多對造芯心嚮往之的創業者拒在雲端訓練晶片的門外。燧原科技創始人卻毫不猶豫地選擇先攻克雲端訓練方向,而且從啟動研發到開始量產首款雲端訓練晶片只用了短短20個月。

這家不足兩歲的AI晶片創企,憑什麼直攻這一AI晶片界難度最高的領域?它的創業團隊有怎麼樣的技術基因,能否支撐起雲端訓練產品的研發需求?面對強手如林的國際戰場,它有哪些差異化打法?

01AMD老兵創業,曾領導研發XBOX ONE和小霸王遊戲機主晶片

燧原科技的兩位創始人趙立東和張亞林在AMD工作時,就曾是配合默契的老搭檔。

2008年1月,張亞林剛加入AMD,趙立東是他的直屬老闆。兩個人合作了大約五年,趙立東負責整個團隊的構建、專案爭取,張亞林做執行和晶片的產出。

▲燧原科技COO張亞林

風靡全球的家用遊戲機微軟XBOX ONE系列,採用的主晶片即是由張亞林在AMD上海研發中心領導研發。

據張亞林介紹,遊戲機晶片設計與雲端晶片設計有共通之處,都是大晶片,而大晶片設計有一套嚴格的方法學,晶片越大,整個設計難度也會呈指數級上升。

以微軟XBOX ONE主晶片為例,它既要跑作業系統,又要能跑遊戲,是一塊由CPU+GPU結合的APU,設計難度非常高。

挑戰不止在設計本身,還有晶片工程化問題。

像XBOX ONE這樣一年需量產幾千萬臺的遊戲主機,要求大晶片能儘快量產。這也是中國產大晶片企業行路艱難的核心原因之一。

經過多個世界級晶片專案的磨礪,趙立東和張亞林都積累了深厚的晶片設計和工程化經驗。

▲燧原科技CEO趙立東

2014年末,兩人的同事關係暫時畫上句點。趙立東跳槽到紫光通訊科技集團任副Quattroporte,張亞林仍然留在AMD。

“我和立東在AMD有一個約定,”張亞林回憶道,“希望為中國做一些中國人的本土化專案。”

2016年,機會來了。老牌中國產遊戲機品牌小霸王在中山重新崛起,交給AMD大筆費用來做中國自主品牌的遊戲機專案,這個專案幾經輾轉到了張亞林手中,目標是造出一顆超大型晶片,使小霸王遊戲機的效能超過當時最先進的XBOX ONE的50%。

“我覺得,那是我留在AMD的最後一個夢想。”這一專案在2017年9月整體收尾,張亞林選擇離開,與時任紫光集團副Quattroporte的趙立東再次會合,投身於另一個頗具挑戰性的領域——雲端AI晶片。

02政策支援,騰訊投資,人才技術均已就緒

當他們選擇創立燧原科技並定下雲端AI晶片方向時,雲端資料中心中的中國產化AI晶片尚如一片荒原。

AI的發展是由模型演算法研究推及雲端終端的部署,如果上游的雲端訓練模型受到國外的掣肘,那麼整個AI發展都會被限制。

秉持著讓中國擁有更多自主前瞻性模型的初心,近20年的晶片研發經驗積澱,以及長期就職於外企而日漸濃厚的家國情懷,促使兩位燧原創始人決定在雲端晶片高舉高打。

在張亞林看來,晶片工程化、市場應用與演算法的整合、軟硬體加生態的全棧式設計能力,成為阻礙中國雲端晶片快速成長的三座大山。

畢竟,單獨做出一顆能拿出來看的晶片,和整個市場都能用的軟硬體解決方案,中間還隔有相當的距離。

人才和技術方面,中國積體電路產業經過近20年的發展,晶片設計人才和技術儲備均已成熟,足以研發大晶片。現在燧原207名成員中,研發團隊佔90%,來自全球30多家公司,平均工作年限10年以上,有豐厚的技術沉澱。

政策和資金方面,燧原也獲得了上海市自由貿易試驗區臨港新片區及多家投資機構的大力支援。燧原分別在2018年7月和2019年5月完成超3億人民幣的融資,前者由騰訊戰略領投,後者由紅點領投。

有趣的是,作為國內AI界的投資大戶,騰訊向提供資金支援的AI企業多聚焦於演算法、軟體與應用層面,鮮少關乎晶片研發。

市場機會、應用空間、人才紅利、資料資源、人才儲備、技術儲備、政策引領、資本支援等使能引擎均已就緒,共同驅動燧原雲端晶片在AI和積體電路交叉賽道上駛向前方。

03如何實現最強單精度算力?燧原的三大核心技術優勢

底層硬體的加速效率、價效比、能效比、可擴充套件性、易用性,以及是否可以有定製化、差異化,直接關乎整體業務的好壞。因此拿出有足夠硬核的晶片產品是任何一家AI晶片創企的首要任務。

昨天,燧原推出核心產品雲燧T10,內嵌雲端AI高效能通用訓練晶片邃思、搭載了計算及程式設計平臺“馭算”,覆蓋硬體與軟體。

▲燧原首款雲端訓練晶片邃思

從公佈的算力和測試指標來看,燧原已初步證明了自身的技術實力。

邃思晶片採用格羅方德12nm FinFET工藝和2.5D高階封裝技術,基於可重構晶片設計理念,具有高度並行化的特點,可實現通用可程式設計,並且能適配現有及未來可能的數學運算,適用於影象、資料流、語音等各種訓練場景。

雲燧T10單精度(FP32)算力達到20TFLOPS,半精度及混合精度(BF16/FP16)算力達80TFLOPS,在ResNet-50模型上每秒處理幀數為518fps,單位能耗下效能比達2.3fps/W。

這些成績即便放到全球雲端AI晶片領域來看也可圈可點。另外燧原還計劃在明年推進多卡互聯的Benchmark測試。

張亞林認為,燧原科技在技術方面有三大核心優勢。

其一,燧原推出的是覆蓋軟硬體和系統的全棧式解決方案。

其二,燧原在整個晶片研發過程中,融入大量專門針對AI加速的設計,並拋棄傳統設計與AI不相關的東西,致使整個AI軟硬體系統性價比得到極大提升。

儘管趙立東和張亞林都擁有豐富的CPU/GPU/APU相關研發背景,但他們打造的邃思晶片,在架構上沒有借鑑任何GPU設計經驗,而是從無到有的設計了一套單獨指令集和處理器,拋棄了以前所有的歷史包袱。

邃思晶片的計算核心包含32個通用可擴充套件神經元處理器(SIP),每8個SIP組合成1個可擴充套件智慧計算群(SIC)。SIC間通過HBM實現高速互聯,通過片上排程演算法,資料在搬遷中完成計算,從而最大化SIP利用率。

其三,燧原走的是全團隊開發模式,在後續與客戶的對接過程中,在本土化方面可提供最快速的響應和技術支援。

此外在互聯方面,燧原自研200GB雙向ESL(Enflame Smart Link,燧原片間互聯)技術,可實現晶片與晶片間、板卡與板卡間的高速互聯,在成本和算力拓展上均有較大優勢,在1024節點叢集規模下,其訓練線性度加速比達86%。

軟體是提升晶片易用性的重要工具,燧原對軟體及工具鏈同樣做了充分佈局,打造了計算及程式設計平臺馭算。

一方面,考慮到現有AI生態,馭算完全支援TensorFlow,下一階段將支援PyTorch、MXNet、ONNX等主流深度學習框架。上層客戶用這些框架做開發時,可以很快適配到燧原的軟硬體上。

另一方面,面向深度開發者,馭算也提供完整的開源工具鏈、SDK和軟體函式庫,使得對底層硬體資源有更多需求的開發者能與燧原合作定製甚至改動部分函式庫,從而實現硬體更為有效的加速。

04聚焦三大業務方向,定製化合作滿足差異化需求

從2019年起,全球AI晶片的核心話題已經從“拼效能”轉移向“拼落地”,不僅要求有好的算力和效能,還要在落地具體業務場景時,能夠儘可能的挖掘這些效能。

當前燧原的業務主要聚焦在三大方向:一是包括公有云、私有云、混合雲的雲服務商,二是金融、保險、醫療、網際網路等領域有很強模型訓練需求的行業客戶;三是AI超算中心和智慧城市。

經由對規模、效能、成本的綜合考量,燧原為大中小型資料中心提供單節點模式(標準PCIe卡)、單機櫃模式(整個機櫃)、叢集模式(ESL高速片間互連)3種互聯方案,以滿足不同客戶對深度學習的訓練需求。

▲包括8個雲燧T11(OAM模組)的AI訓練Box,通過OCP標準專用介面與CPU伺服器相連

在首批客戶的選擇上,燧原也非常審慎。

張亞林表示,燧原當前尋求的,是如何更有效地與有強相關性的合作伙伴產生互補效應。

燧原希望在中國找到志同道合的第一批客戶,來優先將更高性價比的AI訓練解決方案落地到這些客戶的業務場景,通過深入定製化合作,滿足客戶的差異化需求,從而產生更多前瞻性的AI演算法,打破壟斷局面,加速AI演算法的產生與落地。

在同客戶接觸時,燧原不急於立刻開展業務,而是先從客戶現有的業務模型當中進行泛化、抽取,以降低軟體遷移成本。

除了雲端訓練產品外,燧原也有云端推理產品線。張亞林透露,打通從訓練模型產生到推理模型部署的整個環節,是燧原在未來三年要構建的全生態終極目標。

不過燧原暫時還沒有入局終端晶片的規劃。張亞林認為,雲端的難度主要在技術和生態壁壘,而終端的難度則在於在細分市場找到定位,市場碎片化、演算法碎片化問題導致一款終端晶片很難打通用市場,至少要幾十萬片的出貨量才能補足前期開發投入的成本。

趙立東也提到,作為一家初創公司,燧原首先將有限的資源聚焦在一個點上,把這個“冰”破開,再橫向鋪開,這個市場就變得更加水到渠成。

▲燧原科技首款雲端AI訓練加速卡雲燧T10

截至現在,燧原科技已建設頂級工程化團隊,完成產品研發和量產,實現產品熱啟動,開啟首個AI訓練平臺的商業化落地。

下一步,燧原將繼續打造擁有高能效比、高利用率、高性價比的晶片,吸收軟體遷移成本,並逐步完善市場銷售、服務支援體系建設,不斷豐富產品解決方案,打造對使用者更友好易用的軟體工具,並持續引進高階人才,尋求建立廣泛的開源軟體生態系統聯盟。

05結語:明年AI晶片繼續拼落地

2019年被稱為AI晶片落地元年,張亞林相信,落地同樣也會是2020年的關鍵詞。

燧原在雲端AI晶片領域的一些思考,對於其他晶片設計創企同樣有借鑑意義。正如魏少軍教授所言,晶片不是搭草臺班子就能做好的,不僅要有硬核技術實力、工程化能力和團隊完整性,還要思考怎樣才是對的方法、時機、方向、產品和客戶。

打破國外在雲端晶片市場的壟斷絕非易事,但至少燧原已經邁出了充滿勇氣的第一步。我們也期待更多中國芯能夠邁過技術和落地的一道道難關,經受住時間和市場的考驗。

  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 河口 | 支付寶乘公交新功能上線!詳情看這裡