首頁>科技>

AMD、英偉達和Intel 三大晶片巨頭均希望擴大自身在高效能計算的版圖,並透過收購去獲取CPU、GPU和FPGA 等,實現雲端、PC 和移動的晶片組合,以完善其在資料中心、人工智慧、5G 和物聯網等產品線的佈局。AMD 擬收購FPGA 龍頭賽靈思加碼AI 計算並與Intel 看齊;英偉達早前完成並表Mellanox,目前又提出收購Arm,欲打造CPU+GPU 和雲+PC+移動的閉環;而Intel 早年已收購了FPGA 行業第二的Altera,以及ADAS 龍頭Mobileye, 在堅定“資料導向”的戰略下打造CPU+FPGA+儲存+GPU 的完整計算生態。晶片市場逐漸形成三足鼎立的格局。

AMD 早前宣佈以300 億美元收購FPGA 晶片龍頭賽靈思,如若收購成功,協同效應明顯。AMD 擁有CPU 和GPU(圖形處理器)的產品線,近兩年雖然以領先的7 納米制程不斷搶走Intel 在伺服器CPU 方面的份額(從2017年1%增長到2019 年8%),但在資料中心裡人工智慧GPU 應用方面,卻始終未能與英偉達匹敵。若能成功收購賽靈思,我們認為其FPGA(現場可程式設計門陣列)晶片將有望在雲計算資料中心以及AI 推理端搶佔份額,產品線可進一步跟Intel 看齊,同時也能獲得在通訊、5G、物聯網、工業軍工和汽車市場的入場券,協同效應明顯,重現2005 年的市佔率高峰指日可待。

賽靈思近年佈局的自適應計算加速平臺ACAP以FPGA+AI 引擎的方式實現異構加速。兩家公司在深度學習專案均有合作,包括賽靈思Alveo 加速技術+AMD EPYC 伺服器的協同方案;此外賽靈思收購深鑑科技獲得的深度學習處理器DPU 方案也能賦能AMD 在雲和邊緣計算的AI 計算實力,與英偉達進一步抗衡。

FPGA 可在系統製造完成後依據期望的功能進行重新程式設計,具備配置靈活、設計時間短、物料成本低的優點。它是作為專用積體電路(ASIC)領域中的一種半定製電路而出現的,既能解決了定製電路的不足,又能克服了原有可程式設計器件閘電路數有限的缺點。FPGA 的基本特點包括:

1、採用FPGA 設計ASIC 電路,使用者不需要投片生產,就能得到合用的晶片;

2、FPGA 可做其它全定製或半定製 ASIC 電路的中試樣片;

3、FPGA內部有豐富的觸發器和 I/O 引腳;

4、FPGA 是 ASIC 電路中設計週期最短、開發費用最低、 風險最小的器件之一;

5、FPGA 採用高速 CMOS 工藝,功耗低,可以與 CMOS、TTL 電平相容。

可以說,FPGA 晶片是小批次系統用來提高系統整合度、可靠性的最佳選擇之一。FPGA 是由存放在片內 RAM 中的程式來設定其工作狀態的,因此工作時需要對片內的 RAM 進 行程式設計。使用者可以根據不同的配置模式,採用不同的程式設計方式。

英偉達今年剛完成跟Mellanox 的並表,以強化高效能計算壁壘,觸及資料中心通訊傳輸和處理領域。英偉達資料中心業務在今年重拾動力,2016 年以來,AI 雲端訓練需求雖已達到更新迭代的週期,但新AI 應用才是需求放量的關鍵。未來AI 將應用於醫藥、金融和無人駕駛等方面,需求正在爆發。近日更推出DPU(資料處理器),把Arm 處理器核、VLIW 向量計算引擎和智慧網絡卡進行整合,提升在分散式儲存、網路計算和網路安全領域的效能。

英偉達早前提出以400 億美元收購移動處理器巨頭Arm,希望加入CPU 以擴大在GPU 以外的版圖,但能否收入囊中仍存疑。若能成功收購Arm,英偉達不但能鞏固移動端的產品線,也能打造一套完整的GPU+Arm 的伺服器計算架構。我們認為這架構有望成為低端x86 CPU 伺服器市場的新進者。然而,我們認為有兩個問題需要關注:

1)Arm 先天架構劣勢導致其在高效能計算市場尚無成功方案,計算生態也暫時難以與英特爾/AMD 的x86 CPU伺服器相匹敵。

2)行業對於英偉達併購Arm 存在異議,而有關監管機構亦或會對收購施加壓力。

英特爾也在經歷了管理層變革後展現出相對銳意改革的決心,我們認為公司繼續重點打造CPU+FPGA+儲存+GPU 的完整計算生態,還是能受益於全球雲計算需求成長週期。目前來看,英特爾依託其龐大的產品組合可及市場,仍然是雲計算、AI、5G、智慧駕駛、物聯網等市場發展的錨。另外從估值層面看,英特爾2021 年PS 3x,對比英偉達19x、AMD 9x,疊加返現,估值也相對較低。

賽靈思產品矩陣

賽靈思的產品矩陣由三類基於FPGA 的平臺產品構成:傳統的FPGA 及3D IC 產品;全可程式設計的SoC、MPSoC、和RFSoC 系列產品以及2019 下半年推出的自適應計算平臺ACAP 產品。三類平臺產品均隨著納米制程的不斷縮小(45nm、28nm、20nm、16nm 到7nm)進行升級,公司的技術演進也一直走在行業前列。

2013 年-2014 年,賽靈思在突破20nm 工藝節點的基礎上,釋出業內首款ASIC 級可程式設計架構UltraScale,不僅標誌著Xilinx 再次從納米制程上實現突破,也標誌著賽靈思不再侷限於以前的FPGA 行業,而是面向更廣闊的PLD+ASIC 市場。

2015-2016 年,賽靈思在UltraScale 架構上完成20nm 平面電晶體結構工藝向16nm電晶體工藝的技術擴充套件,還推出了第二代Zynq 全可程式設計SoC——Zynq UltraScale+多處理SoC (MPSoC)。該產品採用了16nm FinFET+工藝技術,異構多核處理的MPSoC 標誌著賽靈思SoC 系列產品再次完成重大技術演進。

2017 年,賽靈思推出第三代Zynq 全可程式設計SoC——Zynq UltraScale+ RFSoC,透過將直接RF 取樣技術取代分立資料轉換器,並將穩定可靠的Arm 級處理系統以及FPGA架構整合到單晶片器件中,在整合度方面實現重大突破,削減了50-75%的功耗和封裝尺寸。透過 Zynq UltraScale+ RFSoC,無線基礎設施製造商可實現顯著的佔板面積及功耗減少,為5G 建設中大規模部署MIMO 提供重要保障;同時作為面向可擴充套件、多功能、相控陣雷達的單晶片TRX 解決方案,Zynq UltraScale+ RFSoC 也能夠滿足軍工應用場景下複雜的需求並實現高效的響應。

2018 年,賽靈思採用最新的7nm FinFET 工藝技術,在RFSoC 的基礎上演進出業界首款自適應計算加速平臺(ACAP)Versal,將標量引擎、自適應引擎和AI 引擎相結合,實現顯著的效能提升,主要面向資料中心、有線網路、5G 無線和汽車駕駛輔助應用,並在2019 下半年正式出貨。此後賽靈思進一步擴充Versal ACAP 產品組合,先後釋出了Versal AI Core、Versal Prime 和Versal Premium 系列,針對超大規模資料中心工作負載加速。

目前,賽靈思將28nm、20nm、16nm、7nm 等製程產品歸類為先進產品,其他製程的產品歸類為核心產品,先進產品的銷售穩步增長。

賽靈思若能併入 AMD,對於AMD的AI 資料中心業務來說將會是如虎添翼。以往AMD在資料中心市場主要以伺服器CPU 為主營業務,而GPU 方面也主要應用於影象處理,在AI 加速計算市場目前尚難與英偉達正面交鋒。如若合併後AMD 有望能搶佔雲計算資料中心以及 AI 推理端份額,有效形成協同效應,也讓 AMD 產品線可進一步跟 Intel 和英偉達看齊。

賽靈思預計,未來三年公司整體市場規模空間的CAGR 增長將達到16%,從2020財年的150 億美元到2024 財年的280 億美元。

在雲計算深度學習上游訓練端,GPU是當仁不讓的第一選擇,但以 ASIC 為底晶片的包括谷歌的 TPU、寒武紀的 MLU 等,也如雨後春筍。以 TPU 為代表的 ASIC 定製化晶片,針對特定演算法深度最佳化和加速。我們認為深度學習 ASIC 晶片,將依靠特定最佳化和效能優勢,未來在細分市場領域發揮所長。而下游推理端更接近終端應用,需求更加細分。逐步形成 GPU 向推理端滲透,與 ASIC 和 FPGA 共同繁榮發展的格局。

此外,FPGA 依靠電路級別的通用性,加上可程式設計性,適用於開發週期較短的 IoT 產品、感測器資料預處理工作,以及小型開發試錯升級迭代階段等。

在自動駕駛行業中,賽靈思目前主要定位在 ADAS 層面,車載前置攝像頭處理單元出貨量僅次於Mobileye。雖然 2018 年全球無人駕駛行業出現陣痛期,但 2020 年的全球疫情一定程度上催化了智慧駕駛行業的發展。而隨著 L3 以下智慧駕駛需求的加速滲透,也有望在未來為賽靈思帶來新的成長空間。

2020 年 9 月,賽靈思宣佈將透過 Zynq UltraScale+ MPSoC 平臺支援大陸開發新款高階雷達感測器(ARS)540,聯手打造汽車行業首款量產版 4D 成像感測器。4D 成像雷達能夠透過距離(Range)、方位(Azimuth)、仰角(Elevation)和相對速度確定物體位置, 助力 L2 到 L5 等級功能。賽靈思的 Zynq MPSoC 可達到車規級,為 4D 雷達提供 DSP功能、網路介面和天線資料處理能力。Yole Dévelopement 預測 4D 雷達將首先出現在豪華轎車和自動駕駛出租車上,市場規模將達到 5.5 億美元。

英偉達:AI 晶片王者的重啟之年

英偉達在AI 訓練端基本佔壟斷地位,有賴於自身強勁的計算能力。而推理端則更重視低功耗和低延遲,對算力的要求雖然較低,但 GPU 的高適應性則體現在它的通用性和可程式設計性。在市場蛋糕變大的同時,逐步形成 GPU 向推理端滲透,與 ASIC 和 FPGA 共同繁榮發展的格局。

另外,英偉達透過收購 Mellanox 觸及資料中心通訊傳輸和處理領域。近日更推出DPU(Data Processing Unit,資料處理器),把 Arm 處理器核、VLIW 向量計算引擎和智慧網絡卡進行整合,提升在分散式儲存、網路計算和網路安全領域的效能。

Mellanox 在資料中心伺服器方面的核心產品InfiniBand 網路互聯,用於資料中心、超級計算機的資料傳輸和網路互聯,包括與微軟資料中心的合作方案中,將網路堆疊處理從CPU 解除安裝到網路,成為面向資料庫處理、人工智慧機器學習等高儲存需求工作負載的最佳解決方案。InfiniBand憑藉其低延遲和高吞吐量互聯特性,在高效能計算HPC 市場成為網路標準,目前這個市場主要供應商為Mellanox 和英特爾。此前傳出包括微軟、英特爾、賽靈思的競購,體現了公司在資料中心伺服器市場中的戰略卡位地位,也讓英偉達有機會打造“計算+傳輸”產品閉環。

InfiniBand 具有低延遲、高吞吐量的特點,近兩年TOP10 高效能計算機使用者有60-70%裝載InfiniBand,對比英特爾Omini-Path 的10%。基於這兩條產品線之上的Mellanox ConnectX-6 Dx 智慧網絡卡可增強系統安全性並降低延遲,在邊緣提供更加安全的實時AI處理。FY21Q2 起Mellanox 開始計入英偉達財報,5 月英偉達釋出7nm 的Ampere 新架構GPU,效能提升20 倍。當季效能計算晶片和網路連線貢獻收入創下歷史新高,資料中心業務收入同比提升167%、環比增長54%。

BlueField 2 搭載8 顆64bit 的Arm A72 CPU 核心,2 VLIM 加速器和Connect X6 Dx智慧網絡卡,可以提供雙埠最高100Gps 和單埠200Gps 的網路連線。BlueField 可以快速有效地捕獲、分析、分類、管理和儲存海量資料,實現RDMA/RoCE、DPUDirect、彈性儲存、分塊儲存加密和惡意外部應用自動檢測等功能,從而實現單顆DPU 晶片對125個CPU 核心的釋放。BlueField 2X 在此基礎上集成了5 月新發布的7 nm 級Ampere 架構GPU 和第三代Tensor 核心,可透過AI 加速資料中心的安全、網路連線、資料儲存等任務。

此外,英偉達還發布了面向開發者的平臺DOCA SDK,透過整合Ampere GPU 和BlueField2 DPU 最佳化EGX AI 平臺,向流媒體、智慧駕駛、醫療等終端場景擴充套件。BlueField 2 DPU目前處於樣品階段,預計2021 年將在伺服器製造商的新系統中使用。BlueField 2X DPU正在開發中,預計將在2021年上市。

英偉達預計BlueField 3 和BlueField 4 將於22/23年釋出,預計效能可提升1000 倍,達到75/400TOPS,400Gbps,吞吐量有望較BlueField2提升1000 倍。英偉達希望憑藉GPU 和Mellanox 智慧網絡卡技術壁壘的協同效應,再輔以Arm 處理器整合協同後的效能提升,有望進一步抗衡英特爾/AMD 的x86 CPU 體系。

英特爾堅定的“資料導向”戰略

英特爾堅定以“資料導向”為戰略,重新上路聚焦主營。英特爾早在2015 年已收購了FPGA 行業第二的Altera,在2017 年收購ADAS 龍頭Mobileye,以擴大自身在人工智慧和資料中心的版圖。值得注意的是,若AMD 完成對賽靈思收購,市場上只剩下Microchip和萊迪斯兩家FPGA 公司。此外近日SK 海力士宣佈將以90 億美元收購英特爾NAND 快閃記憶體及儲存業務,也讓英特爾能更為聚焦主營業務。

Intel 雖然計劃今年投資150 億美元和擴建晶圓廠,但關鍵在於公司能否跟上臺積電的先進製程腳步。對於先進產能的追求變成負擔,以及是否將7nm 產能外包給臺積電的猶豫反覆,都可能讓英特爾在高效能計算競爭中日漸式微。

參考文獻:中信證券 半導體產業的三分天下:英偉達、AMD、英特爾

10
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 哈文跨境:亞馬遜、速賣通、蝦皮,哪一個更適合跨境小白?