自從30年前Altera和Xilinx開創可程式設計邏輯器件這一晶片型別以來,FPGA經歷了巨大的變化,雖然憑藉其靈活性和高效能而得以在科研、醫療和航空等高階計算領域得到廣泛應用,但FPGA技術和市場始終是一個利基市場產品,在市場規模和銷量方面難以跟CPU和GPU這類通用晶片相提並論。然而,隨著雲端計算和AI的興起,特別是微軟和亞馬遜這兩家網際網路巨頭將FPGA引入其雲端計算平臺,FPGA開始受到業界更廣泛的關注,已經成為一個炙手可熱的高速增長市場。
資料中心對FPGA加速卡的需求強勁
網際網路巨頭、雲端計算服務商和大型企業對資料中心的高效能運算需求越來越大,尤其是深度學習等對AI訓練和推理的算力需求如飢似渴,傳統的CPU已經無法滿足要求。GPU、FPGA和專用晶片(ASIC)在這方面找到了用武之地,於是產生了基於CPU、GPU、FPGA和ASIC的各種加速卡,以行業標準介面插入伺服器即可馬上為AI和資料密集型應用帶來10-100倍的加速處理效能。
圖1:FPGA在多種資料密集型應用中效能都比傳統CPU高出10-100倍
據Semico研究公司預測,全球資料中心加速器(包括CPU、GPU、FPGA和ASIC)市場規模將從2018年的28.4億美元增長到2023年的211.9億美元,年複合增長率(CAGR)高達50%。其中增長最快的當數FPGA加速器,2018年只有10億美元,到2023年將超過50億美元,其增長驅動力主要來自企業級資料負載加速應用。
FPGA加速卡對比:Achronix、Intel和Xilinx
FPGA行業最大的兩家廠商Intel和Xilinx都於今年8月份釋出了最新的FPGA加速卡。Xilinx的Alveo U50加速卡採用Xilinx UltraScale +架構,是其首款採用半高、半長尺寸的Alveo產品,與英偉達的T4 GPU卡尺寸相同。U50具有8GB高頻寬記憶體(HBM2)、超過400 GBps的資料傳輸速度、100 GB/秒的網路連線,並支援PCIe Gen 4和CCIX,其功耗為75瓦。
Intel則釋出了FPGA PAC D5005,這是其可程式設計加速卡產品組合的第二個型號,它基於Intel Stratix 10 SX FPGA,與Intel Acceleration Stack(包括加速庫和開發工具)配合可以為Xeon伺服器提供資料密集型工作負載的加速。與Intel第一個基於Arria 10 GX FPGA的加速卡相比,FPGA PAC D5005具有三倍的可程式設計邏輯、高達32 GB的DDR4記憶體(增加了4倍)和更快的乙太網埠(兩個100GE埠與一個40GE埠)。小尺寸和低功耗的Arria 10 GX FPGA PAC加速卡適用於各種伺服器,而大尺寸和大功率的PAC D5005則用於提供更高效能的加速。
Achronix在品牌知名度方面也許不如Intel和Xilinx,但其FPGA晶片在技術性能上卻毫不遜色,尤其是其最新的Speedster7t。這一專門針對高頻寬工作負載而優化的高效能FPGA晶片具有如下特性:
採用TSMC 7nm工藝製造16個GDDR6通道,可提供高達4Tbps的儲存器頻寬4個400G乙太網介面(4x400G或16x100G)72個SerDes埠,支援1-113Gbps資料速率4個PCIe Gen5埠,支援16通道和8通道配置
圖4:Achronix Speedster7t採用一種全新的二維片上網路(2D NoC)佈線結構
相對於Xilinx UltraScale +和Intel Stratix 10 SX FPGA的特別之處在於,Achronix Speedster7t在設計上採用了一種新的二維片上網路(2D NoC)佈線結構,類似於城市高架立交橋的設計架構,可以極大緩解交通堵塞。此外, Speedster7t還使用一種靈活的機器學習處理器(MLP)專門針對人工智慧/機器學習(AL/ML)進行了優化,比如支援多種浮點格式和整數格式,在Int8整數格式下可以提供多達41k的乘累加單元(MAC)和高達134TOPS的運算能力。
圖5:Achronix市場營銷副QuattroporteSteve Mensor與BittWave公司副QuattroporteSam Bichara在深圳聯合釋出VectorPath加速卡
最近Achronix與Molex集團旗下的FPGA加速卡設計公司BittWave合作,開發出基於Speedster7t的VectorPath加速卡。這一高效能FPGA加速卡採用全高和3/4長(跟GPU一樣)的外形尺寸,具有雙倍寬頻,有被動式、主動式和液冷三種散熱方式,專門針對雲平臺服務商和企業級資料中心應用。此外,BittWave還為其提供了完整的FPGA開發工具BittWork II,具有完整的板塊管理控制器(BMC),支援Linux和Windows作業系統。其開發工具包包括API、PCIe Drivers、應用案例設計,以及診斷和自測等。
圖6:Achronix與BittWave合作開發的VectorPath加速卡基於Speedster7t FPGA晶片
VectorPath加速卡可以支援一系列高速資料和儲存介面,包括:
除了FPGA原廠Intel和Xilinx提供FPGA加速卡之外,還有一些第三方開發商也提供針對特定應用的FPGA加速卡,比如被英偉達收購的Mellanox提供FPGA智慧網絡卡Innova-2 Flex,浪潮基於Xilinx FPGA的F37X加速卡集成了8GB的HBM2片上快取記憶體,而華為基於16nm工藝UltraScale+ FPGA開發的FX系列中端加速卡的典型功耗為75瓦,高階卡為200瓦。
30年來專注於FPGA卡開發的BittWare及其同行Nallatech均被電子元件產品供應商Molex收歸旗下,併合併成為新的BittWare公司,從而成為服務於計算、網路和儲存應用市場的專業FPGA加速卡開發商。除了基於Intel和Xilinx的FPGA晶片開發FPGA加速卡外,BittWare首次與Achronix合作,開發出更高效能的VectorPath加速卡,同時還可以為資料中心客戶提供整合多張VectorPath加速卡的TeraBox FPGA伺服器。
結語
面對全球資料中心和企業級應用對計算加速的巨大需求,Intel憑藉其CPU+FPGA的優勢而佔據著主導地位,Xilinx則與AMD合作爭搶這一利潤豐厚且高速增長的市場。而Achronix作為FPGA市場的“小而美”玩家,也有其獨到之處,與Molex/BittWave合作提供FPGA加速卡將會加速其FPGA晶片在這一市場的推進速度,從而在高效能運算、儲存和網路加速市場佔據一席之地。