本屆會議上,IBM、三星等公司展示了其在AI晶片領域的最新進展;谷歌、德州儀器等公司分享各自在雷達晶片中使用的創新技術;英特爾、荷蘭代爾夫特理工大學等則展示其在量子晶片研發方面的最新嘗試……
▲ISSCC 2021期間晶片領域新進展彙總
一、AI晶片:產學界玩家齊現身,五款AI晶片競技在ISSCC 2021會議上,IBM、三星兩家公司,南洋理工大學、哥倫比亞大學兩大學府的研究團隊,分別分享了各自在AI晶片領域的最新進展。
其中,IBM、三星分別從提高AI晶片能效和效能著手,兩大學府則分別著力提升AI晶片對影象、聲音的識別能力。
1、IBM:晶片能效比高過NVIDIA A100
IBM在ISSCC 2021大會上發表了據稱是“全球首款”採用7nm製程工藝的高能效、低精度訓練/推理AI晶片,該晶片整合四核心,面積為19.6平方毫米,可達到80%以上的訓練利用率和60%以上的推理利用率,而通常情況下,GPU的利用率在30%以下。
相比同樣採用7nm製程工藝的NVIDIA A100 GPU,IBM新款AI晶片具備能效優勢。具體來說,NVIDIA A100 GPU在int4精度下的能效比為3.12TOPS/W;而IBM新款AI晶片在同等精度下的能效比為8.9TOPS/W。
這背後,IBM為其新款AI晶片採用了超低精度混合8位浮點格式(HFP8,hybrid FP8)。這是IBM於2019年釋出的一種高度最佳化設計,允許AI晶片在低精度下完成訓練任務和不同AI模型的推理任務,同時避免質量損失。
此外,IBM新款高能效AI晶片添加了電源管理功能,可減緩晶片計算過程中的功率消耗。
2、三星:釋出業界首款內嵌AI晶片的高頻寬記憶體
在ISSCC 2021上,三星釋出了一款高頻寬記憶體處理器(HBM-PIM,high-bandwidth memory, processing-in-memory),這是業界首款內嵌AI晶片的高頻寬記憶體,可用於加速資料中心、高效能計算應用、人工智慧應用。
三星指出,當他們用現有的HBM2 Aquabolt系統測試新技術時,發現系統性能翻了一番、能源消耗降低了70%。
目前,三星還在與AI解決方案合作伙伴對HBM-PIM技術進行測試,並期待在2021年上半年看到對HBM-PIM技術的測試結果。
原理方面,該處理器集成了一個以300MHz頻率執行的PCU(Program Control Unit,程式控制部件)。該PCU由主機CPU採用常規記憶體命令控制,可以直接在DRAM單元中執行FP6運算。
此外,當系統執行的應用程式不是為HBM-PIM編寫的時候,HBM-PIM可以作為常規RAM執行。
3、三星:5nmAI晶片跑CNN模型能效比達13.6TOPS/W
除釋出高頻寬記憶體處理器外,三星還分享了其5nm三核心AI晶片的技術細節,該芯片面積為5.46平方毫米,額定電壓在550~900mV之間,時鐘頻率在332MHz~1.2GHz之間。
效能方面,在相當於多執行緒CPU操作的吞吐量優先順序模式下,該晶片在332MHz下的每秒推理數為194;在1.196GHz下,該晶片的每秒推理數為623。
能效方面,在0.6V電壓下,該晶片對CNN模型Inception-V3的執行結果顯示,其能耗為每焦耳的推理數為1190,能效比為13.6TOPS/W 。
據三星方面分享,其5nm三核心AI晶片的每個核心中,都集成了2個子核心(卷積引擎)、1個向量處理器單元,以及一兆位元組的暫存器。其中,每個子核心都具備權重–特徵對映(weight-feature map)。每個週期中,該晶片可以執行16維向量的64個點積。
4、南洋理工大學&哥倫比亞大學:分享動作/聲音識別晶片絕技
新加坡南洋理工大學和美國哥倫比亞大學在ISSCC 2021會議上展示的晶片均採用65nm製程。
其中,南洋理工大學分享了一款實時手勢識別晶片,該晶片適用於可穿戴和物聯網裝置場景。這款晶片採用65nm製程,面積為1.5平方毫米,可用於識別24種動態手勢,平均準確率為92.6%。在0.6V電壓下,功率為184μW。
哥倫比亞大學團隊則分享了一款噪聲識別晶片。據哥倫比亞大學分享的資料,在570nW功率下,該款晶片解決方案在5~20dB的信噪比範圍內,對4種不同噪聲型別的識別精度可達到89~94%。
二、雷達晶片:谷歌/德州儀器分別揭秘手機/車用雷達技術細節在雷達晶片領域,谷歌和德州儀器的演講者分別現身進行技術講解。
谷歌首次揭秘搭載於Pixel 4手機的“Soli”雷達晶片技術細節;德州儀器則分享了其車用雷達晶片、工業用雷達晶片的獨特設計。
1、谷歌:揭開手機雷達晶片5米“識人”秘訣
谷歌的“Soli”雷達晶片搭載於Pixel 4手機中,可用於識別手機前方5米範圍內的人類手勢,並將距離誤差控制在800mm內、將角度誤差控制在80度範圍內。
該晶片採用英飛凌公司的0.13μm製程BiCMOS工藝製造,1.8V下的峰值功率小於400mW。
據谷歌分享,“Soli”雷達晶片由一個發射通道和三個接受通道組成。每個通道均在5*6mm封裝的頂部封裝共振貼片天線,天線體積小到可以嵌入手機面板。
此外,共振貼片天線被切割到晶片4層金屬層封裝的頂層,並在下層中有饋線(feeder)。資料顯示,“Soli”晶片的收發隔離度可以達到20dB以上。
▲谷歌“Soli”雷達晶片天線示意圖(圖中左部)
2、德州儀器:兩款45nm雷達晶片的架構秘訣
德州儀器在ISSCC 2021大會上分享了兩款45nm雷達晶片的技術細節,兩款晶片均採用覆晶技術封裝,具備9層金屬層。
其中一款用於76~81GHz頻段下的FMCW汽車雷達;另一款採用封裝整合天線,適用於60GHz頻率下的工業感測。
據德州儀器在ISSCC大會上分享,適用於60GHz頻率下工業感測的雷達晶片採用了一種“無模型晶片級倒裝晶片封裝(mould-less under-mount chip-scale flip-chip package)”。
該晶片中,天線安裝於15×15mm球柵陣列封裝(BGA)和60GHz死區的底部。發射天線和接收天線均為凹型(cavity-backed)的“E”型貼片。
三、量子晶片:英特爾22nm低溫CMOS可驅動16個自旋量子位元放眼整個行業,量子晶片發展尚處於初級階段。但是,量子計算強大的並行運算能力,吸引著眾多玩家在這個新興領域進行不輟探索。
本屆ISSCC大會上,英特爾、代爾夫特理工大學、洛桑聯邦理工學院和劍橋日立,分享了他們在量子晶片設計方面的心得。
1、英特爾:展示可驅動16量子位元的22nm量子晶片
英特爾展示的量子晶片採用22nm FinFET工藝製造,可在4K溫度下執行,實現了最多對128個量子位元(qubit)的控制。
該晶片與一個被冷卻到20mK溫度下的自旋量子位元相鄰。為增加量子晶片的靈活性,英特爾晶片設計人員還在該晶片上增加了一個微控制器。
該晶片具備量子位元讀出(Qubit Readout)和多門控脈衝(Multigate Pulsing)兩大功能。
透過多頻率複用,該晶片可在一條射頻線路上驅動多達16個自旋量子位元,並同時讀取6個量子位元的狀態和控制22個門電位。透過同時控制多個門電位,該晶片可有效地進行量子位元讀取、實現多個量子位元的糾纏和操作。
▲英特爾量子晶片示意圖(圖片右部)
2、代爾夫特理工大學&洛桑聯邦理工學院等:分享量子計算低溫CMOS技術新進展
來自荷蘭代爾夫特理工大學的研究團隊分享了兩項量子計算低溫CMOS技術。
其中,一款低溫CMOS在4.2K的執行溫度下,增益為58dB、噪聲係數為0.6dB;一款模擬數字轉換器能以36.2dB SNDR、低於0.5mW/量子位元的功耗讀取多個量子位元。
瑞士洛桑聯邦理工學院和劍橋日立分享了他們在低溫CMOS領域的一項聯合研究,即一款採用40nm製程標準CMOS工藝製造的量子晶片。
該晶片在5~6.5GHz操作頻率下增益為70dB、噪聲係數為0.55dB,可讀取70個量子位元,能耗為1.5mW/量子位元。
結語:9大技術彰顯晶片設計風向標作為已有近70年曆史的積體電路設計領域頂會,ISSCC會議彙集了各領域晶片設計玩家的最新技術突破與探索。
可以看到,在AI晶片領域,除了不斷提升晶片算力以外,最佳化能效比日益為晶片設計玩家所重視。此外,物聯網應用加速落地與雷達晶片技術升級相互促進、產學界對量子晶片技術的探索亦未停歇。
此外,除了上述提及的與會玩家,還有其他玩家展示了其產品的最新應用情況。比如,NVIDIA、百度分別攜A100 GPU、百度崑崙1通用AI處理器線上亮相。