這不,2021年剛開年,頂級科學期刊《Nature》上就在一天之內連發兩篇利用光學特性加速AI處理的光子晶片論文。
論文連結:https://doi.org/10.1038/s41586-020-03063-0
其中一篇論文題目為《用於光學神經網路的11 TOPS光子卷積加速器(11 TOPS photonic convolutional accelerator for optical neural networks)》,論文主要作者有Xingyuan Xu、Mengxi Tan等人,來自澳大利亞斯威本科技大學、蒙納士大學、皇家墨爾本理工大學、香港城市大學、中國科學院等科研院所。
該論文展示了一種通用光學向量卷積加速器,其計算速度可超過10 TOPS(每秒10萬億次運算),能生成足以進行人臉識別的25萬個畫素的影象卷積。研究人員使用相同硬體執行一個有10個輸出神經元的光學卷積神經網路,識別手寫數字影象的準確率達88%。
論文連結:https://doi.org/10.1038/s41586-020-03070-1
另一篇論文名為《利用積分光子張量核的並行卷積處理(Parallel convolutional processing using an integrated photonic tensor core)》,論文主要作者有J. Feldmann等人,來自美國匹茲堡大學、德國明斯特大學、英國牛津大學、埃克塞特大學、瑞士洛桑EPFL及蘇黎世IBM研究實驗室等科研院所。
該論文介紹了一個基於張量核心的計算專用整合光子硬體加速器,透過將相變材料與光子結構結合,運算速度可達每秒數萬億次乘累加運算(每秒1012次MAC運算或每秒tera-MAC運算)。
一、光學頻率梳為光子計算帶來新機遇因效能出色,人工神經網路被廣泛用於AI處理任務,這些網路使用多層相互連線的人工神經元執行復雜的數學運算,使用大多數計算資源的基本運算稱為矩陣向量乘法。
為了加速人工神經網路計算任務,人們已經進行了各種努力來設計和實現特定的電子計算系統,尤其在專用積體電路、類腦計算和存內計算定製晶片方面已取得相當大的成功。
電子是電子計算中資訊的載體,而光子長期以來一直被視為替代選擇。
光譜涵蓋了廣泛的波長範圍,因此許多不同波長的光子可以同時進行多路複用(並行傳輸)和調製(以使其可以攜帶資訊的方式進行更改),而不會相互干擾光訊號。資訊以光速傳播則可以帶來最小的時間延遲。
此外,無源傳輸(不需要輸入功率)有助於超低功耗,且相位調製(從而改變了光波的量子力學相位)使得光在頻率大於40 GHz時易於調製和檢測。
過去幾十年,光學通訊取得了巨大的成功,但使用光子進行計算仍具有挑戰性,尤其是在與最先進的電子處理器相當的規模和效能水平上。
這種困難來自於缺乏合適的平行計算機制、材料來允許人工神經元進行高速非線性(複雜)響應,以及將可擴充套件光子器件整合到計算硬體中。
幸運的是,過去幾年中稱為光學頻率梳裝置的發展為整合光子處理器帶來了新的機遇。
光學頻率梳是一組具有發射光譜的光源,由成千上萬條頻率均勻且緊密間隔的清晰光譜線組成。這些裝置在光譜學、光學時鐘計量學和電信等各個領域都取得巨大的成功,並獲得了2005年諾貝爾物理學獎。
光學頻率梳可被整合到計算機晶片,並作為用於光子計算的高功率效率的能源。該系統非常適合於透過波長複用進行資料並行處理。
二、單個光子處理器核心算力超10 TOPS在論文《用於光學神經網路的11 TOPS光子卷積加速器》中,Xu及其同事使用這樣的設定來生產通用整合光子處理器。該裝置執行一種矩陣-向量乘法,用於影象處理應用的矩陣卷積。
作者採用了一種巧妙的方法來進行卷積。他們首先使用色散(傳輸光的速度取決於其波長)來為波長複用的光訊號產生不同的時間延遲。然後,他們沿著與光的波長相關的維度組合這些訊號。
▲光學CNN結構
透過充分利用大範圍的光子波長,Xu等人實現了針對不同卷積運算的平行計算。使用單個處理核心,光子計算速度超過10 TOPS,能在超過14千兆赫的頻寬下工作,且僅受資料吞吐量的限制。
三、將相變材料儲存單元與光學頻率梳結合在論文《利用積分光子張量核的並行卷積處理》中,Feldmann和他的同事獨立地製造了一個整合光子處理器,透過使用整合張量核心可進行並行卷積處理。
該裝置在基於相變材料(可以在非晶相和結晶相之間切換的材料)的存內計算架構中使用光學頻率梳。作者透過波長複用對輸入資料進行充分的並行處理,並利用相變材料整合單元陣列進行了類似的矩陣-向量乘法運算。
這種高度並行化的框架可以在單個步驟中高速處理整個影象。此外,原則上,在不久的將來,該系統可以使用商業製造程式進行大規模擴充套件,並將有助於現場機器學習。
由於卷積過程涉及無源傳輸,理論上光子處理核心的計算能以光速和低功耗執行。這種方法具有可擴充套件性和可訓練性,對於能源密集型應用非常有價值,如雲計算、自動駕駛汽車、實時影片識別等要求較高的應用。
該研究主要作者之一明斯特大學研究生Johannes Feldmann說:“利用光進行訊號傳輸,使處理器能夠透過波長多路複用執行並行資料處理,這帶來更高的計算密度,並且僅需一個時間步長,就能進行許多矩陣乘法。相比通常在低GHz工作的傳統電子裝置,光調製速度可以達到50至100GHz範圍。”
結語:光子晶片或成未來計算架構可行路徑這些研究結果表明,整合光子技術在需要大量資料的人工智慧應用(如自動駕駛、實時影片處理和下一代雲計算服務)中具有並行、快速和高效計算硬體的潛力。
鑑於傳統電子計算方法面臨的挑戰,整合光子技術的出現令人興奮,它正成為實現未來計算架構前所未有效能的一個潛在接班人。
不過,構建實用的光學計算機需要材料科學、光子學、電子學等領域的研究人員之間的廣泛跨學科努力和合作。
儘管報道的光子處理器具有較高的單位面積計算能力和潛在的可伸縮性,但是全光學計算規模(光學人工神經元的數量)仍然很小。另外,因為存在固有地吸收光的計算元件,且電訊號和光訊號經常需要轉換,能量效率會受到限制。
另一個研究途徑是發展先進的非線性整合光子計算體系結構,而非一維或二維的線性卷積。透過將電子電路和數千或數百萬個光子處理器整合到合適的體系結構中,同時利用光子和電子處理器的混合光電框架可能在不久的將來,帶給AI硬體革命性的變化。這些硬體將在通訊、資料中心操作和雲計算等領域具有重要的應用。