英特爾創始人之一戈登·摩爾(Gordon Moore)提出的摩爾定律(Moore's law),是指積體電路上的電晶體數目每兩年(或18個月)會增加一倍,該定律已經被奉為半導體產業圭臬。
即使摩爾定律這幾年一直遇到瓶頸與挑戰,半導體大廠仍是努力以各種方式延續該定律的生命,讓半導體技術持續延展創新。
在AI領域,我們也常聽到“黃氏定律 (Huang’s Law)”,是預測 GPU 將推動 AI 效能實現逐年翻倍;該定律是由英偉達 NVIDIA 執行長黃仁勳名字命名。
在英偉達 2020 年的 GTC 中國線上大會中,首席科學家 Bill Dally 指出,英偉達的研究人員致力於打造速度更快的 AI 晶片,並將其用於具有更高頻寬的系統,從而簡化程式設計。
Dally 以三個專案為例,講述了自己帶領的 200 人的研究團隊如何成功實現“黃氏定律(Huang’s Law)”。
所謂的“黃氏定律”是以英偉達執行長黃仁勳名字命名的定律,預測 GPU 將推動 AI 效能實現逐年翻倍。
Dally 表示,如果我們真想提高計算機效能,黃氏定律就是一項重要指標,且在可預見的未來都將一直適用。
圖說:英偉達幫助 AI推理效能每年提升一倍以上
為實現這一突破,英偉達研究人員專門開發了一種名為 MAGNet 的工具,其生成的 AI 推理加速器在模擬測試中,能夠達到每瓦 100 tera ops 的推理能力,比目前的商用晶片高出一個數量級。
MAGNet 採用了一系列新技術來協調並控制透過裝置的資訊流,最大限度地減少資料傳輸,而資料傳輸正是當今晶片中最耗能的環節。這一研究原型以模組化實現,因此能夠靈活擴充套件。
另外,研究團隊還開展了一項研究,試圖以更快速的光鏈路取代現有系統內的電氣鏈路。
Dally 在 2009 年加入英偉達之前,曾任斯坦福大學計算機科學系主任,個人擁有 120 多項專利。他表示,可以將連線 GPU 的 NVLink 速度提高一倍,也許還會再翻番,但電子訊號最終會消耗殆盡。
該團隊正在與哥倫比亞大學的研究人員密切合作,探討如何利用電信供應商在其核心網路中所採用的技術,透過一條光纖來傳輸數十路訊號。
這種名為“密集波分複用”的技術,有望在僅一毫米大小的晶片上實現 Tb/s 級資料的傳輸,是如今互連密度的十倍以上。
除了更大的吞吐量,光鏈路也有助於打造更為密集型的系統。Dally 舉例展示了一個未來將搭載 160 多個 GPU 的 NVIDIA DGX 系統模型。
圖說:工程師藉助光鏈路,在單一系統中可搭載160多個GPU
軟體方面,英偉達的研究人員開發了全新程式設計系統原型 Legate。開發者藉助 Legate,即可在任何規模的系統上,運行針對單一 GPU 編寫的程式——甚至適用於諸如 Selene 等搭載數千個 GPU 的巨型超級計算機。
Legate 將一種新的程式設計速記融入了加速軟體庫和高階執行時環境 Legion,目前它正在美國國家實驗室接受測試。
除上述三項研究,Dally 還在主題演講中談到了英偉達特別針對醫療健康、無人駕駛汽車和機器人等眾多行業打造的平臺。他表示,經過幾代人的努力,英偉達的產品將透過基於物理渲染的路徑追蹤技術,實時生成令人驚豔的影象,並能夠藉助AI構建整個場景。
此外,他還首次公開展示了英偉達的對話式 AI 框架 Jarvis 和 GauGAN的完美組合。GauGAN利用生成式對抗網路,只需簡略構圖就能建立風景圖。
再者,光線追蹤領域的進展都始於英偉達研究院打造的原型。2011年,Dally 委派研究員 Bryan Catanzaro 與斯坦福大學教授 Andrew Ng 共同合作一個專案,後來打造 出 CuDNN 軟體,讓深度學習領域大量的研究工作成為可能。