隨著人工智慧和物聯網技術的發展,半導體產業也迎來了新的機遇,中國的晶片產業呈現出蓬勃發展的狀態。作為全球領先的半導體智慧財產權提供商Arm公司,全世界超過95%的智慧手機和平板電腦都採用Arm架構。Arm中國董事長兼執行長Allen Wu表示,中國客戶推出的Arm晶片銷量已超過160億,Arm是唯一的非美國計算平臺,Arm會像過去一樣,持續向中國合作伙伴提供技術支援。2019年10月25日,年度科技大會“2019 Arm年度技術論壇”在上海浦東麗思卡爾頓酒店成功舉辦,來自Arm和業界的專家們分享了未來技術的洞察和靈感,共同探討全球智慧科技的最新脈動,下面是論壇的精彩演講內容。
論壇首先由Arm 中國執行董事長兼執行長Allen Wu作歡迎致辭,Allen Wu表示,Arm徹底改變了社會的生活和生產方式。隨著第五波計算革命的來臨,這是一個數字驅動的時代,超過1,500億顆晶片出貨,Arm無處不在。以自動駕駛為例,Arm架構的晶片可以在晶片算力、成本和功耗上達到最佳。Arm是全球唯一的支援萬億級計算架構和生態系統的公司。未來,無論是本地還是邊緣及雲端對AI能力的更高要求,將推動算力的提升,一個全新的計算時代即將到來。
隨後,Arm市場營銷計劃副QuattroporteIan Smythe帶來了主題為《Arm Keynote Speech》的演講,他表示,我們正在進入一個新的計算時代,也就是第五波的計算時代,5G、物聯網、大資料和雲端計算等給產業帶來了新的機遇和體驗。Ian Smythe提到了Arm支援特定任務的SoC定製,包括Arm從產品演進的焦點轉移到運用實際案例驅動的解決方案;跨IP邊界進行優化,並在解決方案中改進產品;採用系統方法解決未來的工作量。
緊接著,Arm中國物聯網服務小組負責人Ray Chen的演講主題是《使物聯網成為可能—從裝置到資料》,他表示,未來是資料驅動的計算時代,是物理和數字的融合世界,物聯網、5G和機器學習技術的發展,給裝置和資料帶來了機遇。數字增長,帶來資料爆炸,Arm要做的就是將物理資料和數字資料進行融合,迎接新的計算時代,他提到,中國是Arm在全球最重要的市場之一。他認為,物聯網的發展帶來了物理資料的迅速增長,到2035年,5G世界將有1萬億物聯網裝置。Ray Chen表示,下一代應用程式將結合物理和數字資料通過資料應用程式進行數字轉換。效率、成本和收入等都是考量的關鍵,新的業務應用程式是否帶來資料價值,帶來連線性、可伸縮性和受限裝置的安全性,這些都是重要的因素。
然後是Centec Networks執行長兼聯合創始人James Sun進行演講,他的演講主題是《5G和AI時代的網路交換晶片:應用,設計和挑戰》,James Sun表示,盛科網路15年專注於乙太網交換晶片和系統,網路交換機能為子網路中提供更多的連線埠,以便連線更多的計算機,乙太網技術已成為當今最重要的一種區域網組網技術。網路交換晶片是交換機的核心部件,每秒傳輸幾兆位的資料,它的應用包括資料中心、光學、雲端計算和5G等。他提到,伴隨著5G、AI和雲驅動頻寬的增長,網路交換晶片為了適應下一代高速網路特點的需要,提供網路服務品質控制,不斷適應新的網路應用,邊緣計算和工業網路也帶來了晶片的增長。如何有效管理和操作網路,在智慧網路時代,人工+控制器+基礎網路是一種趨勢,換號、機對機API、遙測網路、狀態和行為等都將出現。盛科網路研發的開關晶片整合計算能力,預先計算視覺化資料以減少對網路分析伺服器或網路控制器的壓力,Centec正在把聲波傳送到ARM平臺,配合最佳效能/電力/成本,晶片將引領未來的創新。
在Arm高階產品營銷經理Helena Zheng帶來的主題為《加速AI工作負載的解決方案》的演講裡提到,AI在端點中被用來做聲音的識別和建立,關鍵字定位、語音識別,自然語言處理、語音合成等。市場上對人工智慧需求的多樣性,其中對於設計者而言,需要考慮最佳的使用者體驗和響應能力,高效節能設計的最高效能,卓越的中檔設計使用者體驗,平衡效能與面積和功率,提供最先進的使用者體驗、降低成本的設計方案,在最小的區域優化效能等。針對AI帶來的工作負載,Arm高階產品營銷經理Helena Zheng表示,Arm為每個細分市場引入Ethos NPUs,如Arm Ethos-N77針對性能關鍵型的人工智慧,能進行應用程式的交付,同時又有成功的案例;Arm Ethos-N57使人工智慧應用在中端裝置平衡,成本與效率上表現出色,電池壽命限制完美;Arm Ethos-N37支援人工智慧應用程式,適用於對成本最敏感的應用和端點裝置。建立一個成功的人工智慧生態系統需要一個地球村,通過只有Arm才能帶來的可信賴的合作伙伴關係來平衡這個新世界,Arm生態系統是幫助你建立完整的解決方案,人工智慧生態系統從優化CPU軟體開始擴充套件到GPI和Arm NPUs,Arm人工智慧生態系統擁抱開源軟體Arm NN,Arm AI生態系統提供端到端的開發者資源在任何地方快速、輕鬆地部署AI應用程式,Arm在市場中的中心地位保證了最強的人工智慧生態系統。Arm的精神理念是Arm的可伸縮和有效的專業家庭使產品具有更好的功能,不管SoC是什麼,Arm都能讓AI和機器學習很容易在Arm上執行。
接下來,Synopsys Kelvin Xu的演講主題是《IP為AI和汽車設計的未來提供動力》,深度學習的不斷進步,給SoC設計帶來了機遇和挑戰,由於深度學習需要佔用大量的計算資源,在深度學習的過程中需要大量的資料,並對資料進行標記,如何降低計算機的功耗成為一個難題。Kelvin Xu表示,高頻寬的低延時是AI的一個基本要求,SoC的挑戰有很多,其中資訊保安和功能安全是非常重要的一塊。人工智慧的基礎是晶片,軟硬體的載體都在晶片裡面,以自動駕駛的應用為例,Kelvin Xu表示,Synopsys為自動駕駛汽車應用提供完整的解決方案,包括工具和IP,這些解決方案要從系統軟體、硬體架構、IP、低功耗、安全性和測試等方面適應AI應用的特殊需求。不管是人工智慧還是自動駕駛,都有很好的前景,但是都需要產業鏈企業的共同努力,Synopsys提供完整的DesignWare IP解決方案,涵蓋ARC處理器、DDR、USB等不同工藝及協議IP,在提高技術創新的同時,也會持續支援合作伙伴,為產業做貢獻。
Arm公司不只是一個IP供應商,軟體和工具同樣做得很好。Arm高階產品營銷經理Helena Zheng帶來主題為《使用Arm軟體和工具最大化AI平臺的效能》的演講,她表示,機器學習和人工智慧是無處不在的,用神經網路模型改進最先進的雜湊和索引函式,學習雜湊函式可以減少浪費的數量,在延遲僅增加13ns的情況下最多增加80%的儲存。Arm擁有很多機器學習合作伙伴,它們來自成千上萬,專注於不同的垂直領域的公司。開發人員期望一個開放的、通用的軟體介面,以彌補差距在流行的框架和IP之間每一段,Arm高階產品營銷經理Helena Zheng表示,使用開放標準加速ML部署能有效地提升產品效能,在嵌入式+物聯網、手機、汽車、數字電視、機頂盒和基礎設施等上應用。Arm針對神經網路推理引擎,Arm NN非常有效串聯現有NN框架和底層IP之間,從現有的神經網路框架到開發人員可以維護現有的工作流程和工具,優化的Cortex-A CPU, Mali GPU和Arm NPU,圖形和核心優化,準備NPU多核,開源並通過MIT許可等,對Android操作也支援。Arm計算庫為CPU和GPU優化的底層核心,Arm將面對多個細分市場,助推產品系列設計,滿足AI、邊緣端算力,構建中國生態。
隨後,Arteris IP公司Gary Ge帶來主題為《將AI加速器整合到具有功能安全性的汽車SoC中》的演講,他表示,Arteris IP公司是2003年成立的,它是一家互聯IP公司,致力於面向 AI、汽車、手機、物聯網等領域提供旨在加快片上系統半導體裝配速度的片上網路互連IP產品。汽車正在驅動高價值的AI和ML系統,Arteris IP就好比是SoC的資料高速公路,包括對AT EDGE(車輛)、資料中心和FOG(基礎設施和通訊)等進行服務,AI和ML系統是實現3級HW加速優化SOC以實現片上功耗和效能的最佳組合。人工智慧加速器的發展趨勢是用於“通用”訓練或推斷的MESH和其他“常規”拓撲,如資料中心的巨大規模SoC,一個或多個處理元素(PE)、記憶(快取)或I/O控制器,路由器的每個角落,對於最佳的片外HBM2等。子系統的平鋪允許大量的可伸縮性,但是需要系統級效能和功率權衡,因為這樣可以更容易的地方和路線團隊到大規模(硬巨集),可以簡化頂級互連或允許可伸縮地重用現有的NoC體系結構。我們的設計經驗是需要額外的邏輯和記憶體在瓦片,增加NoC定址的複雜性,減少系統級優化的靈活性,記憶體交錯能力和管理等。Gary Ge表示,基於“更細分”加速演算法需求的驅動,快取記憶體一致性在車輛中變得越來越普遍,NoC互聯是實現自主駕駛soc的關鍵。關於汽車SoC設計的經驗是將AI和ML整合到功能安全中,晶片上的NoC互連是資料流在人工智慧HW加速器和SoC級別的關鍵推動者,允許優化所需的功率/效能權衡,提供硬體內的資料保護,以滿足功能安全要求,可大規模擴充套件的系統使用網格和網表級平鋪來連線加速器子系統,具有更嚴格的能力和實時處理要求的邊緣系統正在實現等。
在Arm公司Sinan Yalcin的主題演講《適用於從移動,汽車到家庭的各種裝置中最節能的顯示處理器》裡面提到,Arm從2013年支援顯示處理器到現在,先後推出了3個合成層、4個合成層、8個合成層、信任層、協同處理器介面等,通過VR加速HW功能,PPA優化720p到1080p,4K VR效能、雙顯示、HDR10管理等提升產品效能。以Arm Mali顯示解決方案為例,具備擴充套件,旋轉,卓越的影象品質和HDR,色彩/色域和伽瑪管理,環境光適應性,低功耗,單通,MMU-600和AFBC支援,優化軟體,支援主要的顯示行業標準等。Sinan Yalcin表示,Arm Display解決方案的目標市場是平板電腦、手機、家居產品、移動虛擬現實等,Mali-D71和Komeda架構為為高效能裝置提供4K@120效能,支援雙顯示,4K120(並排模式),8層(4個定標器),MMU-600和AFBC支援,通過CPI顯示5個via CPI,HDR10和HLG支援,混合HDR和SDR組成。Mali-D37支援PPA優化單顯示,用於入門級和主流裝置的DPU,是主流和入門級裝置的標配。Mali-D37是Arm第一款源自Komeda架構中實現主流和入門級的價效比非常好的Mali-D71,在智慧手機和平板電腦、智慧家電等都有應用。他表示,Mali-D37是最小面積DPU,最小的區域採用16nm工藝。單一顯示,4個組成層,支援AFBC和MMU,Mali-D37有豐富的功能集,縮放影象品質高,旋轉高效,未壓縮的圖層首先AFBC-encoded,HDR10, HLG和混合HDR-SDR,高品質的HDR體驗。Arm的顯示器解決方案還有Android軟體棧。未來主流智慧手機的顯示解決方案是WQHD+解析度,生態系統是由Arm和Synopsys實現。總之,Mali-D37具有高效能,是主流和入門級裝置的配置,高達30%的系統節能和記憶體管理的改進,首先為Komeda architecture DPU,為主流裝置提供1080P到2048P的顯示現實。
Android作為一款應用最廣的移動端作業系統之一,此前,谷歌已經表態,所有的Android應用都將支援64位程式碼。Arm公司David Whaley的演講主題是《為什麼要遷移到64位Android?》,他表示,64位Android滿足複雜的移動裝置要求,其中影響創新和使用者體驗的因素包括效能、安全、隱私等。64位支援Arm最安全的應用核心,擁有功能包括檢測記憶體安全和漏洞,強大的保護,反對返回和跳躍,面向程式設計,使PSA能夠建立易於維護的實現。64位Android生態系統很重要,是因為它啟用新的體系結構特性和說明,效能優勢明顯,如針對遊戲引擎的好處是減少載入時間,FPS效能好,更好的Java應用程式效能,增強了安全功能,新的ISA功能,更好的安全和內容保護,專注於單個ISA會帶來節省、一致性和更好的時間等。Arm 64位生態系統提供的支援包括Arm技術指導與優化、Arm工程移動核心團隊、升級Android執行時的64位優化、改善Java應用程式效能、應用程式構建和優化的最佳實踐、為程式碼大小和效能提供文件化的編譯標誌……AArch64能快速遷移到64位Android生態系統,是最佳的安全程式和系統,,AI、ML和AR的效能增強。採用AArch64的優勢是訪問改進了程式碼和平臺安全性,減少軟體攻擊面,比64/32位系統使用更少的記憶體,降低裝置驗證成本,使用集中微架構,AArch64改進速度快於AArch32。對於中國Android生態系統的支援,David Whaley表示預計中國生態系統將遵循類似的64位Android時間表,2020年中國DRAM密度預測允許64位Android,大多數細分市場的裝置,包括低端智慧手機,Arm保留32位支援,允許構建雙ABI裝置,為2021年底的CPU產品提供支援。最後,他表示,64位Android生態系統不會影響Java應用程式的效能、安全性和未來,相容Android裝置和生態系統。
緊隨其後的是Arm公司Daniele Di Donato,他給大家帶來主題為《首款基於Valhall架構的GPU為福斯市場提供高保真內容》的演講,他表示,Arm已經有多款移動GPU,主打高、低兩端市場,已經發布的Mali-G57 GPU面向中端市場,Mali-G57 GPU是第一個基於Valhall架構的主流GPU,與早期的GPU相比,它的能源效率也提高了1.3倍。在VR中支援集中式渲染,並且機器學習效能提高60%。Arm和實時3D開發平臺untiy公司合作釋出的基於Arm IP的片上系統(SoC)、CPU、GPU會有更好的沉浸式體驗。Valhall架構在效能、密度和效率等方面有著重大的改進,Daniele Di Donato表示,採用Valhall架構的Mali G57相比G52能效比和效能都提升了30%,機型學習能力提升60%,Mali G57在網路效能和靈活性上面的提升很大,為虛擬現實和增強現實等應用帶來更強大效能,由於市場對產品效能的持續提升,Mali-G57能夠為主流智慧手機和家用電器的高保真內容、4K和8K顯示介面等帶來好的體驗,同時對機器學習和人工智慧也能支援。他提到,Mali G57能夠處理HDR圖形,能基於物理影象的體積進行渲染處理,達到最好的效果,這對於遊戲應用很有幫助。