近日,ARM 不僅宣佈了最新的 Cortex-M 系列核心(最新的 Cortex M55),還引入了Ethos U55 microNPU 等改進。
ARM 希望透過新的 IP,於將來幾年內為數十億低功耗嵌入式裝置提升機器學習和推理能力,擴充套件自家產品組合,以滿足新的用例需求。
【題圖 via AnandTech】
過去幾年,機器學習技術的應用已變得相當普及,可見其在廣泛的行業和各種系統中。ARM 認為終端 AI 市場會在未來幾年中迎來爆炸性增長,新 IP 就是為此做準備。
首先介紹下 Cortex-M55,它是與 M33 聯絡更加緊密的新一代 IP,引入了體系架構上的新改進,能夠在機器學習和向量指令方面實現較大的效能和靈活性改進。
Ethos-U55 是專用的 microNPU 推理加速器,可與 Cortex-M 系列 CPU 結合使用,帶來專門面向於 NPU 的效能與能效提升。
與 Cortex-M 系列核心一樣,Ethos-U55 的空間佔用也比較少。至於 Cortex-M55,則是首款具有 Helium / 定製指令能力的 CPU 核心。
Helium 特指 M-Profile Vector Extension(簡稱 MVE),屬於 M 系列 CPU 中的新向量擴充套件和專用向量執行單元,使之成為該範圍內首款具有單指令多資料流(SIMD)功能的產品。
新增功能使得新核心的 DSP 效能提升了 5 倍,結合針對機器學習工作負載的最佳化指令和 MVE,整體表現可提高至 15 倍。
整體微架構方面,新 IP 算是繼承了 M33 和 µarch 。在頻率提升的加持下,它將標量工作負載的效能提升了大約 20%,具體取決於供應商的配置。
新核心的設計重點,同樣體現在頻寬上。其啟用了需要頻寬的新 MVE 和機器學習工作負載,因此對記憶體子系統進行了改進,比如 4×32-bit 介面與緊密耦合記憶體(TCM)。
儘管 ARM 進入 NPU 領域的時間相對較晚,但新推出的 Ethos-U55 microNPU,還是較嵌入式市場有著獨特的意義。與移動 SoC 上更大的 Ethos-N 系列相比,它的面積和功耗要低得多。
Ethos-U55 是一種小型 NPU,可從 32 路擴充套件到 256 MAC、且需要與 Cortex-M 系列 NPU 耦合。
ARM 未提及微體系架構的主要細節,但可知它是一種非常精簡的設計,注重的是面積和能源效率、具有較小的記憶體佔用量,其中包含我們在 N 系列產品中見到的一些特性,如 Weight Decompression 。
即便如此,它與 N 系列在功能上並沒有太大區別,因為該 IP 已包含 M 系列 CPU 。據說其架構與 NPU 有所不同(與更大的兄弟無關),且是專門為低功耗用例而設計。
與上一代解決方案相比,使用 M55 和 U55 的此類系統,其效能改進意味著相當重要的步進功能提升。與基於 Cortex-M7 的系統相比,ARM 帶來了包含 50 倍的效能提升、以及 25X 的能效改進。
至於新 IP 的可用領域,ARM 展望了各式各樣的嵌入式系統(主要是現有的晶片子系統)。比如在移動裝置上,廠商可在手機的指紋感測器、語音助理(實時監聽指令)、甚至在 RF 系統中(如天線調諧)使用它來最佳化工作負載。
當今的移動裝置中,有數百種 M 系列 CPU 可從機器學習功能中獲益,且其中大多數功能對使用者來說是完全透明的。
目前 ARM 已向主要合作伙伴開放 M55 和 U55 的授權,並將在未來幾個月內向更廣泛的客戶群開放,預計最終產品可在廠商二次開發的兩年後走向市場。
近日,ARM 不僅宣佈了最新的 Cortex-M 系列核心(最新的 Cortex M55),還引入了Ethos U55 microNPU 等改進。
ARM 希望透過新的 IP,於將來幾年內為數十億低功耗嵌入式裝置提升機器學習和推理能力,擴充套件自家產品組合,以滿足新的用例需求。
【題圖 via AnandTech】
過去幾年,機器學習技術的應用已變得相當普及,可見其在廣泛的行業和各種系統中。ARM 認為終端 AI 市場會在未來幾年中迎來爆炸性增長,新 IP 就是為此做準備。
首先介紹下 Cortex-M55,它是與 M33 聯絡更加緊密的新一代 IP,引入了體系架構上的新改進,能夠在機器學習和向量指令方面實現較大的效能和靈活性改進。
Ethos-U55 是專用的 microNPU 推理加速器,可與 Cortex-M 系列 CPU 結合使用,帶來專門面向於 NPU 的效能與能效提升。
與 Cortex-M 系列核心一樣,Ethos-U55 的空間佔用也比較少。至於 Cortex-M55,則是首款具有 Helium / 定製指令能力的 CPU 核心。
Helium 特指 M-Profile Vector Extension(簡稱 MVE),屬於 M 系列 CPU 中的新向量擴充套件和專用向量執行單元,使之成為該範圍內首款具有單指令多資料流(SIMD)功能的產品。
新增功能使得新核心的 DSP 效能提升了 5 倍,結合針對機器學習工作負載的最佳化指令和 MVE,整體表現可提高至 15 倍。
整體微架構方面,新 IP 算是繼承了 M33 和 µarch 。在頻率提升的加持下,它將標量工作負載的效能提升了大約 20%,具體取決於供應商的配置。
新核心的設計重點,同樣體現在頻寬上。其啟用了需要頻寬的新 MVE 和機器學習工作負載,因此對記憶體子系統進行了改進,比如 4×32-bit 介面與緊密耦合記憶體(TCM)。
儘管 ARM 進入 NPU 領域的時間相對較晚,但新推出的 Ethos-U55 microNPU,還是較嵌入式市場有著獨特的意義。與移動 SoC 上更大的 Ethos-N 系列相比,它的面積和功耗要低得多。
Ethos-U55 是一種小型 NPU,可從 32 路擴充套件到 256 MAC、且需要與 Cortex-M 系列 NPU 耦合。
ARM 未提及微體系架構的主要細節,但可知它是一種非常精簡的設計,注重的是面積和能源效率、具有較小的記憶體佔用量,其中包含我們在 N 系列產品中見到的一些特性,如 Weight Decompression 。
即便如此,它與 N 系列在功能上並沒有太大區別,因為該 IP 已包含 M 系列 CPU 。據說其架構與 NPU 有所不同(與更大的兄弟無關),且是專門為低功耗用例而設計。
與上一代解決方案相比,使用 M55 和 U55 的此類系統,其效能改進意味著相當重要的步進功能提升。與基於 Cortex-M7 的系統相比,ARM 帶來了包含 50 倍的效能提升、以及 25X 的能效改進。
至於新 IP 的可用領域,ARM 展望了各式各樣的嵌入式系統(主要是現有的晶片子系統)。比如在移動裝置上,廠商可在手機的指紋感測器、語音助理(實時監聽指令)、甚至在 RF 系統中(如天線調諧)使用它來最佳化工作負載。
當今的移動裝置中,有數百種 M 系列 CPU 可從機器學習功能中獲益,且其中大多數功能對使用者來說是完全透明的。
目前 ARM 已向主要合作伙伴開放 M55 和 U55 的授權,並將在未來幾個月內向更廣泛的客戶群開放,預計最終產品可在廠商二次開發的兩年後走向市場。