回覆列表
  • 1 # 芯智訊

    9月初,華為在德國發布了新一代處理器麒麟970,其最大的亮點就是首次將神經網路處理器NPU整合到了SoC當中。

    據華為介紹,麒麟970整合的NPU專用硬體處理單元,設計了HiAI移動計算架構,其AI效能密度大幅優於CPU和GPU。相較於四個Cortex-A73核心,處理相同AI任務,新的異構計算架構擁有約50倍能效,以及25倍效能優勢,面積只有CPU的1/2,運算能力達到了1.92T FP16 OPS,影象識別速度可達到約2000張/分鐘。

    根據華為公佈的資料顯示,識別同樣的200張照片,CPU需要120秒,而其NPU只需6秒,速度達到了CPU的20倍。並且其NPU識別1000張照片僅消耗0.19%電量。

    2016年11月16日在浙江烏鎮召開的領先科技成果釋出會上,中國科學院計算技術研究所旗下的寒武紀釋出了三款深度神經網路處理器:單核神經網路處理器結構的DianNao,超大規模神經網路的多核處理器結構的DaDianNao,面向多種機器學習演算法的PuDianNao。

    據介紹,寒武紀的神經網路處理器是模仿生物神經網路而構建,由若干人工神經元結點互聯而成。神經元之間透過突觸兩兩連線,突觸記錄了神經元間聯絡的權值強弱。每個神經元可抽象為一個激勵函式,該函式的輸入由與其相連的神經元的輸出以及連線神經元的突觸共同決定。為了表達特定的知識,使用者通常需要(透過某些特定的演算法)調整人工神經網路中突觸的取值、網路的拓撲結構等。該過程稱為“學習”。在學習之後,人工神經網路可透過習得的知識來解決特定的問題。目前像是谷歌的Alpha Go、百度的語音識別和自動駕駛、阿里巴巴模擬機器人都是大量使用到人工神經網路演算法。

    根據此前寒武紀團隊公佈的資料來看,其 “寒武紀一號”(代號DianNao),為單核處理器,主頻為0.98GHz,峰值效能達每秒4520億次神經網路基本運算,65nm工藝下功耗為0.485W,面積3.02平方毫米,平均效能已超過主流CPU核的100倍,但是面積和功耗僅為1/10,效能提升可達三個數量級;與主流GPU相比效能相當,但是面積和功耗僅為其百分之一。

    隨後,寒武紀還面向智慧手機、安防監控、可穿戴裝置、無人機和智慧駕駛等各類終端裝置推出了首款商用深度學習專用處理器——寒武紀1A處理器(Cambricon-1A),可以整合到終端SoC晶片當中。根據資料顯示,Cambricon-1A每秒可處理160億個虛擬神經元,每秒峰值運算能力達2萬億虛擬突觸,效能比通用處理器高兩個數量級,功耗降低了一個數量級。

    華為麒麟970的NPU應該就是基於Cambricon-1A的核心。

  • 中秋節和大豐收的關聯?
  • 加拿大有哪幾個冰酒產區?