首頁>Club>
4
回覆列表
  • 1 # 請叫我二熊

    可以這麼說,在華為麒麟990面前,高通驍龍865已經徹底的淪為小弟(如圖)。

    美國高通近日釋出的最新高階手機晶片驍龍865。作為明年的旗艦產品,在大家都這麼熱切期待的情況下,最終還是“掉了鏈子”。我估計還是由於體積,功耗,效能上無法兼顧,只能選擇外掛5G基帶晶片。

    毫無疑問,就高通這種技術水平,在華為麒麟990面前,已徹底淪為小弟。而國內眾多望眼欲穿,對高通寄予厚望的友商真是啞巴吃黃連,心裡苦啊。

    在核心技術上的巨大差距讓我們的選擇不再困難,畢竟友商一直鼓吹的“晶片高於一切”論還猶在耳邊。

  • 2 # 攀枝花北緯26度

    先說製程

    臺積電N7P是不如N7+的,前者是第二代DUV改進,後者是第一代EUV,按照臺積電線路圖,N7+相對N7P在紙面上最大擁有3%的同功耗效能優勢,或者同性能5%的功耗優勢

    回到問題,首先得看盧偉冰這張圖到底有沒有問題

    圖上我們可以看出來,盧偉冰的發言內容主要集中在這幾個方面

    CPU架構,A77對A76

    GPU效能,以GFX Bench曼哈頓3.1來說,一個90幀一個75幀

    AI算力,以operation per second計算,一個15Tops,一個12Tops不到

    記憶體,一個支援到LPDDR5,一個支援到LPDDR4X

    wifi規格,一個支援到wifi6,一個支援到wifi5

    基帶理論速率,一個支援到4.6Gbps,一個支援到2.3Gbps

    這個問的是如何看待全面領先一代的說法,但是配的圖很顯然沒有描述出全面,有點像考完試拿出卷子給家長看,說我做題全面正確,實際上只是拿出來正確的題目一樣。

    領先,你說的都對,但是全面領先一代,你如何證明你全面呢?

    就得分析每一個專案的具體問題。

    比如一個SOC,日常使用最多的部分就是CPU,GPU,基帶,外圍

    外圍就包含ISP,DSP,NPU/APU/xx加速器這類機器學習的加速處理器,還有一些配套的藍芽,wifi,電源管理晶片等等的支援

    這些部分都有各自的指標,比如CPU通常測試的指標就包含整數,浮點,混合,加密,壓縮,以及這些測試時的功耗資料,完成特定任務所消耗的能量資料,架構,快取,快取延遲,記憶體延遲等等來整體決定一個CPU的效能引數

    GPU呢,一般是完成特定多種壓力多種條件的複雜渲染工作,例如GFX Bench數十個專案,3D Marks的幾個場景,安兔兔的GPU壓力場景等等測試,根據幀率,能耗,計算能效

    扔在一起呢,還有功耗牆,整體能耗,待機耗電,電壓控制分配機制,頻率調整機制,排程機制,細節還有跟多諸如各家對於整數,浮點的最佳化等等。

    但是大部分人能看懂的,能傳播出去的東西,太少了,你覺得我可能給CPU列一個三面的表格,GPU列一個兩面的表格,AI算力列一個兩面的表格,包含多批次多次測試的資料幾十個測試專案和95%CI區間讓你在幾百個專案裡面根據 不同的差異找到更好的東西?

    不可能的。

    所以廠商肯定會挑選出對自己有利的東西來宣傳,我們消費者要做的就是兩件事

    瞭解這個宣傳點和我的實際需求點是不是對標的

    瞭解這個宣傳是不是虛假宣傳或者糊弄我智商的

    你是個科技愛好者,你肯定關注的是CPU效能功耗,GPU效能功耗

    你是個拍照愛好者,你估計不在乎這個

    你是個日常刷刷影片看看新聞的人,你肯定關注低壓力下SOC的功耗,續航長不長

    你是個遊戲愛好者,你肯定更關注GPU的效能功耗

    先看A77吧

    這是ARM的官方PPT,首先要明確一點,就是這些IC廠商買的IP核是沒有自主修改的權力的,再說一遍,是沒有隨便自己修改的權力的,你可以給ARM提要求做修改,比如讓核心偏重整數運算,偏重浮點運算,調整IPC調整最佳頻率區間等等

    A76相對於A75,在製程從10nm提升到7nm,頻率從2.8Ghz提升到3.0Ghz後,SPEC2006的整數效能提升了35%,換算成IPC,忽略支撐提升絕對效能的因素,就是提升了26%,在排除掉製程對於效能的影響後,可以認為A75到A76的提升,類似於A77到A76的提升。

    剛好這裡細節講一下A77的提升,這裡先看看華為方面的說法

    以及官方說法

    當然看完了官方的發言,我們看看事實是什麼樣的。

    CPU

    A77效能提升是怎麼來的?是透過微架構升級和IP核心的升級來的,而不是簡單增加功耗增加效能的超頻。

    可以看到,A77架構在整數,浮點,GB4和記憶體測試中相對於同頻率的A76平均提升達到了25%,最大提升甚至接近35%

    同時ARM依然可以保證峰值能效比維持不變。

    換句話說,A77可以用更低的頻率更強的能耗比達到A76相同的效能。

    在同一個SOC中,頻率(效能)和能耗的關係不是線性的,而是隨著頻率(效能)的提升,能耗指數級提升的提升,能耗指數級提升

    這是9820的測試圖,可以看到三種核心,A75 A55 M4都遵從著類似的曲線,隨著輸出效能提升,功耗飆升,其斜率可以簡單類比為能耗比。

    很顯然,效能提升根本不代表功耗就必須同步提升,A77架構相對於A76架構的提升,可以是在能耗比不變的前提下提升效能,或者在同性能下用更低的頻率換取更高的能耗比。

    A77的整體架構如圖所示,黃色內是A77的升級部分,主要可以表述為以下幾點:

    1,分支預測的頻寬翻倍,達到64B/週期,提早重獲L1中錯過的指令

    2,新一代分支預測機制,增加分支預測精度

    3,提升33%的分支目標緩衝器(BTB)容量,dL1的BTB直接四倍達到64路,單週期延遲

    A76內本身是16路 nano BTB,64路micro BTB,直接提升到64路 L1 BTB

    這是用於根據分支指令歷史狀態動態預測的東西

    4,增加微操作快取(macro-op cache),這個快取在A77中被當做L0指令快取,有效降低分支錯誤預測的週期延遲,大小1.5KB,ARM預測在正常工作負載下命中率85%以上

    在解碼-暫存器重新命名-分發-提交的階段

    ARM耍了雞賊,在前面說的命中了macro-op cache的前提下,可以達到6指令/週期

    相對於A76提升了50%,沒命中就和A76一樣了

    執行階段,整數執行的頻寬提升50%,增加第二條分支,第四個ALU,並且額外增加了一個AES編碼流水線。

    Load-Store單元,增加25%的in-flight資料,Store-data流水線翻倍,有了專門的發射口

    L1L2和資料預取又雙叒叕效能增強了,多了動態管理並且增強了對於不同cache層級的預取,提升了效能。

    還有些其他升級我看不懂的就不說了,小米這邊說A77比A76強,這是沒問題,但是具體調教,策略,應用,我們還不知道,但是對手這邊直接開始造謠A77效能強了功耗也高了所以沒啥區別 ,甚至

    這就是吹啥不好非要侮辱粉絲智商了,

    865工程機的效能都快頂出一半個格子了,又不是855時代36.87對33.97這樣的效能差異

    在25%的效能差前提下,865工程機完成同樣任務消耗的能量是4728焦耳,對應990的消耗是4597焦耳,做到同樣的效能需要超頻25%,這時候功耗能不能維持住還是一個嚴肅的問題,更別說消耗能量的問題了,這裡就能看出A77顯著的優勢

    但是要注意一點,865的CPU滿載功耗高達3.06w,雖然可以透過降低頻率達到略微強的效能和更低的功耗,但是在效能面前如何平衡這個功耗還是一個顯著的問題。

    不過好在日常的工作都是固定總負載的情況,例如轉碼特定檔案,解壓縮特定文件,開啟特定大小的軟體。

    而固定即時負載的場景例如遊戲,主要考驗GPU效能,這裡後面說。

    GPU

    這部分就比較簡單了,直接有資料對比。

    這裡直接引用A社的資料

    Mate30Pro 4G的持續效能弱於主流855旗艦,但是峰值效能(不考慮過熱)是強於所有855旗艦的

    和865差距在20%左右

    國內微博貼吧測試和國外A社測試互相印證,也可以看到,990的GPU峰值效能強於855大約7%,持續效能則會因為降頻低於855。990 4G和5G之間沒有GPU的效能差異,能效比差距在5%左右,可能並沒有很好的發揮7nm 第一代EUV的能力,沒有達到理論的能效提升

    而根據A社對於865工程機的測試,在峰值效能強約20%的前提下,峰值能效比865的GPU稍強於990 4G約10%,

    華為這張圖是明顯的造謠了。

    華為方面一直強調GFX Bench Aztec Ruin下的場景作為代表性能,實際上是因為ARM 的Mali系列GPU在Aztec Ruin這個場景所呼叫的一些計算中擁有優勢

    和Adreno系列GPU差距最小。

    AI

    再來看看AI部分,首先看一下華為方面認為權威的ETH Zurich AI Benchmark,這是蘇黎世大學一個機器學習實驗室的研究員創立的測試網頁

    可以看到現在的成績如圖所示

    這也是華為方面判斷990 5G的AI效能遠超865的依據

    但是根據上圖驍龍855和865平臺僅有12%的分數差異,完全不符合高通官方宣傳的AI效能提升一倍的承諾。

    仔細看測試的權重可以發現

    測試的絕大多數權重在FP16成績與定量計算分數

    FP16指的是16位浮點數精度的張量計算

    但是根據高通在865釋出會上關於平臺AI能力的描述和其他機構的研究可以發現

    865平臺和蘋果A系列一樣,其機器學習相關開發套件和硬體最佳化的主要關注是int8的效能提升,也就是8位整數精度的張量計算效能提升,而在華為挑選的測試中,根本不測試int8的效能。

    目前來說,因為精度不同,所以不同平臺之間的測試結果意義不大,但是如果都用Tops,也就是Trillion Operation Per Second 作為指標的話

    865平臺的15Tops算力領先30% 問題不大,相對990 5G落後一倍的宣傳顯然是造謠式宣傳了。

    基帶

    基帶這方面其實也是爭議最大的點:

    外掛還是整合

    這個問題其實不好回答,因為大家第一代5G都是外掛基帶,但是後面都變成整合基帶了。

    很顯然,因為成本(單片芯片面積變大,成本平方倍提升),技術(有限的面積內能不能塞下足夠的效能)和使用的規劃不一樣(比如高通要給蘋果提供5G基帶,因此這一代5G基帶必須外掛來滿足蘋果的需求,單獨再做一個旗艦5G基帶成本得不償失),在行業技術成熟以前,都只是互相取捨的選擇

    例如990 5G整合的5G基帶,就去掉了毫米波功能,同時在5G上行下行的規格和4G基帶的規格上就做了閹割,效能甚至不及高通中端平臺765G所整合的基帶效能

    Sub6G下 990 5G的整合基帶提供最大下行2.3Gbps,上行1.25Gbps的峰值速率

    同樣Sub6G下 765G的整合基帶同樣提供最大2.3Gbps(3GPP R15下頻寬100Mhz提供最大2.34Gbps下載速度),上行1.25Gbps的峰值速度

    但是在毫米波下765G的基帶支援400Mhz的頻寬,同時在LTE和5G NR的混合加速下可以達到3.7Gbps的最大下行速率和1.6Gbps的上行速率。

    但是這也正是華為的取捨,在製程技術沒有理想的前提下,降低一定基帶效能將基帶整合到soc中,可以降低基帶和SOC的額外通訊成本,降低額外的能量浪費,同時減小一塊晶片,方便終端的主機板設計。

    這樣的缺點只有一個,就是可能導致熱量的堆積,所以這也一方面解釋了990 5G的5G基帶效能甚至不如前代的巴龍5000,兩個發熱大戶在一起可能扛不住獎牌。

    而高通則更加追求極限效能,同時考慮到要外賣蘋果大量的X55基帶,因此並沒有和中端735G一樣整合一個性能閹割的基帶進去,而是直接外掛基帶,無形中增加了基帶和SOC通訊的額外成本,造成了終端主機板設計的壓力和額外的耗電壓力。

    但是需要注意的是,無論是製程也好,整合/外掛也好,其對效能的影響都是累積性而非壟斷性的,製程只能影響最終的效能/能效表現,同樣的整合外掛的取捨也僅僅是影響最終能效表現的因素,根據幾個因素是無法判斷最終結果的,需要等待實際測試。

    很顯然,在基帶和製程上,有人又說了假話。

    wifi6

    這個爭議點也挺奇妙的,不知道為什麼華為方面一直在闡述自身在wifi6上的地位,但是就是不談wifi6本身

    wifi6相對wifi5主要有三個提升,分別是

    速率提升

    裝置續航提升

    擁堵時效能提升

    很顯然後面兩個功能被刻意忽視了

    根據華為方面描述,麒麟990 5G配套的wifi套片擁有最大1.7Gbps的峰值下載速率,遠高於友商wifi6套片QCA6390在5Ghz下最大80Mhz頻寬支援的1.2Gbps

    但是這看起來不太對

    QCA6390的datasheet描述其支援的最大速率為1.774Gbps,因為在5Ghz下80Mhz頻寬卻支援1024QAM,而不是通常的256QAM,當然具體還要依靠實測決定。

    但是在沒有得到具體終端,只能依靠data sheet判斷的前提下名正言順的歪曲資料,這不好。

    但是說實在的,這些數字都是虛的,根本用不到最大速率,90% 的家庭wifi甚至沒有超過百兆,何談這些上Gbps的速率?

    爭論點差不多結束了

    兩者各有各的優勢,990整合度更好,體積更小,需要的能量更小,在手機狹小的空間裡,這種優勢很有實用,865效能更強,更好的cpu和gpu,處理器加基帶需要的能量更大,功耗更高。865旗艦機首選三星s20系列,不解釋,995的話首選p40系列。

  • 中秋節和大豐收的關聯?
  • 挪威的氣候特點?