AMD能在桌面及伺服器市場上跟友商英特爾打“核戰”,很大一個因素是因為AMD的銳龍、EPYC處理器使用了MCM多晶片架構,透過堆疊多個CCX單元實現了8-32核的多核處理器,這樣做的好處就是良率高、成本低,但是多核之間的延遲是個問題。在這個問題上,英特爾之前還專門發文章DISS了一下AMD的膠水多核,表示堅持原生多核心不動搖,然後.....就是英特爾自己也開始做MCM膠水多核了,在Cascade Lake上他們搞了一個48核的處理器,支援12通道DDR4記憶體,其實質也是兩個24核的Cascade Lake處理器膠水封裝的。
首先來複習一下英特爾之前是如何評價膠水多核vs原生多核的優缺點的——英特爾公司客戶端計算部門研究員、首席架構師Guy Therien日前發表了一篇名為《應對核心效能及核心數量挑戰》的文章,談到了現在的處理器核心數量及核心效能面臨的挑戰。
有意思的是,Guy Therien表示英特爾推進多核效能、提升核心數量的方式是繼續提高單一核心(monolithic die)整合的CPU核心數,而非將多個小核心貼上在一起。瞭解過前面的技術背景的人應該知道這是在說英特爾與AMD在多核設計上的不同,Guy Therien表示他們的設計可以減少多核處理器中的延遲,降低了工作負載中的效能波動,因為消費者不會接受任何妥協,他們只關心工作任務執行的一致性。
Guy Therien的表態還沒過去多久,英特爾日前在慶祝Xeon至強20週年的文章中提到了他們開發了Cascade Lake-AP處理器,AP代表著Advanced Performance高階效能之意,我們知道Cascade Lake是取代去年Purley平臺的,後者使用的是Skylake-SP架構,最多28核56執行緒,而Cascade Lake在工藝及架構上基本是一樣的,也是最多28核56執行緒。
但是現在宣佈的Cascade Lake-AP處理器是48核架構的,同時支援超誇張的12通道DDR4記憶體,48核心是不可能原生設計的了,它實際上是兩個24核的Cascade Lake處理器透過MCM封裝實現的,並且還可以支援雙路伺服器,提供96核192執行緒、12通道DDR4的強大配置。
效能方面,48核的Cascade Lake-AP處理器不僅深度學習效能是自家Xeon Platium 8180處理器的17倍,Linapck效能是AMD EPYC 7601處理器的3.4倍,Stream Triad效能則是1.3倍多。
對於英特爾這麼快的打臉行為,官方表示他們並沒有反對MCM多晶片技術,相反早就看到了該技術的潛力,英特爾認為他們的設計比AMD的Infinity Fabric匯流排架構更好,認為AMD的設計會出現一致性及效能上的問題,而英特爾的設計不會有這些問題。
AMD能在桌面及伺服器市場上跟友商英特爾打“核戰”,很大一個因素是因為AMD的銳龍、EPYC處理器使用了MCM多晶片架構,透過堆疊多個CCX單元實現了8-32核的多核處理器,這樣做的好處就是良率高、成本低,但是多核之間的延遲是個問題。在這個問題上,英特爾之前還專門發文章DISS了一下AMD的膠水多核,表示堅持原生多核心不動搖,然後.....就是英特爾自己也開始做MCM膠水多核了,在Cascade Lake上他們搞了一個48核的處理器,支援12通道DDR4記憶體,其實質也是兩個24核的Cascade Lake處理器膠水封裝的。
首先來複習一下英特爾之前是如何評價膠水多核vs原生多核的優缺點的——英特爾公司客戶端計算部門研究員、首席架構師Guy Therien日前發表了一篇名為《應對核心效能及核心數量挑戰》的文章,談到了現在的處理器核心數量及核心效能面臨的挑戰。
有意思的是,Guy Therien表示英特爾推進多核效能、提升核心數量的方式是繼續提高單一核心(monolithic die)整合的CPU核心數,而非將多個小核心貼上在一起。瞭解過前面的技術背景的人應該知道這是在說英特爾與AMD在多核設計上的不同,Guy Therien表示他們的設計可以減少多核處理器中的延遲,降低了工作負載中的效能波動,因為消費者不會接受任何妥協,他們只關心工作任務執行的一致性。
Guy Therien的表態還沒過去多久,英特爾日前在慶祝Xeon至強20週年的文章中提到了他們開發了Cascade Lake-AP處理器,AP代表著Advanced Performance高階效能之意,我們知道Cascade Lake是取代去年Purley平臺的,後者使用的是Skylake-SP架構,最多28核56執行緒,而Cascade Lake在工藝及架構上基本是一樣的,也是最多28核56執行緒。
但是現在宣佈的Cascade Lake-AP處理器是48核架構的,同時支援超誇張的12通道DDR4記憶體,48核心是不可能原生設計的了,它實際上是兩個24核的Cascade Lake處理器透過MCM封裝實現的,並且還可以支援雙路伺服器,提供96核192執行緒、12通道DDR4的強大配置。
效能方面,48核的Cascade Lake-AP處理器不僅深度學習效能是自家Xeon Platium 8180處理器的17倍,Linapck效能是AMD EPYC 7601處理器的3.4倍,Stream Triad效能則是1.3倍多。
對於英特爾這麼快的打臉行為,官方表示他們並沒有反對MCM多晶片技術,相反早就看到了該技術的潛力,英特爾認為他們的設計比AMD的Infinity Fabric匯流排架構更好,認為AMD的設計會出現一致性及效能上的問題,而英特爾的設計不會有這些問題。