英特爾公佈Gen11核顯，你認為效能會怎麼樣？

首頁>Club>荷蘭欄杆2021-04-18 22:06

英特爾公佈Gen11核顯，你認為效能會怎麼樣？

回覆列表

1 # 超能網

英特爾2020年要推出高效能的獨顯GPU Xe，而且還會用於美國2021年建成的首臺百億億次超算Aurora，GPU業務未來會成為英特爾的重點。得益於此，英特爾的核顯業務未來也會更重受益，現有擠牙膏多年的Gen 9/9.5核顯將會新一代Gen 11核顯取代，號稱具備1TFLOPS的效能，是前代的兩倍。前兩天英特爾公佈了Gen 11核顯的架構細節，EU架構大改，L3快取提升了4倍，最多64個EU單元，之前曝光的效能測試顯示其遊戲效能堪比AMD的銳龍APU。現在從英特爾驅動中提取的資訊顯示，Gen11核顯將有13個版本，分別用於10nm Ice Lake處理器及Lakfield SoC中，傳聞被取消的Iris銳炬核顯依然是最頂級的，低端的Iris Plus 920也有32個核顯。
英特爾的Gen 11核顯中，整個Slice單元採用新的設計，包含子Slice單元以及儲存各種固定功能模組的公共Slice單元和L3快取記憶體單元。英特爾透過將L3快取增加至3MB（相比Gen 9提升了4倍）來改進記憶體子系統，並將SLM分離開來以增強並行性，新設計還具有增強的記憶體演算法。

具體來說，10nm Ice Lake處理器中的Gen 11核顯有13個版本，主要根據EU單元數量及LP低功耗來區分，主流冰湖處理器在電源管理方面限制最少，Iris Plus型號可以獲得最強核顯的效能，其中Iris Plus具備64個EU單元，頻率也是最高的，這個版本的核顯可能會用於酷睿i7及酷睿i9系列處理器。

Iris Plus Graphics 940也有相同的64個EU單元，但頻率可能低一點，這個核顯會用於酷睿i5系列。
Iris Plus 930的EU單元數量有64、48個之分，可能會用於部分酷睿i3處理器中。

Iris Plus 920核顯EU單元數為32個，可能會用於奔騰Gold系列處理器中。

除此之外，還有各種UHD Graphics Gen 11 LP核顯，EU單元從32個到64個不等。

在Lakefield SoC處理器中，有4個不同的核顯型號，主要基於GT1、GT2兩個變種，它們的大小也不同，GT1要小於GT2，根據過去的配置來看GT1可能是32個EU單元。這4個型號都標有UHD Graphics LKF的字樣，但沒有進一步的型號編號。

未來的驅動中可能會出現Elkhart Lake處理器，這是Gen11核顯的的低功耗SoC處理器，可能是用於奔騰Silver、賽揚系列。
PS：按照TPU的報道，英特爾在10nm冰湖處理器的Gen 11核顯非常大方，以往用於GT3/GT4頂級核顯的Iris品牌都直接下放到酷睿i3產品線了，而且EU單元也好不吝嗇，奔騰級別的都是32個EU單元，主流的至少48個，酷睿i7/i9直接上了最強的核顯及最高的頻率。

如果不是TPU太樂觀，英特爾真打算這麼做，那麼高階酷睿i7/i9也在使用可憐巴巴的GT2核顯的日子就結束了，從之前曝光的效能測試來看，英特爾的Gen11核顯效能提升還是很大的，遊戲效能堪比AMD的銳龍APU，當然是Vega 8級別的APU。

不過也別太樂觀，10nm冰湖處理器是明年才上市的，2020年AMD怎麼著也要推7nm工藝的銳龍APU了，核顯也要加強的。

2 # 付大毛

英特爾釋出了一份新的設計文件，詳細介紹了它的第11代GPU，以及它們與以前的系列有何不同。到目前為止，我們已經在英特爾架構日等活動中獲得了關於新uarch的適度細節，但這些新資料回填了一些預期的技術細節。英特爾的第11代圖形架構有望成為其即將推出的Xe獨立GPU架構的基礎，因此這裡推出的先進技術至少可以預覽這些卡應該部署的部分功能。
在我們從底層硬體中看到更多內容之前，我們不打算進行效能預測，但從各方面來看，英特爾至少能夠為AMD提供比以往任何時候都更有效的挑戰。從歷史上看，與AMD相比，它安裝在臺式機和一些移動晶片上的英特爾中端“GT2”GPU相對較弱。英特爾在這些比較中的優勢在於其歷史上的CPU強度與AMD的Bulldozer派生的APU相比。現在，Ryzen擁有更高效的CPU核心，AMD的Ryzen Mobile處理器與英特爾同行的競爭對手更為有效。

英特爾的整體架構與CPU核心相鄰。雖然該圖不是按比例繪製的，但英特爾的新GT2架構將擁有64個EU，而其Skylake級晶片中只有24個。與先前的設計相比，片上資源的顯著擴充套件應該可以提高整體效能。
新的GPU核心由數字組成。計算效能大約高出2.67倍，紋理取樣吞吐量也是如此。ROP吞吐量增加了一倍，每個時鐘的高Z測試數量也增加了一倍。L3快取大4倍，可用於GPU寫入的頻寬量增加了一倍，達到每個時鐘64個位元組。使用DDR4時的記憶體頻寬應該相同，但是當與該記憶體型別配對時，對LPDDR4的支援允許理論上更高的RAM時鐘。最後一級快取在GPU和CPU之間共享，以減少資料移動。影片解碼器模組已經過改進，可降低位元率，允許多個4K和8K流同時解碼，增加自適應同步支援，並改善高畫質影片解碼。

GPU現在有一個共享的本地記憶體，在讀取時不會阻止L3訪問。英特爾聲稱這可以提高本地和全球原子的效率。

整個結構，上面。英特爾聲稱它已經在第11代大大提高了整體記憶體頻寬效率。看看它的真實性以及它是否會改變英特爾iGPU解決方案的整體特性將會很有趣。從歷史上看，AMD iGPU對記憶體頻寬非常敏感，而英特爾晶片受RAM時鐘的影響較小。這些變化可能使RAM時鐘在英特爾方面更重要。
粗畫素著色和POSH 失落的月亮

第11代的兩個主要特徵是粗畫素著色和POSH，這顯然代表僅限位置，而不是對英國科幻節目的一些可疑參考。

粗畫素著色透過減少用於渲染影象的顏色樣本的數量來減少GPU上的工作量。其他細節（如幾何圖形）不會以這種方式縮放，以保持場景細節。減少畫素著色器執行的次數可以節省功耗並提高效能。英特爾架構日CPS的升級幅度在20-40％之間，具體取決於功能的啟用程度。2×2對視覺效果的影響最小，並且適度提高了效能，4×4更加明顯，但也提供了更多的提升。

我們上面提到的POSH管道是英特爾基於位置的基於位置的渲染（PTBR）系統的一部分，該系統部署了兩個幾何管道 - 標準渲染管道和POSH管道。英特爾表示：
POSH管道與主應用程式並行執行位置著色器，但通常生成結果的速度要快得多，因為它只遮蔽位置屬性並避免渲染畫素。POSH管道向前執行並使用著色位置屬性來計算三角形的可見性資訊，以衡量它們是否被剔除。POSH管道的物件可見性記錄單元計算可見性，壓縮資訊並將其記錄在記憶體中。

從理論上講，POSH應該是一種更快，更省電的方式來處理某些型別的幾何處理。總體效能和對工作負載的適用性可能取決於遊戲使用的呈現模式的型別。儘管如此，英特爾顯然在考慮如何最大限度地提高記憶體頻寬，並圍繞這個想法引入比我們之前看到的更高階的功能。

總體而言，Gen11正在成為Santa Clara的重要更新。AMD的前兩代Ryzen Mobile已經對抗重新加熱的Skylake顯示卡。第三代Ryzen Mobile APU無論何時推出，都必須與更具魅力的產品展開競爭。

劇多

英特爾公佈Gen11核顯，你認為效能會怎麼樣？

相關內容