如果放在不久前的秋天,我們可能會認為深度學習抗鋸齒是要比光線追蹤更加“接地氣”的技術,原因在於當時僅僅《戰地V》這麼一款作品擁抱後者,而且在當時看來趕工的跡象非常明顯,不僅僅是效能需求遠超預期、卡頓現象嚴重,而且各梯次的光線追蹤質量並沒有特別的需求差異(實際上直到今天,光線追蹤效能依然是開發團隊的工作重點)。跟著比起來,深度學習抗鋸齒看起來就要符合馬斯洛需求的多,因為它可以讓幀率更高、效能更好,誰會拒絕這呢?
關於深度學習抗鋸齒(DLSS),我們在曾經已經透過很多篇幅介紹過相當多,簡單來說,針對支援該技術的遊戲,會實現建立起對應的訓練網路(Neural Graphics Acceleration(NGX),收集數以千計的64倍透過超級取樣(SSAA)生成的參考畫面,經過對畫素點進行64次偏移著色合成輸出後,理論上畫面細節具有近乎完美的影象效果。同時還會生成正常的渲染影象,然後要求DLSS網路響應輸出對應結果,觀察與64倍超級取樣畫面差異,調整網路權重。經過多次迭代以後,DLSS自行學習產生的結果將具有與64×超級取樣畫面相同質量的細節,還可以避免TAA產生的運動模糊等問題。
不過需要明確的是DLSS訓練網路運行於NVIDIA土星-V(Saturn-V)超級計算機,而非你的顯示卡。這臺超算擁有660節點,內含5280顆V100 GPU核心,真正挑大樑的是它們,而不是我們的顯示卡,以此來獲得四兩拔千斤的效果,透過龐大的AI訓練,能夠以很小的代價獲得更好的取樣質量,說誇張一點,就是以FXAA抗鋸齒的效能損失,換回SSAA抗鋸齒的畫質,聽起來是不是很夢幻。這就是NVIDIA要在圖靈顯示卡裝載張量單元的原因。但這同樣意味著,每款遊戲都需要事先跑出自己的DLSS訓練網路,然後由NVIDIA透過GeForce Experience軟體分發給玩家,所以這也是非圖靈顯示卡不能使用DLSS的原因。
最早能夠支援該技術的作品是《最終幻想XV Windows Edition》,在我們的早期測試中發現雖然幀率確實提升明顯,但是如果放大遊戲截圖來細看的話,會發現使用深度學習抗鋸齒後雖然效能明天提升,但是代價同樣明顯:畫面會變得更加模糊,而且要比曾經的快速近似抗鋸齒(FXAA)更加明顯。在後面的《地鐵:離去》測試當中再次證明我的擔憂:深度學習抗鋸齒會讓遊戲變得更加模糊,尤其是對畫素點更少的1080p解析度而言,然而問題是,大部分玩家選擇的都是更加便宜的RTX 2060、RTX 2070,它們的光線追蹤核心、張量單元數量根本無法負擔起4K Raytracing、DLSS,所以模糊化的體驗會讓平價的RTX顯示卡失去一層重要的意義。
更加讓人困擾的是,針對目前的《地鐵:離去》、《戰地V》這兩款作品,何時能夠開啟深度學習抗鋸齒是擁有嚴苛的限制的,比如說在不同的解析度,不同的顯示卡能否正常開啟的條件是不同的,而且還要考慮是否需要搭配光線追蹤(DXR)技術一道開啟。總之,雖然原理看起來深度學習抗鋸齒非常有潛力,但是在不同的限制下、效能、畫面質量如何都有待進一步的驗證,這就是本文的主題。
《地鐵:離去》當中基於深度學習抗鋸齒的開啟限制
《戰地V》當中基於深度學習抗鋸齒的開啟限制
大家能夠看到上面無論是《地鐵:離去》還是《戰地V》的限制情況都非常複雜,如果要找規律的話,就是越是效能高階的顯示卡,越強制“建議”你單單選擇更高階的解析度,比如說1440p、2160p,而越是效能普通的卡就給你選擇全部解析度(但實際體驗最好的是1080p),另外呢基本上都是要開啟光線追蹤技術的同時才能開啟深度學習抗鋸齒,例外僅僅是在《地鐵:離去》當中的RTX 2080、RTX 2080 Ti,他們可以在沒有開啟光線追蹤的條件下開啟深度學習抗鋸齒。總之,我們這次就透過已經被數次最佳化過的《戰地V》,來看看深度學習抗鋸齒到底能夠帶來多少效能提升,並且畫質是否會出現降質。
測試的配置方面,採用的依然是之前測試《Apex英雄》的平臺,處理器是超頻到4.8GHz高頻率的酷睿i7-8086K,記憶體是兩條來自威剛的XPG龍耀系列D80記憶體,8GB-3200MHz Dual Channel,顯示卡部分則是來自影馳的產品,包括RTX 2080 Ti、RTX 2070、RTX 2060是來自GAMER系列的產品,而RTX 2080則是來自名人堂HOF的產品。
測試細節方面,大家看到上面的圖表就知道《戰地V》僅有開啟光線追蹤才能使用深度學習抗鋸齒,所以我們的測試方法就是對比開啟光線追蹤,然後看看各解析度開啟深度學習抗鋸齒前後幀率的提升,測試的地圖還是之前我們採用的單人劇情部分的“步兵團”關卡開始部分,自下車開始一直測試到佔領山丘上的德軍陣地,這部分我們的畫質、DXR質量都是選擇最高。測試驅動是採用最新的419.71。
深度學習抗鋸齒效能測試:1080p進步不明顯,4K才是決戰主力
首先我們來看看RTX 2060的表現,它是能夠開啟GeForce RTX功能的顯示卡當中最便宜的產品,效能方面來說,大家可以看到無論是基準的1080p解析度,還是進階的1440p解析度,其實大家能看到幀率提升非常的有限,都尚且在20%範圍內。之前英偉達方面表示效能提升最明顯的其實是4K UHD解析度,這倒是並沒有說錯,確實有39.4%的提升,但是如果你看絕對的幀率提升的話,實際上僅僅是19.3FPS提高到26.9FPS而已,並沒有顛覆性的體驗,所以我們可以說就RTX 2060這張卡的表現來說,它最多就在1440p解析度的時候來體驗DXR、DLSS。
再來看看RTX 2070的表現,其實早在去年我們秋天的測試中,你就知道盡管顯示卡之間本身的效能差距很大,但是在《戰地V》當中時候光線追蹤技術後差距就沒有那麼大,RTX 2070的表現跟RTX 2060類似,普通的1080p解析度、1440p解析度依然提升有限,均未超過20%,4K UHD解析度表現倒是有42.8%的提升,絕對幀率自平均27.7FPS提高到39.56FPS,這算是自“非常卡頓”提升到“勉強能玩”的級別。
或許是因為RTX 2080的效能足夠強,所以就已經取消對基本的1080p的支援,但是基本的格局並沒有得到改寫,你看普通的1440p解析度提升依然沒有超過20%,就區區17.8%“而已”,然後4K UHD解析度表現倒是出奇的好,提升達到44.6%,幀率自34.06FPS的“勉強能玩”提升到49.25FPS,這基本就算是“流暢”的入口。
最後來看看效能最強的RTX 2080 Ti,這張顯示卡完全沒有1080p、1440p解析度的支援,僅僅面向4K,然後開啟深度學習抗鋸齒後效能提升在30%左右,沒有前面動輒四成左右的提升,至於原因我並不清楚,原理上說或許是因為4K解析度對於RTX 2080 Ti來說難道還不夠高壓?我們開啟的可是最高畫質、最高光追質量。
畫質分析:1080p最吃虧,畫面明顯變模糊
這裡我們來簡單對比看看開啟深度學習抗鋸齒技術後,在各解析度環境中是否出現明顯的降至、模糊情況,還是跟前面的一致採用全部最高畫質、DXR質量最高。首先來看看1080p解析度的對比,我們選擇的依然是步兵團這道關卡,大家可以看到在開啟深度學習抗鋸齒後,很明顯樹木的樹枝、樹葉部分變得模糊,沒有原生那麼細膩,有股油畫感。
開啟DLSS
左側是關閉,有測是開啟
關閉DLSS
而到1440p的時候,模糊的情況則得到一定程度的緩解,需要更加仔細看才能看出端倪,但是在樹枝、樹葉的邊緣部分還是能看得出一定程度的模糊“副作用”。
而實話實說,最後切換成4K UHD解析度的時候就要清晰很多,部分場景甚至不在容易區分是否有開啟DLSS,所以說英偉達至少在關鍵部分沒有說錯,DLSS確實是解析度越高越優秀、越值得使用,然而問題在於,如果要玩4K的話,你的顯示卡就需要不低的效能、換句話說需要不低的售價才行。
總結:DLSS最適合4K遊戲使用者
如果大家還記得去年夏天的科隆釋出會的話,應該知道當時的深度學習抗鋸齒技術的重要價值就在於能夠在保持畫質的前提下帶來效能的提升,而從我們的 測試資料、截圖看起來,這確實是真實的,4K解析度無論是幀率提升的幅度、還是畫面的素質都是最兩眼的,而最不建議開啟的就是1080p解析度環境,因為不僅僅是效能提升相比較少,而且畫面降質的現象最為明顯,樹枝、樹葉的細節丟失很多,而且畫面整體有種朦朧的“美”,這可能是因為目前的樣本學習還沒有達到火候,但是無論如何,1080p開啟深度學習抗鋸齒在現在看來都不是一件讓人享受的事情。
不過好在之前英偉達承諾過最佳化1080p、1440p解析度的深度學習抗鋸齒畫面素質,加強樣本學習,尤其是改善銳化程度,而最近《地鐵:離去》就在這方面下功夫,我們期待平價的RTX 2060、RTX 2070能夠帶來更多的價值。
如果放在不久前的秋天,我們可能會認為深度學習抗鋸齒是要比光線追蹤更加“接地氣”的技術,原因在於當時僅僅《戰地V》這麼一款作品擁抱後者,而且在當時看來趕工的跡象非常明顯,不僅僅是效能需求遠超預期、卡頓現象嚴重,而且各梯次的光線追蹤質量並沒有特別的需求差異(實際上直到今天,光線追蹤效能依然是開發團隊的工作重點)。跟著比起來,深度學習抗鋸齒看起來就要符合馬斯洛需求的多,因為它可以讓幀率更高、效能更好,誰會拒絕這呢?
關於深度學習抗鋸齒(DLSS),我們在曾經已經透過很多篇幅介紹過相當多,簡單來說,針對支援該技術的遊戲,會實現建立起對應的訓練網路(Neural Graphics Acceleration(NGX),收集數以千計的64倍透過超級取樣(SSAA)生成的參考畫面,經過對畫素點進行64次偏移著色合成輸出後,理論上畫面細節具有近乎完美的影象效果。同時還會生成正常的渲染影象,然後要求DLSS網路響應輸出對應結果,觀察與64倍超級取樣畫面差異,調整網路權重。經過多次迭代以後,DLSS自行學習產生的結果將具有與64×超級取樣畫面相同質量的細節,還可以避免TAA產生的運動模糊等問題。
不過需要明確的是DLSS訓練網路運行於NVIDIA土星-V(Saturn-V)超級計算機,而非你的顯示卡。這臺超算擁有660節點,內含5280顆V100 GPU核心,真正挑大樑的是它們,而不是我們的顯示卡,以此來獲得四兩拔千斤的效果,透過龐大的AI訓練,能夠以很小的代價獲得更好的取樣質量,說誇張一點,就是以FXAA抗鋸齒的效能損失,換回SSAA抗鋸齒的畫質,聽起來是不是很夢幻。這就是NVIDIA要在圖靈顯示卡裝載張量單元的原因。但這同樣意味著,每款遊戲都需要事先跑出自己的DLSS訓練網路,然後由NVIDIA透過GeForce Experience軟體分發給玩家,所以這也是非圖靈顯示卡不能使用DLSS的原因。
最早能夠支援該技術的作品是《最終幻想XV Windows Edition》,在我們的早期測試中發現雖然幀率確實提升明顯,但是如果放大遊戲截圖來細看的話,會發現使用深度學習抗鋸齒後雖然效能明天提升,但是代價同樣明顯:畫面會變得更加模糊,而且要比曾經的快速近似抗鋸齒(FXAA)更加明顯。在後面的《地鐵:離去》測試當中再次證明我的擔憂:深度學習抗鋸齒會讓遊戲變得更加模糊,尤其是對畫素點更少的1080p解析度而言,然而問題是,大部分玩家選擇的都是更加便宜的RTX 2060、RTX 2070,它們的光線追蹤核心、張量單元數量根本無法負擔起4K Raytracing、DLSS,所以模糊化的體驗會讓平價的RTX顯示卡失去一層重要的意義。
更加讓人困擾的是,針對目前的《地鐵:離去》、《戰地V》這兩款作品,何時能夠開啟深度學習抗鋸齒是擁有嚴苛的限制的,比如說在不同的解析度,不同的顯示卡能否正常開啟的條件是不同的,而且還要考慮是否需要搭配光線追蹤(DXR)技術一道開啟。總之,雖然原理看起來深度學習抗鋸齒非常有潛力,但是在不同的限制下、效能、畫面質量如何都有待進一步的驗證,這就是本文的主題。
《地鐵:離去》當中基於深度學習抗鋸齒的開啟限制
《戰地V》當中基於深度學習抗鋸齒的開啟限制
大家能夠看到上面無論是《地鐵:離去》還是《戰地V》的限制情況都非常複雜,如果要找規律的話,就是越是效能高階的顯示卡,越強制“建議”你單單選擇更高階的解析度,比如說1440p、2160p,而越是效能普通的卡就給你選擇全部解析度(但實際體驗最好的是1080p),另外呢基本上都是要開啟光線追蹤技術的同時才能開啟深度學習抗鋸齒,例外僅僅是在《地鐵:離去》當中的RTX 2080、RTX 2080 Ti,他們可以在沒有開啟光線追蹤的條件下開啟深度學習抗鋸齒。總之,我們這次就透過已經被數次最佳化過的《戰地V》,來看看深度學習抗鋸齒到底能夠帶來多少效能提升,並且畫質是否會出現降質。
測試的配置方面,採用的依然是之前測試《Apex英雄》的平臺,處理器是超頻到4.8GHz高頻率的酷睿i7-8086K,記憶體是兩條來自威剛的XPG龍耀系列D80記憶體,8GB-3200MHz Dual Channel,顯示卡部分則是來自影馳的產品,包括RTX 2080 Ti、RTX 2070、RTX 2060是來自GAMER系列的產品,而RTX 2080則是來自名人堂HOF的產品。
測試細節方面,大家看到上面的圖表就知道《戰地V》僅有開啟光線追蹤才能使用深度學習抗鋸齒,所以我們的測試方法就是對比開啟光線追蹤,然後看看各解析度開啟深度學習抗鋸齒前後幀率的提升,測試的地圖還是之前我們採用的單人劇情部分的“步兵團”關卡開始部分,自下車開始一直測試到佔領山丘上的德軍陣地,這部分我們的畫質、DXR質量都是選擇最高。測試驅動是採用最新的419.71。
深度學習抗鋸齒效能測試:1080p進步不明顯,4K才是決戰主力
首先我們來看看RTX 2060的表現,它是能夠開啟GeForce RTX功能的顯示卡當中最便宜的產品,效能方面來說,大家可以看到無論是基準的1080p解析度,還是進階的1440p解析度,其實大家能看到幀率提升非常的有限,都尚且在20%範圍內。之前英偉達方面表示效能提升最明顯的其實是4K UHD解析度,這倒是並沒有說錯,確實有39.4%的提升,但是如果你看絕對的幀率提升的話,實際上僅僅是19.3FPS提高到26.9FPS而已,並沒有顛覆性的體驗,所以我們可以說就RTX 2060這張卡的表現來說,它最多就在1440p解析度的時候來體驗DXR、DLSS。
再來看看RTX 2070的表現,其實早在去年我們秋天的測試中,你就知道盡管顯示卡之間本身的效能差距很大,但是在《戰地V》當中時候光線追蹤技術後差距就沒有那麼大,RTX 2070的表現跟RTX 2060類似,普通的1080p解析度、1440p解析度依然提升有限,均未超過20%,4K UHD解析度表現倒是有42.8%的提升,絕對幀率自平均27.7FPS提高到39.56FPS,這算是自“非常卡頓”提升到“勉強能玩”的級別。
或許是因為RTX 2080的效能足夠強,所以就已經取消對基本的1080p的支援,但是基本的格局並沒有得到改寫,你看普通的1440p解析度提升依然沒有超過20%,就區區17.8%“而已”,然後4K UHD解析度表現倒是出奇的好,提升達到44.6%,幀率自34.06FPS的“勉強能玩”提升到49.25FPS,這基本就算是“流暢”的入口。
最後來看看效能最強的RTX 2080 Ti,這張顯示卡完全沒有1080p、1440p解析度的支援,僅僅面向4K,然後開啟深度學習抗鋸齒後效能提升在30%左右,沒有前面動輒四成左右的提升,至於原因我並不清楚,原理上說或許是因為4K解析度對於RTX 2080 Ti來說難道還不夠高壓?我們開啟的可是最高畫質、最高光追質量。
畫質分析:1080p最吃虧,畫面明顯變模糊
這裡我們來簡單對比看看開啟深度學習抗鋸齒技術後,在各解析度環境中是否出現明顯的降至、模糊情況,還是跟前面的一致採用全部最高畫質、DXR質量最高。首先來看看1080p解析度的對比,我們選擇的依然是步兵團這道關卡,大家可以看到在開啟深度學習抗鋸齒後,很明顯樹木的樹枝、樹葉部分變得模糊,沒有原生那麼細膩,有股油畫感。
開啟DLSS
左側是關閉,有測是開啟
開啟DLSS
關閉DLSS
而到1440p的時候,模糊的情況則得到一定程度的緩解,需要更加仔細看才能看出端倪,但是在樹枝、樹葉的邊緣部分還是能看得出一定程度的模糊“副作用”。
關閉DLSS
開啟DLSS
關閉DLSS
開啟DLSS
關閉DLSS
開啟DLSS
而實話實說,最後切換成4K UHD解析度的時候就要清晰很多,部分場景甚至不在容易區分是否有開啟DLSS,所以說英偉達至少在關鍵部分沒有說錯,DLSS確實是解析度越高越優秀、越值得使用,然而問題在於,如果要玩4K的話,你的顯示卡就需要不低的效能、換句話說需要不低的售價才行。
總結:DLSS最適合4K遊戲使用者
如果大家還記得去年夏天的科隆釋出會的話,應該知道當時的深度學習抗鋸齒技術的重要價值就在於能夠在保持畫質的前提下帶來效能的提升,而從我們的 測試資料、截圖看起來,這確實是真實的,4K解析度無論是幀率提升的幅度、還是畫面的素質都是最兩眼的,而最不建議開啟的就是1080p解析度環境,因為不僅僅是效能提升相比較少,而且畫面降質的現象最為明顯,樹枝、樹葉的細節丟失很多,而且畫面整體有種朦朧的“美”,這可能是因為目前的樣本學習還沒有達到火候,但是無論如何,1080p開啟深度學習抗鋸齒在現在看來都不是一件讓人享受的事情。
不過好在之前英偉達承諾過最佳化1080p、1440p解析度的深度學習抗鋸齒畫面素質,加強樣本學習,尤其是改善銳化程度,而最近《地鐵:離去》就在這方面下功夫,我們期待平價的RTX 2060、RTX 2070能夠帶來更多的價值。