回覆列表
  • 1 # ZOL問答

    今天NVIDIA釋出了基於Volta架構打造的新旗艦顯示卡TITAN V,難道前幾天京東上要預約參加搶購才能到手的TITAN Xp現在就已經過時了?

    TITAN V採用12nm工藝的Volta核心打造,也是Volta架構第一款面向遊戲玩家推出的旗艦顯示卡。TITAN V配備12GB HBM2視訊記憶體,峰值浮點效能高達110TFlops,是現在TITAN Xp的9倍。TITAN V基於GV100核心,核心面積815平方毫米,比Xp的GP102也幾乎大了一倍。另外TITAN V內建5120顆CUDA核心,640顆Tensor核心(用於AI專門計算和加速),核心主頻1200MHz,加速頻率1455MHz,然而TITAN V僅用一個渦輪風扇就可以鎮壓。

    NVIDIA TITAN V其實保留了專業級的一些特性,NVIDIA也希望深度學習計算的桌面PC研究者可以嘗試這款顯示卡,因為它可以極大提高效率。官方TITAN V的定價高達2999美元,是TITAN Xp的兩倍了。在今天晚些時候就會上市,首批銷售國家應該是沒有中國了。

  • 2 # 超能網

    不得不說,NVIDIA CEO 黃仁勳對於非Gefore系列產品保密實在是太好了,每一次“核彈”釋出都是出其不意。今天老黃在NIPS 2017全球神經資訊處理系統大會上突然就釋出了全新Volta架構的NVIDIA TITAN V!CUDA流處理器暴增至5120個,配備了12GB的HBM 2視訊記憶體,單精度浮點效能高達15TFlops,而表示深度計算能力的Tensor效能高達110TFlops,相當於TITAN Xp的9倍。顯然這張TITAN V已經側重於AI人工智慧、深度計算上,與我們遊戲玩家漸行漸遠了,那麼這張TITAN V有什麼值得我們關注的亮點呢?

    全新Volta架構:

    雖然目前NVIDIA還沒有吹Volta架構的新特性,不過顯然已經針對HBM 2視訊記憶體做足了最佳化,透過新的記憶體控制器對超高位寬的HBM 2效能發揮到極致,以此保證比前作TITAN Xp 1.2倍的記憶體頻寬,在執行負載時,可以讓記憶體頻寬利用率提升至95%的新水平。

    如果你要問目前Tesla V100以及TITAN V所採用的GV100核心是否已經“滿血”,那麼可能要大失所望了,這並不是滿血版。根據NVIDIA早前放出的Volta架構白皮書,顯示最頂級的GV100核心將會有6組GPC單元,每組GPC單元由14組SM單元構成,滿血版應該是6 x 14 = 84組SM單元,但Tesla V100/TITAN V均只有80組,每組SM單元64個CUDA單元,因此共同構成80 x 64 = 5120個CUDA單元,創下了歷史之最。但顯然,NVIDIA還留有4組SM單元殺招。

    根據NVIDIA的白皮書介紹,Volta架構的SM單元做了大幅改進,新的SM單元能效比Pascal這代提升50%,因此才能在同樣的功耗封裝下大幅提升FP32/FP64計算效能。

    1:2的單精度比:

    之前的TITAN顯示卡為了在遊戲效能與功耗之間做出平衡,無情地砍掉了雙精度單元,讓TITAN Xp上的雙單精度單元比將至1:32的新低水平。不過這一代TITAN V似乎不側重於遊戲方面了,不僅高達2999美元的售價,還有其雙精度單元也回來了,重新回到1:2的比例。雙精度效能由TITAN Xp可憐的0.38TFLOPS提升至6.9TFLOPS,提升幅度高達18倍。

    12nm FFN工藝:

    Volta顯示卡使用TSMC臺積電與NVIDIA定製的12nm FFN工藝是早就確認的事情,和之前的16nm相比有哪些改進?其實就是16nm的第四代改良版本,為了打敗競爭對手,不惜玩弄文字遊戲。不過提升還是有的,表現在更高的電晶體密度、更低的功耗,效能比16nm FFC工藝提升10%,但是核心面積可縮減20%。

    即便如此,GV100大核心的面積依然從目前的GP100核心的610mm2增加到了815mm2。核心面積增大如此之多主要是因為42%的CUDA單元增長導致的。

    12GB HBM 2視訊記憶體:

    HBM 2視訊記憶體 NVIDIA也不是第一天用,只不過速度上更快一些,由Tesla P100上的700MHz提升到850MHz,供應商很大機率還是三星,應該也是單顆粒4GB容量,3顆構成TITAN V上的3072-bit 12GB HBM 2視訊記憶體,視訊記憶體頻寬再抬升一個臺階達652.8GB/s。

    在架構圖上,GV100完整核心是有8組512bit視訊記憶體控制器,每個HBM 2堆疊搭配2組視訊記憶體控制器。

    640個Tensor單元:

    顯然NVIDIA已經將公司前景壓在了AI與深度計算上,因此開發適用於深度計算的運算單元很有必要,可以在硬體層面上快速提升深度計算能力,做到事半功倍效果。

    新的 Tensor Core 是專門為深度學習設計的,為相應的浮點運算速度帶來了 12 倍的提升。並且由此擁有了獨立的、並行的整型和浮點型資料通路,Volta SM單元在負載上也更高效,混合了計算與地址運算。Volta 新的獨立執行緒排程能力使得並行執行緒之間的細粒度同步協同成為可能。

    正正是特事特辦的方式,讓TITAN V擁有了640個Tensor單元,提供高達110TFLOPS的深度計算效能,是沒有Tensor單元的TITAN Xp 9倍之多。

    沒有NVLink/SLI:

    原本NVLink是專屬於NVIDIA計算卡一種高頻寬的互聯技術,能夠在CPU-GPU和GPU-GPU之間實現超高速的資料傳輸。誕生之初就獲得傳統PCIe 3.0(32GB/S)5-12倍的資料傳輸速度,還能大幅提升應用程式的處理速度。在最新的Volta架構中,NVIDIA將其提升至300GB/s水平,幾乎是PCI-E 3.0的10倍速度。

    Telsa V100是支援使用Quadro NVLINK Bridge,而且一次用兩個,一條橋價格是599美元,約等於一張GTX 1080架構。不過你放心,TITAN V壓根就不支援這玩意,經過向NVIDIA官方求證,Quadro NVLINK Bridge僅適用於Quadro以及Telsa系列產品,TITAN V並不支援,上面的介面被背板夾住,是插不進去的,就是個樣子貨,連SLI HB橋都不能用。

    看清楚,這金手指被夾住了

    我就是賣那麼貴

    2999美元售價:

    這價格貴嗎?比起TITAN Xp的1200美元當然貴多了,我買兩張TITAN Xp 星戰典藏版還沒一張TITAN V貴呢!也難怪NVIDIA全球副Quattroporte張建中會說,下一代遊戲卡更貴。

    但是你想想這一代的TITAN顯然不是針對遊戲玩家,使用了GV100頂級核心、12GB HBM 2視訊記憶體、不砍雙精度單元,這不就是工作站卡、計算卡嗎?賣1.98萬元人民幣真的不貴。

    對比起Tesla V100報價1萬美元起(6.6萬人民幣),或者是報價149000美元(98.6萬人民幣)擁有8張Telsa V100的新DGX-1售價來說,甚至說1.98萬元人民幣有點仁慈了。

    在NIPS 2017大會上,NVIDIA CEO黃仁勳高興地說道“我們將會把TITAN V送到世界各地的研究人員手中,迫不及待地分享突破性發現”。是的,老黃又調皮了,現場送出了20張TITAN V。

    寫在最後:

    爾等都在流口水是吧,沒錯,我們也一樣,既然連NVIDIA TITAN Xp Colletor"Edition星球大戰典藏版都買了兩張,老黃不送就自己買唄。

    是的,不好意思,我們小手一抖,TITAN V即將到手。用了最快的快遞,你們等著全網首發吧。

    其實也不是要炫耀什麼,畢竟今年NVIDIA並有釋出預料之中的Volta遊戲卡,玩家們都飢渴難耐地想知道GTX 2000系列顯示卡的效能,我們寄望於透過目前能賣的TITAN V來進行必要的測試,以此管中窺豹。

    儘管這一代的TITAN V並不像是遊戲卡,採用GV100大核心很可能只適用於深度計算以及工作站,對我們這些遊戲玩家有意義的是後續的GV102核心(可能,傳聞Volta架構顯示卡不會有遊戲卡),精簡掉對遊戲毫無用處的Tensor、雙精度單元,在砍L2快取,HBM 2視訊記憶體可以保留在旗艦卡皇上,普通卡可能是新的GDDR6視訊記憶體,做到提升效能同時保持/降低功耗。

    能不能做到GTX 2060打敗GTX 1080這種事,我們還是先YY一下吧。

  • 3 # 太平洋電腦網

    NVIDIA的CEO老黃髮布了一款基於全新Volta(伏打)架構的最頂級顯示卡——TITAN V,“V”當然就是取自“Volta”的開頭了。官網已經上線,定價2999美刀,算上關稅和匯率大概是在2.2萬RMB...又是有史以來最貴的TITAN,但它絕對頂得起這價。

    官網已經上線:

      新的TITAN V和上一代最強大的TITAN Xp一樣,都只是悄悄地在官網上釋出,NVIDIA最近釋出新品都相當的低調,即使這顯示卡(GPU)已經是目前世界上最強大的...而且限購條件也和TITAN Xp一樣,每個使用者在官網上只能買兩塊,聯想到TITAN Xp從上市以來在京東上都是一補貨就被賣空,可以推測到這TITAN V也很可能一卡難求。

      TITAN V基於Volta架構,全新的12nm工藝製程,配置12GB的HBM2視訊記憶體,浮點效能是15TFlops(TITAN Xp也只有12TFlops),5120個流處理器,其他引數都是非常爆炸的,我們用表格對比著看吧...

    核心點評:全新GV102核心,基於12nm工藝製程,有史以來最多的5120個CUDA流處理器,電晶體數也達到211億,也是目前GPU之最,反正幾乎全部規模引數都重新整理了GPU的世界記錄了...

      浮點運算次數就變態得有點離譜了,本來TITAN Xp的12TFlops(1080Ti是11T)就是世界第一強了,這一下子重新整理到15TFlops,這太恐怖了。

      視訊記憶體方面也升級為HBM2,這種超高位寬(3072bit)的視訊記憶體會是將來頂級旗艦卡必須配備的,GPU和視訊記憶體之間的資料交換速度能大幅提升。

      在流處理器數量更多的情況下,核心頻率也只降低了一點點,加速頻率居然也達到了1455MHz,這也得益於12nm的工藝製程,讓流處理器數量能堆得更多,頻率能跑得更高,另外功耗和供電規模也和原來的TITAN Xp一致,除了恐怖已經想不到什麼詞彙來形容NVIDIA的實力了...

    我覺得TITAN Xp會慢慢退居二線,甚至停產,不過也不會一下子就說落後了。

  • 中秋節和大豐收的關聯?
  • 會計這個職業能為我們帶來什麼?