英偉達RTX 30系列顯卡性能
本次上市的有三個型號GPU,分別是GeForce RTX 3070、RTX3080以及RTX3090,總體來看,RTX 30系列顯卡包攬GPU界的多項第一,首款搭載鎂光24G GDDR6X 顯卡的游戲圖形卡,是有史以來最快的存儲裝置;首批支持最新顯示標準HDMI 2.1的PC CPU,能實現4k高刷新率和運行8k游戲;首批帶有AV1解碼器的離散GPU,使用戶能在臺式機和媒體中心中使用AV1。

另外,相比于上一代旗艦級顯卡GeForce RTX 2080 Ti,GeForce RTX 3090的性能要強大很多。具體而言,RTX 3090的等效CUDA核心數為10496個,大約是RTX 2080 Ti的兩倍以上。同前代泰坦一樣,RTX 3090 擁有24G的顯存,但型號從DDR6升級為DDR6X,顯存速度19.6Gbps,顯存位寬384bit。在散熱效率方面,RTX 3090的TDP達到350W,比前代泰坦增加了100W,這是因為RT3090采用了正反雙面風扇的散熱設計。
另外,RTX 3080等效核心8704個,顯存速度19Gpbs,顯存位寬320bit,TDP320w。RTX 3070 的等效CUDA核心數為5888,比2080和核心數多1536顆,同時前者TDP比后者低30w。基于安培架構,三項技術性能翻倍。與上一代RTX不同的是,新一代RTX是基于安培架構而非圖靈架構,這使得GeForce RTX 30 系列顯卡性能得到了提升。

不過,此次發布的GeForce RTX 30 系列屬于消費級顯卡,采用的是三星8nm制程工藝,集成280億個晶體管。根據黃仁勛的介紹,RTX GPU 擁有三項基礎處理技術:英偉達在15年前首次推出的可編程著色器、用于加光線三角形和光線邊界框相交的RT Core,以及稱為Tensor Core的AI處理管線。Tensor Core可加速用于深度神經網絡功能的線性代數,這也是現代AI的基礎所在。尤其是在圖形領域,可以使用Tensor Core通過英偉達研究多年的DLSS將低分辨率的圖像還原稱高分辨率,從而提高畫面幀率,增強視頻的畫質。具體而言,在游戲中增加光線追蹤會增加計算工作負載,使用著色器會降低幀速率,增加RT core可將著色器工作負載減少60%。RT Core 實際上每秒執行34 TFLOPS 浮點運算的著色器,而在進行光線追蹤時,圖靈相當于每秒執行45 TFLOPS浮點運算。即使是使用RT Core ,也要消耗大量時間,因此RT Core和著色器必須同時運行。同時使用時,即使是20毫秒,每秒也只有50幀,這對前幾代產品而言,性能仍然落后,例如,2018年,英特爾基于圖靈架構的GeForce RTX 20系列GPU就在光線追蹤方面引起過許多爭議。不過,要是加上Tensor Core,就可以實現高分辨率和高幀率,TRX的性能得以提升。
黃仁勛表示,新款RTX GPU 基于安培架構在性能方面實現了巨大飛躍,安培架構每個時鐘執行2次著色器計算,執行一次著色器算力為30 TFLOPS ,圖靈架構為11,安培架構翻倍了吞吐量。另外,安培架構的RT Core可達58 RT TFLOPS,圖靈架構為34。安培架構全新的Tensor Core硬件處理稀疏網絡的速率是圖靈的兩倍,可自動識別并忽略次要的DNN權重,相較于圖靈 tensor Core 的89tensor TFLOPS ,安培為238。在這三項基礎技術上,新一代RTX性能提升均為上一代的兩倍。搭配新工具,游戲愛好者的新選擇。除了新一代圖像顯卡,英偉達還推出了Nvidia Reflex、Nvidia Broadcast、Omniverse Machinima和圖像增強工具DLSS 2.0,這對游戲玩家而言意味著更優質的畫面、更低的延遲以及更安靜的環境。
黃仁勛表示,Nvidia Reflex可在CPU和GPU中優化渲染管道,最多可將延遲時間減少50%,該項工具將同Game Ready Driver一起推出。Nvidia Broadcast可以實現虛擬背景和音頻降噪,還可以實時追中主播頭部,讓主播居于畫面正中央。Omniverse Machinima是一款面對動畫特效制作人員的動畫制作專業軟件,支持Maya、3D max等主流動畫軟件。在光追技術方面,黃仁勛表示,“現在,全球排名前二的最受歡迎游戲,《我的世界》和《堡壘之夜》,都已支持光追。”
另外,英偉達還宣布推出專為電競設計的擁有360Hz刷新率 G-SYNC顯示器,內置精確的延遲分析工具,今年秋天宏基、華碩、微星、外星人等品牌將上市這款顯示器。在英偉達的測試比較中,360Hz顯示器能夠幫助玩家更好地定位和追蹤對手。
總體看來,RTX 30系列顯卡的性能強勁,如此性能強大的游戲顯卡,簡直就是游戲愛好者的福音。