NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
NVIDIA GeForce RTX 5090 創始版顯示卡。

在看過外觀開箱後(請見:NVIDIA GeForce RTX 5090 創始版顯示卡外觀開箱 以創新散熱設計為頂尖效能預備),趕在農曆過年前,NVIDIA 解禁了 GeForce RTX 50 系列的首張,也是最頂級的旗艦顯示卡:RTX 5090 的效能測試結果,雖說 NVIDIA 在 CES 展期中的 Editor Day 編輯日活動(上課)的 Keynote 上,展示了 RTX 5090 比起前一代 RTX 4090 要高出將近兩倍的性能(請見:NVIDIA GeForce RTX 50 桌上型顯卡全系列官方設計與性能解析 不僅效能翻倍 散熱設計也大幅改造),但那畢竟是 DLSS 4 對上 DLSS 3 加速的結果,至於在原始遊戲以及其他性能表現部分,接著陳拔就來測試揭曉啦!

因為這次測試的項目比較多,所以陳拔也提供了文章段落索引,大家會比較好看一點:

硬體規格與測試平台配置
傳統顯示效能測試結果
4K 解析度遊戲效能測試結果
光線追蹤效能測試結果
DLSS 效能測試結果
內容創作效能測試結果
AI 效能測試結果
溫度與功耗表現
測試總結

NVIDIA GeForce RTX 5090 創始版顯示卡硬體規格

在揭曉效能測試結果前,先來看一下 NVIDIA GeForce RTX 5090 創始版顯示卡的硬體規格,比較部分陳拔只比了上一代的 RTX 4090 創始版顯示卡(畢竟隔壁兩家真的沒有對應對手....),首先來看規格上的比較:

RTX 5090 RTX 4090
架構 Blackwell Ada Lovelace
CUDA Core 數 21760 16384
Tensor Core(算力) 第五代 3352 AI TOPS 第四代 1321 AI TOPS
RT Core(算力) 第四代 318 TFLOPS 第三代 191 TFLOPS
GPU 基礎時脈 2010 MHz 2230 MHz
GPU 加速時脈 2410 MHz 2520 MHz
顯示記憶體容量 32 GB GDDR7 24 GB GDDR6x
記憶體介面 512 bit 384 bit
記憶體總頻寬 1792 GB/s 1008 GB/s
TGP 功耗 575W 450W


先不看代數差異,這次 RTX 5090 在 CUDA Core 的數量上就比 RTX 4090 要高出 32% 左右,以這樣來推論這次 RTX 5090 在原始顯示效能上應該就會比 RTX 4090 要高出 3 成左右,加上有更大、速度更快的顯示記憶體配置,在顯示效能表現上應該會更好一點,但因為這次 RTX 5090 在 GPU 時脈部分比起 RTX 4090 有所調降,所以整體表現上應該依照遊戲與應用程式最佳化程度的不同,35% 的增幅應該是合理範圍。

看完了規格比較,接著就進入到揭露實測結果的環節,這次在測試平台的使用上,NVIDIA 比較罕見的推薦了 AMD Ryzen 7 9800X3D 處理器的組合,而不是往常慣用的 Intel 平台,以下是測試平台的配置:

處理器:AMD Ryzen 7 9800X3D 處理器
主機板:ROG CROSSHAIR X870E HERO 主機板
處理器散熱器:CORSAIR iCUE H170i ELITE LCD 420 AIO
記憶體:G.Skill Trident Z5 Neo DDR5-6000 CL30 16GB x2
系統 SSD:三星 980 Pro PCIe Gen4 NVMe M.2 SSD 1TB
電源供應器:CORSAIR HX1500i 1500W
作業系統:Windows 11 Pro 24H2 版(電源部分採用『最佳效能』設定,並且關閉記憶體隔離保護功能,顯示卡硬體加速設定為開啟)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
測試平台的組成狀態。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
開機時尾端 GEFORCE RTX 燈效點亮時的狀態。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
中央 X 型框架燈效點亮時的狀態。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
採用垂直安裝時則是可以看到另一側的 X 框架燈效,但這樣就是熱風直吹主機板了

安裝好作業系統後,首先先來看 NVIDIA GeForce RTX 5090 創始版顯示卡在 GPU-Z 內顯示的資訊:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
GPU-Z 上面的資訊還有很多沒更新到的。

NVIDIA GeForce RTX 5090 創始版顯示卡傳統顯示效能測試

先來看傳統顯示效能的部分,這部分陳拔利用 GeekBench 的 GPU 效能評估,以及 3DMark 測試軟體的 Speedway、Steel Nomad、Time Spy、Time Spy Extreme、Fire Strike Extreme 以及 Fire Strike Ultra 等六個項目、進行對 OpenCL、Vulkan、DirectX 12 Ultimate、DirectX 12、DirectX 11 等 API 的顯示效能測試,測試結果如下:

首先在 GeekBench 6 Pro 的測試部分,這部分分為使用 OpenCL 以及 Vulkan 兩個測試項目,以下是測試結果:(點擊可看大圖)

OpenCL
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
Vulkan
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價


在 GeekBench 6 Pro GPU 的測試中,NVIDIA GeForce RTX 5090 創始版顯示卡在 OpenCL 的設定中獲得了 385399 的分數,而在 Vulkan 的設定中,則是得到了 397924 分的成績。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
跟 RTX 4090 創始版顯示卡比較的結果,NVIDIA GeForce RTX 5090 創始版顯示卡在 OpenCL 部分有 17% 左右的效能提升,而在 Vulkan 部分則是比較多,提升幅度來到了 52.85%

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價接著是 NVIDIA GeForce RTX 5090 Super FE 創始版顯示卡在 3DMark 顯示效能測試的結果,以及與 RTX 4090 創始版顯示卡的比較。(點擊可看大圖),以下是各測試分項的效能表現與比較結果。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價在應用 DirectX 12 Ultimate API、具備 DirectX Raytracing 即時光追全域照明、光線追蹤反射、Mesh Shade 等配置的 Speed Way 測試項目中,NVIDIA GeForce RTX 5090 創始版顯示卡的得分為 14564,跟 RTX 4090 創始版顯示卡相比有約 50.86% 的效能提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
另外在非光線追蹤的效能部分,則是以使用 DirectX 12/Vulkan API 的 Steel Nomad 項目進行測試,在這項目中 NVIDIA GeForce RTX 5090 創始版顯示卡的得分為 14364,跟 RTX 4090 創始版顯示卡相比有約 63.82% 的效能提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
接著來看比較舊、針對 DirectX 12 API、1440p 解析度的 Time SPY 測試項目,在這部分 NVIDIA GeForce RTX 5090 創始版顯示卡的得分為 36896,跟 RTX 4090 創始版顯示卡相比有約 47.42% 的效能提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
至於在同樣針對 DirectX 12 API,解析度提升到 4K 的 Time SPY Extreme 測試項目部分,NVIDIA GeForce RTX 5090 創始版顯示卡的得分為 18676,顯示部分的分數為 25639,跟 RTX 4090 創始版顯示卡相比有約 42.06% 的效能提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
而在使用 DirectX 11 API,解析度設定為 1440p 的 Fire Strike Extreme 測試項目中,NVIDIA GeForce RTX 5090 創始版顯示卡的得分為 49260,顯示部分的分數為 62311,跟 RTX 4090 創始版顯示卡相比有約 44.44% 的效能提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
接著在提升到 4K 解析度,使用 DirectX 11 API 的 Fire Strike Ultra 測試項目中,NVIDIA GeForce RTX 5090 創始版顯示卡的得分為 32150,顯示部分的分數為 33537,跟 RTX 4090 創始版顯示卡相比有約 42.03% 的效能提升。(點擊可看大圖)

在 3DMark 傳統顯示效能的部分,可以看到 NVIDIA GeForce RTX 5090 創始版顯示卡跟 RTX 4090 創始版顯示卡相比,最少都有 40% 的顯示效能提升,而在較新的 Speed Way 跟 Steel Nomad 測試項目中,更提升到 50% 以上。

NVIDIA GeForce RTX 5090 創始版顯示卡 4K 解析度遊戲效能測試

接著看實際遊戲的表現部分,在這部分陳拔在 4K 解析度下,使用十八款 3A 大作遊戲進行測試,遊戲名單包括:《星際大戰:亡命之徒》(Star Wars Outlaws)、《阿凡達:潘朵拉邊境》(Avatar:Frontiers Of Pandora)、《刺客教條:幻象》(Assassin's Creed Mirage)、《極地戰嚎 6》(Far Cry 6)、《看門狗:自由軍團》(WatchDogs:Legion)、《黑神話:悟空》(Black with Wukong)、《漫威爭鋒》(MARVEL RIVALS)、《霍格華茲的傳承》(Hogwarts Legacy)、《闇龍紀元:紗帳守護者》(Dragon Age)、《邊緣禁地 3》(Borderland 3)、《電馭叛客 2077》(Cyberpunk 2077)、《大地長征 5》(Dirt 5)、《F1@24》、《地平線:期待黎明》(HORIZON ZERO DAWN)、《漫威星際異攻隊》(Marvel's Guardians of the Galaxy)、《古墓奇兵:暗影》(Shadow of the Tomb Raider)、《德軍總部:血氣方剛》(Wolfenstein: Youngblood)、《心靈殺手 2》(ALAN WAKE II)等,均以最高畫面效果與精細度設定進行測試,先不開啟光線追蹤與 DLSS 功能,僅就單純的遊戲顯示效能進行比較,以下是測試結果:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
NVIDIA GeForce RTX 5090 創始版顯示卡在 4K 解析度下的遊戲實際效能表現,跟 RTX 4090 創始版顯示卡相比有約 36.73% 的效能提升。(點擊可看大圖)

在傳統光柵化遊戲的顯示效能部分,可以看到在大多數遊戲中, NVIDIA GeForce RTX 5090 創始版顯示卡即便是在 《星際大戰:亡命之徒》(Star Wars Outlaws)、《黑神話:悟空》(Black with Wukong)、 《心靈殺手 2》(ALAN WAKE II)這幾款去年推出、超吃顯示效能的重量級遊戲中,可以直接在 4K 解析度、最高遊戲設定下達到 60 fps 以上的遊戲效能表現。

NVIDIA GeForce RTX 5090 創始版顯示卡光線追蹤效能測試

接下來看 NVIDIA GeForce RTX 5090 創始版顯示卡在光線追蹤顯示效能部分的表現,這次 RTX 50 系列在負責光線追蹤的 RT Core 部分也升級到新的一代,RTX 5090 的 RT Core 算力由 RTX 4090 的 191 TFLOPS 提升到 318 TFLOPS,提升幅度達 66%,另外也透過光線追蹤運算的改變,包括導入RTX Neural Material 材質以及 RTX Mega 計算等技術,來達到更好的光線追蹤效能表現,至於在實際上的效能表現如何?首先是利用 3DMark 測試軟體裡面的 Port Royal 以及 DirectX Raytracing 兩個測試項目,測試 NVIDIA GeForce RTX 5090 創始版顯示卡的光線追蹤顯示效能表現。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價NVIDIA GeForce RTX 5090 創始版顯示卡在 3DMark Port Royal 光線追蹤效能測試的效能表現,所得到的分數為 37283。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價跟 RTX 4090 創始版顯示卡相比有約 53.46% 的效能提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價NVIDIA GeForce RTX 5090 創始版顯示卡在 3DMark DirectX Raytracing 光線追蹤效能測試的效能表現,所得到的分數為 109.55 fps。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價不過在這部分就遇到了比 RTX 4090 創始版顯示卡效能還低的狀況,大約有 15% 的落差,這部分在測試前 NVIDIA 就有提到這件事,但並沒有說明確切的原因,可能是 3DMark 這部分的測試尚未對 RTX 50 系列顯示卡的新 RT Core 進行調整有關,其實陳拔在這次測試中,也遇到了部分在先前 RTX 4090 顯示卡上可順利測試,但是在 RTX 5090 顯示卡上卻出問題的狀況,這部分就有待廠商進行修正了。

在實際發行遊戲部分的光線追蹤效能表現部分,這部分陳拔採用具備光線追蹤功能的遊戲,包括《星際大戰:亡命之徒》(Star Wars Outlaws)、《極地戰嚎 6》(Far Cry 6)、《看門狗:自由軍團》(WatchDogs:Legion)、《黑神話:悟空》(Black with Wukong)、《漫威爭鋒》(MARVEL RIVALS)、《霍格華茲的傳承》(Hogwarts Legacy)、《闇龍紀元:紗帳守護者》(Dragon Age)、《電馭叛客 2077》(Cyberpunk 2077)、《大地長征 5》(Dirt 5)、《F1@24》、《漫威星際異攻隊》(Marvel's Guardians of the Galaxy)、《古墓奇兵:暗影》(Shadow of the Tomb Raider)、《德軍總部:血氣方剛》(Wolfenstein: Youngblood)、《心靈殺手 2》(ALAN WAKE II)共十四款遊戲進行測試,測試時均將光線追蹤設定開到最高、遊戲畫面設定開至最高、關閉 DLSS 功能,同樣在 4K 解析度進行測試,以下是測試結果:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
NVIDIA GeForce RTX 5090 創始版顯示卡在 4K 解析度下、開啟最高光線追蹤設定的遊戲實際效能表現,平均顯示幀率為 119.48 fps,跟 RTX 4090 創始版顯示卡相比有約 37.13% 的效能提升,而在遊戲效能的呈現上,除了 《星際大戰:亡命之徒》(Star Wars Outlaws)、《黑神話:悟空》(Black with Wukong)、 《電馭叛客 2077》(Cyberpunk 2077)、《心靈殺手 2》(ALAN WAKE II)這四款重度遊戲,在最高的 Raytracing Override 設定中會下降到接近 30 fps 的效能外,其餘支援光線追蹤的遊戲都能跑到 90 fps 以上的順暢水準。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡 DLSS 效能測試

這次 RTX 50 系列顯示卡最大的變化就是將傳統的 Shader Core 跟過去負責 AI 運算的 Tensor Core,整合成 Blackwell Neural Shaders 神經渲染器,並且透過 Neural Rendering 神經渲染技術,推出新的 DLSS 4 畫質提升技術,將過去使用的卷積神經網路模型(CNN Model)轉變成為視覺轉換模型 (Transformer Model),提供了過去提高 2 倍的參數量以及 4 倍的計算量,並且在 RTX 50 系列上支援可生成最多 3 張 AI 幀的 Multi Frame Generation 技術,以下就來看應用了 DLSS 4 設定後,NVIDIA GeForce RTX 5090 創始版顯示卡在這部分的效能表現。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
陳拔先利用 NVIDIA 提供、支援 DLSS 4、DLAA 設定的 3DMark DLSS Beta 測試項目進行測試,測試時均採用 DLSS 4 設定,測試時均採用 4K 解析度、『品質』設定取向,並且開啟 DLSS FRAME GENERATION 幀間生成補幀功能,在 RTX 5090 創始版顯示卡上再加測 4X 的測試設定,以下是測試結果:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價在幀間生成功能設定為 2X 的狀況下,NVIDIA GeForce RTX 5090 創始版顯示卡在 DLSS 4 開啟前的 4K 顯示效能測試結果為 83.52 fps,開啟 DLSS 4 後的測試結果為 216.84 fps,效能提升約 2.6 倍。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
而跟 RTX 4090 創始版顯示卡相比,RTX 4090 創始版顯示卡開啟前後的提升幅度為 2.52 倍,效能增幅是差不多的,但是在輸出表現上因為 RTX 5090 創始版顯示卡在原始效能上的提升,相對地提升的幀數就高出許多。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
接著將幀間生成功能設定為 4X 進行測試,NVIDIA GeForce RTX 5090 創始版顯示卡在 DLSS 4 開啟前的 4K 顯示效能測試結果為 83.09 fps,開啟 DLSS 4 後的測試結果為 372.75 fps,效能提升約 4.48 倍。(點擊可看大圖)

至於在支援 DLSS 功能的真實遊戲效能表現上,陳拔則是利用支援 DLSS 的十三款遊戲,包括《星際大戰:亡命之徒》(Star Wars Outlaws)、《阿凡達:潘朵拉邊境》(Avatar:Frontiers Of Pandora)、《刺客教條:幻象》(Assassin's Creed Mirage)、《黑神話:悟空》(Black with Wukong)、《漫威爭鋒》(MARVEL RIVALS)、《霍格華茲的傳承》(Hogwarts Legacy)、《闇龍紀元:紗帳守護者》(Dragon Age)、《電馭叛客 2077》(Cyberpunk 2077)、《F1@24》、《地平線:期待黎明》(HORIZON ZERO DAWN)、《漫威星際異攻隊》(Marvel's Guardians of the Galaxy)、《古墓奇兵:暗影》(Shadow of the Tomb Raider)、《心靈殺手 2》(ALAN WAKE II)等 ,在 4K 解析度、最高畫質設定下進行測試、DLSS 設定均為『品質』取向,首先是在未開啟幀間生成,僅有 SR 畫質提升技術時的測試結果:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
NVIDIA GeForce RTX 5090 創始版顯示卡在 4K 解析度下,僅開啟 DLSS 中的 SR 解析度提升技術、品質取向設定時的遊戲實際效能表現,平均遊戲顯示效能為 148 fps。比起 RTX 4090 創始版顯示卡平均有約 32.6% 的效能提升,基本上僅開啟 SR 時就能將大多數遊戲的幀數提升到 60 fps 以上的水準。

接著導入 DLSS 3.5 架構中的 2X 幀間生成以及 RG 光線重建技術進行測試,這部分則是透過支援幀間生成光線重建技術的八款遊戲進行,包括《星際大戰:亡命之徒》(Star Wars Outlaws)、《黑神話:悟空》(Black with Wukong)、《漫威爭鋒》(MARVEL RIVALS)、《霍格華茲的傳承》(Hogwarts Legacy)、《闇龍紀元:紗帳守護者》(Dragon Age)、《電馭叛客 2077》(Cyberpunk 2077)、《F1@24》、《心靈殺手 2》(ALAN WAKE II)等,測試時也均採用『品質』設定取向,並且開啟最高畫質設定以及光線追蹤功能,以下是測試結果:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
NVIDIA GeForce RTX 5090 創始版顯示卡在 4K 解析度下,加入 DLSS 3.5 的 2X 幀間生成技術、品質取向設定時的遊戲實際效能表現,平均遊戲顯示效能為 164.2 fps,比起 RTX 4090 創始版顯示卡平均有約 39.9% 的效能提升。(點擊可開大圖)

另外可以看到在 《星際大戰:亡命之徒》(Star Wars Outlaws)、《黑神話:悟空》(Black with Wukong)、《電馭叛客 2077》(Cyberpunk 2077)、《心靈殺手 2》(ALAN WAKE II)這四款原生 4K 解析度效能僅有 30 fps 左右的遊戲,在開啟 DLSS 3.5 後已經可以達到接近 100 fps 或是以上的顯示效能表現水準。

最後來看這次 RTX 50 系列顯示卡的 DLSS 4 效能提升部分,這次更加入了 4X 的幀間生成性能,這部分有 《星際大戰:亡命之徒》(Star Wars Outlaws)、《漫威爭鋒》(MARVEL RIVALS)、《霍格華茲的傳承》(Hogwarts Legacy)、《闇龍紀元:紗帳守護者》(Dragon Age)、《電馭叛客 2077》(Cyberpunk 2077)、《心靈殺手 2》(ALAN WAKE II) 等六款遊戲具備測試版本可進行測試,不過這部分就僅有 RTX 5090 創始版顯示卡的數字而已了,以下是測試結果:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
NVIDIA GeForce RTX 5090 創始版顯示卡在 4K 解析度下,加入 DLSS 4 的 4X 幀間生成技術、在最高畫質設定、開啟光線追蹤、光線重建功能,以『品質』取向設定時的遊戲效能測試結果,平均遊戲顯示效能為 288.29 fps。可以看到包括 《星際大戰:亡命之徒》(Star Wars Outlaws)、《電馭叛客 2077》(Cyberpunk 2077)、《心靈殺手 2》(ALAN WAKE II)三款重度遊戲都有 150 fps 以上的顯示效能表現。

不過畢竟是插入了三張 AI 幀的 Multi Frame Generation 技術,很多人應該會對延遲表現有所遲疑,陳拔也在測試過程中擷取了不同設定下的效能表現數字,提供給大家比較,首先是在比較吃重畫質的 《心靈殺手 2》(ALAN WAKE II)遊戲部分:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價《心靈殺手 2》(ALAN WAKE II)測試版本的遊戲顯示設定畫面,可以看到在 DLSS Frame Generation 部分多出了 2X 與 4X(未完全顯示)的設定項目。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
(點擊可看大圖)由左至右分別是 4K 原生、4K 原生 + 光線追蹤最高設定、4K + 光線追蹤最高設定 + DLSS 品質取向、4K + 光線追蹤最高設定 + DLSS 品質取向 + 2X 幀間生成、4K + 光線追蹤最高設定 + DLSS 品質取向 + 4X 幀間生成。可以看到在開啟光線追蹤後,顯示延遲部分由原生的 15 毫秒提升到 30 毫秒,但是在開啟 DLSS 後下降至 20 毫秒的水準。

接著是比較偏向 FPS 競技類的《漫威爭鋒》(MARVEL RIVALS)遊戲,這部份則是在 NVIDIA APP 測試版本裡面的 DLSS 覆寫(Override)-影格產生(Frame Generation) 設定項目開啟 4X 設定。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
在測試版本中的 NVIDIA APP 對 《漫威爭鋒》(MARVEL RIVALS)開啟 4X 的影格產生設定。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價

(點擊可看大圖)同樣的由左至右分別是 4K 原生、4K 原生 + 光線追蹤最高設定、4K + 光線追蹤最高設定 + DLSS 品質取向、4K + 光線追蹤最高設定 + DLSS 品質取向 + 2X 幀間生成、4K + 光線追蹤最高設定 + DLSS 品質取向 + 4X 幀間生成。在顯示延遲的部分由原生的 7 毫秒略升至 9.6 至 11 毫秒(依設定不同),而跟滑鼠操作有關的整體 PC 延遲則是從原生的 11.9 毫秒上升至 15.3 至 24.8 毫秒,另外在 2X 幀間生成與 4X 幀間生成的差異部分,兩款遊戲都是 4X 幀間生成的延遲較低,只比起未開啟幀間生成時高一點而已。

NVIDIA GeForce RTX 5090 創始版顯示卡內容創作效能測試

接著來看 NVIDIA GeForce RTX 5090 創始版顯示卡在內容創作部分的效能表現,這次 RTX 5090 在內容創作這部分也提供了相當大的更新支援,加入了第九代的編碼器以及第六代的解碼器,提供包括 4:2:2 色彩深度素材、MV-HEVC、AV1 UHQ 等編解碼的支援,另外在 NVENC 編碼器數量部分也提升到 3 組(RTX 4090 是 2 組、RTX 3090 是 1 組),提供更快的影像編碼輸出效能。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
這邊借用一下 NVIDIA 官方的簡報資料,除了在先前 CES 展中展示的同時回放 9 部 4K 60p 4:2:2 影片的解碼效能外(請見:【CES2025】 7 萬在手效能我有!NVIDIA GeForce RTX 5090 創始版顯示卡動眼看與更多效能展示),也比較了使用 RTX 5090 進行編碼以及使用 CPU 進行編碼的效能比較,使用 RTX 5090 來對 4:2:2 素材進行編碼的速度大概快了 11 倍左右。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
另外運用第九代編碼器,可以使用更高品質的 AV1 UHQ 編碼格式,另外採用了三組 NVENC 編碼器的設計,比起兩組 NVENC 編碼器的 RTX 4090 要縮短了 37.5% 的輸出時間。

至於實際內容創作的效能測試部份,陳拔則是利用測試軟體搭配 Adobe Premiere Pro、V-Ray、Blender 等軟體進行效能測試,首先來看利用 UL Procyon 的 Video Editing BenchMark 測試項目,針對 Adobe Premiere Pro 進行影片編輯效能測試的結果:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價NVIDIA GeForce RTX 5090 創始版顯示卡在 UL Procyon 測試軟體中對 Adobe Premiere Pro 進行影片編輯效能測試,在開啟 GPU 加速的設定下,所得到的成績為 79217 分。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價跟 RTX 4090 創始版顯示卡相比,則是有約 45.38% 的效能提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
進入分項測試結果來看,在 1080p 解析度 H.264 的部分比起 RTX 4090 創始版顯示卡時間要縮短 40%,而在 4K H.265 的部分則是要縮短 20% 的運算時間。(點擊可看大圖)

至於在影像渲染效能部分,陳拔則是利用 V-Ray 以及 Blender 的測試套件對 NVIDIA GeForce RTX 5090 創始版顯示卡進行測試,首先是在 V-Ray 6 的部分,以下是測試結果:

V-Ray GPU Cuda
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
V-Ray GPU RTX
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價

NVIDIA GeForce RTX 5090 創始版顯示卡在 V-Ray 6 影像渲染的測試結果,在 CUDA 測試項目得到的分數為 4907 vpaths、在 RTX 的測試項目得到的分數為 15104 vpaths。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價在跟 RTX 4090 創始版顯示卡比較的部分,可以看到在 RTX 的部分比 RTX 4090 要多了 38.54% 的效能提升,但是 CUDA 的測試項目中分數比較奇怪一點,比起 RTX 4090 要低的相當多,這部分就看之後 V-Ray 會不會針對這部分做出更新。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
在另外一套 3D 建模軟體 Blender 的部分,NVIDIA GeForce RTX 5090 創始版顯示卡在測試套件中得到的成績為:在 Monster 測試項目獲得了 7415.738053 Samples/分,在 Junkshop 項目獲得了 3954.141352 Samples/分,在 Classroom 項目獲得了 3690.752524 Samples/分的成績。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價跟 RTX 4090 創始版顯示卡比較,RTX 5090 創始版顯示卡的效能平均提升約 38% 左右。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡 AI 效能測試

不光是遊戲,憑藉著 GPU 強大的平行算力,目前若是要在個人電腦上進行 AI 運算,GPU 仍然是最主要的運算效能來源,而 NVIDIA 的 RTX 系列顯示卡憑藉著早先進入市場,建立了相當強大的 AI 生態系護城河,在這次 NVIDIA 的 CES 活動中也展示了相當多的新功能(請見:【CES2025】AI 智慧隊友陪你破關! NVIDIA 將 NIM 微架構導入個人電腦 展示更多 RTX AI PC 智慧遊戲與專業應用),而這次的 RTX 50 系列更是透過 Tensor Core 的換代更新,將 AI 算力提高了 2.5 倍,而實際呈現出的效能表現如何?陳拔也針對這部分進行測試。

而目前比較有系統化的 AI 測試項目,包括 GeekBench 推出的 GeekBench AI、UL 推出的 Procyon 測試軟體中的 AI 測試項目,前者主要針對基礎的 AI 推論性能進行測試,後者的測試項目比較多元,包括物件辨識應用的 AI Computer Vision Benchmark、圖片生成的 AI Image Generation Benchmark 以及文字生成的 AI Text Generation Benchmark 等三大項目。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
GeekBench AI 的 AI 效能測試。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
UL Procyon 的 AI 測試項目。

另外專業針對雲端伺服器 AI 運算效能評估的 MLPerf 也有推出可用在 Windows 平台上的測試套件,但是陳拔在運用其進行測試的時候發生了無法運作的狀況,所以暫時仍以 UL Procyon 的 AI 測試項目,以及 GeekBench 推出的 AI 測試套件為主進行測試。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
首先來看 GeekBench AI 的測試結果,以 ONNX 框架搭配 DirectML 後端進行運算,在單精度部分的分數為 47212、在半精度的測試分數為 69762,在量化後所得到的分數為 35064

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
而跟 RTX 4090 創始版顯示卡相比,在最終量化分數上有 26.32% 的效能提升幅度。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
接著來看 UL Procyon AI 的測試成績,首先是在物件辨識的 AI Computer Vision Benchmark 測試項目部分,提供包括 Windows ML/NIVIDIA Tensor RT/Intel OpenVINO 等框架,以及 Float32/Float16/Integer 三種精度進行測試,不過可惜這次測試的時候在 RTX 5090 創始版上無法使用 NVIDIA 自家的 Tensor RT 框架進行測試(在 RTX 4090 創始版顯示卡上可以運作,陳拔詢問 NVIDIA 的結果是他們正在跟 UL 解決這個問題),只好使用通用的 ONNX 框架進行測試,以下是測試結果:(點擊可看大圖)

Float32
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
Float16
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
Integer
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價


在測試結果部分,NVIDIA GeForce RTX 5090 創始版顯示卡在 UL Procyon AI Computer Vision BenchMark 測試項目中,以微軟 Windows ML 框架,在 Float32 精度設定下的分數為 1948,在 Float 16 精度設定下的分數為 3107,在 Integer 精度設定下的分數為 1042。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
而跟 RTX 4090 創始版顯示卡相比,NVIDIA GeForce RTX 5090 創始版顯示卡在這部分約有平均 26.5% 的效能提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
接著來看在個人生成式 AI 應用比較熱門的圖片生成效能部分,這部分陳拔是利用 AI Image Generation Benchmark 項目進行測試,這個測試項目主要使用 Stable Diffusion 1.5 與 Stable Diffusion XL 進行測試,並且使用 FP16 與 INT 8 精度配置,支援 ONNX/NIVIDA Tensor RT/Intel Open VINO 等框架。在 Stable Diffusion 1.5 FP16 部分是以 Batch Size 4、100 Steps 的設定生成 512 x 512 尺寸的照片,而 Stable Diffusion 1.5 INT8 的部分則是以 Batch Size 1、50 Steps 的設定生成 512 x 512 尺寸的照片,至於負載最大的 Stable Diffusion XL FP16 則是以 Batch Size 1、100 Steps 的設定生成 1024 x 1024 尺寸的影像。

不過很可惜的跟 AI Computer Vision BenchMark 測試項目相同,在這部分的測試中 NIVIDA Tensor RT 框架目前也沒辦法支援 RTX 5090 運作(在 RTX 4090 上可以),所以這部分的測試就以運用 ONNX 框架測試為主,並且僅能以 FP16 精度進行運作,以下是 NVIDIA GeForce RTX 5090 創始版顯示卡的測試結果:(點擊可看大圖)

SD 1.5 (FP16)
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
SDXL (FP16)
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價

在測試結果部分,NVIDIA GeForce RTX 5090 創始版顯示卡在 UL Procyon AI Image Generation Benchmark 測試項目中,以 ONNX 框架,在 FP16 設定下,在 SD 1.5 的分數為 6066,在 SDXL 的分數為 5323。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價在與 RTX 4090 創始版顯示卡比較的結果,NVIDIA GeForce RTX 5090 創始版顯示卡平均有 37.64% 的效能提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
另外 NVIDIA 也提供了 UL Procyon AI Image Generation Benchmark 中尚未公開的 Beta 版本 FLUX.1測試套件,以另一款 FLUX.1 AI 圖片生成應用來測試 RTX 50 系列顯示卡在 FP4 精度的效能表現,這次 NVIDIA 率先在 RTX 50 系列顯示卡提供 FP4 的硬體運算能力,可以大幅節省數據運算量(換個方式講就是可以運算更大、更多參數的 AI 模型),接著就來看這部分的效能表現。



FLUX.1 FP4
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
FLUX.1 FP8
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價

在這部分的成績會是以生成一張圖片的平均時間來計算,NVIDIA GeForce RTX 5090 創始版顯示卡在 FP4 的成績為每張需要 3.964 秒的生成時間,而 FP8 的成績為每張需要 6.56 秒的生成時間。

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
可以看到在 FP8 設定時,NVIDIA GeForce RTX 5090 創始版顯示卡大約比起 RTX 4090 創始版顯示卡要快上 42.27%,但是到了 FP4 設定,不僅比 RTX 4090 創始版顯示卡快上 78%,而且比起同樣在 RTX 5090 上的 FP8 設定還要快上 40%。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
最後來看在文字生成的 AI Text Generation Benchmark 部分,這個部分可說是未來 PC 上AI 運用的主要方式,包括文件彙整、產出摘要、個人 AI 助理回應等等,若是都要在個人 PC 上運算,都會需要這部分的效能。

而 UL Procyon AI Text Generation Benchmark 在這部分提供了基於 LLM 大型語言模型的運算效能,使用包括 ONNX( DirectML) 與 Intel OpenVINO 框架的 AI 模型效能測試,測試的 LLM 模型包括 Phi-3.5-mini、Mistral-7B、Llama-3.1-8B 以及 Llama-2-13B 四款,以下是 NVIDIA GeForce RTX 5090 創始版顯示卡在這項測試的效能表現:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價可以看到 NVIDIA GeForce RTX 5090 創始版顯示卡在 UL Procyon AI Text Generation Benchmark 測試項目中,以 ONNX 框架測試的結果,在 Phi-3.5-mini 模型的分數為
6039、在 Mistral-7B 模型的分數為 6604、在 Llama-3.1-8B 模型的分數為 6422 以及在 Llama-2-13B 模型的分數為 6825。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
至於跟 RTX 4090 創始版顯示卡相比,NVIDIA GeForce RTX 5090 創始版顯示卡在 UL Procyon AI Text Generation Benchmark 測試項目中則是有平均 32.85% 的效能提升幅度。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡測試時溫度與功耗表現

在先前 CES 發表展出的時候,許多人都很驚訝這次 NVIDIA GeForce RTX 5090 創始版顯示卡縮減成僅 2 Slot 的設計,畢竟前一代的 RTX 4090 創始版可是 3 Slot 卡槽的大傢伙,而 NVIDIA 這次改採不一樣的同面雙風扇的 Double flow through 雙風流通過設計,是否真能如官方所說,提供更有效率的散熱結果呢?陳拔也在測試過程中,以軟體紀錄了NVIDIA GeForce RTX 5090 創始版顯示卡 GPU 的最高溫度表現,所記錄到的數值如下:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價可以看到在進行 3DMark 的效能測試項目時,NVIDIA GeForce RTX 5090 創始版顯示卡的最高平均溫度為 71.2 ℃,比起在相同條件下進行測試的 RTX 4090 創始版顯示卡的 66.2 ℃ 要高了約 5℃ 左右。

另外陳拔也利用紅外線儀,在 NVIDIA GeForce RTX 5090 創始版顯示卡進行壓力測試時,拍攝顯示卡外部的表面溫度,所拍攝到的數值如下:

正面
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
側面
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
背板
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
尾端
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
IO
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價



可以看到最高的表面溫度出現在背板中央的部分,出現超過 70 ℃ 的表面溫度,另外也可以看到兩側的 Double flow through 雙風流通過設計也能有效的擴散熱量,到顯示卡其他部分就降溫的比較快了,不過整體來說表面的最高溫度仍然比 RTX 4090 創始版顯示卡要高上 10℃ 以上,在配置機殼內散熱設計的時候,底部上吹風扇可能需要列為必要設置,來提供更大的散熱風流。

至於在功耗部分,陳拔則是利用 NVIDIA 外接的 PCAT 測試套件(請見:NVIDIA RTX 顯卡測試新工具亮相 新增延遲時間測試與獨立功耗測量),在進行跑分效能與遊戲效能測試時,紀錄了 NVIDIA GeForce RTX 5090 創始版顯示卡的最高功耗,以下是測試的結果:

電馭叛客 2077 4K 測試時功耗
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
3DMark Speed Way 壓力測試時功耗
NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價


可以看到基本上在最高負載時會跑到 600W 出頭的水準,以下是更多測試時的功耗紀錄,以及與 RTX 4090 創始版顯示卡的比較:

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
在效能測試時 NVIDIA GeForce RTX 5090 創始版顯示卡的最高功耗平均值為 623.75W,比起 RTX 4090 創始版顯示卡的 474.87W 要高出了 148.9W。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
而在使用十八款 3A 大作遊戲、以 4K 解析度、最高畫質設定進行測試時,NVIDIA GeForce RTX 5090 創始版顯示卡的最高功耗平均值為 588W,比起 RTX 4090 創始版顯示卡的 442.57W 要高出了 145.5W,比例大約是多出 30%,跟效能提升的幅度差不多,基本上就是拿功耗來換效能的提升。(點擊可看大圖)

NVIDIA GeForce RTX 5090 創始版顯示卡測試總結

NVIDIA GeForce RTX 5090 創始版顯示卡效能實測 效能再度大突破!當然也有代價
NVIDIA GeForce RTX 5090 創始版顯示卡。

撇開 NVIDIA 創辦人兼 CEO 黃仁勳在發表會簡報裡提的 2 倍效能提升(那畢竟是 DLSS 3 的 2X 幀間生成對上 DLSS 4 的 4X 幀間生成),在同樣的設定下,這次 NVIDIA GeForce RTX 5090 創始版顯示卡就是比前一代的 RTX 4090 創始版顯示卡要多出 30% 以上甚至是 50% 以上的效能表現,效能提升的幅度真的相當大,而且即便像是 《星際大戰:亡命之徒》(Star Wars Outlaws)、《黑神話:悟空》(Black with Wukong)、 《心靈殺手 2》(ALAN WAKE II)這類對顯示效能比較吃重的遊戲,在不開啟 DLSS 與幀間生成功能的設定下,原生就能跑到 4K 60p 左右的遊戲幀率表現,而若要開啟最高光線追蹤設定,搭配 DLSS 僅提升一階的『品質』設定,也能回到流暢的遊戲顯示水準,可說是真 4K 遊戲顯卡無誤!

至於在內容創作跟 AI 效能的部分,這次 RTX 5090 的 32GB 顯示記憶體配置更是相當有利,不僅在影片轉檔、3D 渲染部分都有接近 40% 的效能提升,在運作 FP4 模型時更有接近 80% 的效能提升表現。

但相對地這麼有感的效能提升,在顯示卡功耗的增加上也相當有感,雖然 NVIDIA 官方在規格表上標示的 TGP 為 575W,但是在實際效能測試時,突破 600W 可說是常態演出,對於目前功耗設定在 600 W 的 PCIe Gen 5 電源線來說其實相當吃緊,雖說電源設計通常都會留下冗餘空間避免超載的狀況,不過經常維持在高檔運作也不是件好事,就看未來電源供應器廠商會不會因應這個狀況,提供更耐久的電源供應與連接設計了。
中間X發光算是意義驚喜嗎

看到溫度的照片⋯感覺5090在機殼裡的風水
是滿重要的
看到很專業的分享
真的很厲害也很詳細
感謝分享&介紹,NVIDIA GeForce RTX 5090 就是強
DLSS品質檔是渲染2K,應該用DLAA才是原生4K
這樣才能發揮4倍幀生成的功能
功耗來換效能的提升 將會是各大測評主經典的結論
陳拔
畢竟要馬兒跑快一點,就要讓馬兒吃多點草
好想看看裡面散熱器長什麼樣子
陳拔
這篇裡面有:https://www.mobile01.com/topicdetail.php?f=298&t=7069599
聽說STEAM上用4090的也才1.16%左右? 那之後5090會不會更低
NVIDIA GeForce RTX 5090 創始版顯示卡效能超強的
這價格對於NVIDIA來說,反而也不是太奇怪的事,畢竟前面的經驗可證,所以現在只能看效能跟老黃皮衣刀客的出手俐落度了
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!