NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 創始版顯示卡(怎麼有種在看 30 系列的感覺 XD)。

在上週的預熱外觀開箱後(請見:NVIDIA GeForce RTX 4090 FE 創始版顯示卡外觀開箱 在經典設計內增加散熱效率)),接著陳拔就來針對效能的部分進行測試,在這次的 Ada Lovelace 架構中,NVIDIA 除了採用台積電的 N4 製程外,包括在 CUDA 核心數量、Stream 串流處理器的設計、RT Core 光線追蹤效能以及這次改變相當大的 Tensor Core AI 部分(尤其是 DLSS 深度學習採樣功能),都讓 RTX 4090 顯示卡的效能.即便上一代 RTX 30 系列的最高階 RTX 3090 Ti 相比,都有飛躍式的成長。

NVIDIA GeForce RTX 4090 FE 顯示卡規格配置

首先來看 NVIDIA GeForce RTX 4090 FE 顯示卡的規格配置,這次 RTX 4090 是採用 Ada Lovelace GPU 中的最高階 AD102 GPU,具備 12 個圖形運算叢集、72 個材質運算叢集、144 個串流多處理器( SMs),記憶體部分採用 384 bit 的記憶體通道。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
AD102 GPU 的 Diagram 圖。

而在整體核心數分佈上,AD102 GPU 包括了 18432 個 CUDA 核心、144 個第三代 RT Core 核心、576 個第四代 Tensor Core 核心以及 576 材質運算單元,在每個 GPC 中配置了 6 組 TPC,具備 12 個 SM 處理器。而每組 SM 處理器內具有 128 個 CUDA 核心、4 個第四代 Tensor Core 核心、1 個第三代 RT Core 光線追蹤核心以及四組材質運算單元,並且配置了 128KB 的 L1 快取記憶體。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
AD102 GPU 中的每組 GPC 架構。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
每組 SM 內的架構分佈。

而與上一代的 RTX 3090 Ti 的規格差異,陳拔在下面列出與 RTX 3090 Ti 的比較表讓大家參考一下:

顯示卡 RTX 3090 Ti RTX 4090
CUDA 核心 10752 16384
GPCs 圖型運算叢集 7 11
TPCs 材質運算叢集 42 64
SM 串流處理器 84 128
GPU 最大加速時脈 1860 MHz 2520 MHz
Tensor Core 336(第三代) 512(第四代)
RT Core 84(第二代) 128(第三代)
顯示記憶體 24GB GDDR6x 24GB GDDR6x
記憶體速度 21 Gbps 21 Gbps
記憶體頻寬 1008 GB/s 1008 GB/s
L1 快取/分享記憶體 10752 KB 16384 KB
L2 快取 6144KB 73728 KB
TGP 顯示卡功耗 450W 450W
電晶體數量 28.3 B 76.3 B
核心製程 三星 8 奈米 NVIDIA 客製化製程 台積電 N4 NVIDIA 客製化製程

可以看到在這次透過微縮製程的改變,AD104 在比起上一代還小的 Die Size 上塞進了接近 2.7 倍的電晶體數量,除了大幅度增加 CUDA 核心數目外,在 Tensor Core、RT Core 的數量也是接近 1.5 倍左右的提升,快取記憶體容量的增幅也相當驚人,但是整體功耗維持在跟 RTX 3090 Ti 同樣的 450 W 水準。

NVIDIA GeForce RTX 4090 FE 顯示卡效能測試

接著就將 NVIDIA GeForce RTX 4090 FE 顯示卡安裝到測試平台上進行測試,測試平台選用 Intel 的 Core i9-12900K 處理器搭配 Z690 主機板的配置(畢竟 13 代還沒解禁就...... ),以下是測試平台的參數:

處理器:Intel Core i9-12900K
主機板:ROG Maximus Z690 Extreme
記憶體:G.Skill 芝奇 Trident Z5 RGB DDR5-5600 CL28 16GBx2
處理器散熱器:CORSAIR iCUE H170i ELITE LCD 420 AIO
系統 SSD:Samsung 980 Pro PCIe Gen 4 SSD 1TB
作業系統:Windows 11 Pro 21H2

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 顯示卡安裝到測試平台上的情形。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
在通電後尾端的 GEFORCE RTX 字樣燈效會亮起。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
在 GPU-Z 裡面顯示的資訊。

另外陳拔也在同一個測試平台上測試了 NVIDIA GeForce RTX 3090 Ti FE 顯示卡,測試結果也一併列入提供比較。

NVIDIA GeForce RTX 4090 FE 顯示卡傳統顯示效能測試

首先來看傳統顯示效能的部分,這次 NVIDIA GeForce RTX 4090 FE 顯示卡的 AD102 GPU 在 CUDA 核心數量部分大幅增加為 1.5 倍,最大加速時脈則是提升為 1.35 倍,對於核心效能部分的提升應該會很明顯,這部分陳拔利用利用 3DMark 測試軟體的 Time Spy、Time Spy Extreme、Fire Strike Extreme 以及 Fire Strike Ultra 等四個項目進行一般遊戲的顯示效能測試,測試結果如下:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 顯示卡在 3DMark 測試軟體中的測試結果,可以看到與 RTX 3090 Ti FE 相比,平均有 68% 的效能提升。

而在實際遊戲表現部分,陳拔則是使用十款遊戲進行測試,遊戲名單包括:《刺客教條:維京紀元》(Assassin's Creed Valhalla)、《極地戰嚎 6》(Far Cry 6)、《看門狗:自由軍團》(WatchDogs:Legion)、《邊緣禁地 3》(Borderland 3)、《大地長征 5》(Dirt 5)、《F1:22》、《地平線:期待黎明》(HORIZON ZERO DAWN)、《古墓奇兵:暗影》(Shadow of the Tomb Raider)、《德軍總部:血氣方剛》(Wolfenstein:Youngblood)、《電馭叛客 2077》(Cyberpunk 2077)、《微軟模擬飛行》(Microsoft Flight Simulator)等,均以最高畫面效果與精細度設定進行測試,在這部分先不開啟光線追蹤與 DLSS 功能,僅就單純的遊戲顯示效能進行比較,比較數據分為1080p、1440p 以及
4K 三個解析度,以下是測試結果:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 顯示卡在 1080p 解析度下的遊戲實際效能表現,跟
RTX 3090 Ti FE 相比平均有 32% 的效能提升,最高則是有 75% 的效能提升表現。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 顯示卡在 1440p 解析度下的遊戲實際效能表現,跟
RTX 3090 Ti FE 相比平均有 50.6% 的效能提升,最高則是有 93.7% 的效能提升表現。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 顯示卡在 4K 解析度下的遊戲實際效能表現,可以看到在關閉光線追蹤跟 DLSS 的狀態下,RTX 4090 在 4K 解析度下,除了《電馭叛客 2077》(Cyberpunk 2077)、《微軟模擬飛行》(Microsoft Flight Simulator)兩款遊戲外,其他 3A 大作均有突破 100 fps 的效能表現,相當厲害。而與 RTX 3090 Ti FE 相比,RTX 4090 FE 則是平均有 70.7% 的效能提升,最高則是有 2.6 倍的效能提升表現,可說在一般非光線追蹤遊戲下,即便不開啟 DLSS 功能,RTX 4090 也有逼近甚至超過目前 4K 解析度旗艦螢幕更新率的性能表現。

另外在幾款遊戲中,還可以看到一個相當有趣的現象,那就是即便提升解析度設定,在遊戲的顯示幀率上改變的幅度並不大,換句話說遊戲效能不是卡在顯示卡端,而是卡在處理器的效能瓶頸:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 顯示卡在不同解析度下的遊戲效能表現,可以看到在 1080p 至 1440p 解析度間切換時,部分遊戲的顯示幀數下降幅度並不明顯,只有在調整至 4K 解析度後才有比較明顯的效能差異。而比較特別的是在 《微軟模擬飛行》(Microsoft Flight Simulator)部分,即便是 4K 解析度,顯示幀率還是跟 1080p 一樣,效能瓶頸完全不是卡在顯示效能部分。

NVIDIA GeForce RTX 4090 FE 顯示卡光線追蹤效能

接著來看這次 NVIDIA GeForce RTX 4090 在光線追蹤效能部分的進步,這次 Ada Lovelace GPU 在 RT Core 光線追蹤核心部份提升到了第三代的 RT Core,除了提供比起前一代增加一倍的光線三角交點效能(Ray-Triangle Intersection Throughput)外,透過新的 Opacity Micromap Engine 可以將測試幾何的光線追蹤速度提升 2 倍。另外利用新的 Displaced Micro-Mesh Engine 來建構複雜幾何形狀的光線追蹤時,將原本需要大幅度分析物件表面三角結構的程序,改為簡化的三角簡化向量對應,透過更簡單的 BVH 模型來加速建構的速度,這使得第三代 RT Core 在 BVH 建構的速度可以加快 10 倍,但是所需要的空間僅要 1/20,大幅度提升了光線追蹤執行時的效能。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
在導入 Displaced Micro-Mesh Engine 後的光線追蹤處理流程,前一代 Ampere (上)與這一代 Ada Lovelace (下)的差異。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
Displaced Micro-Mesh Engine 在建構不同光線追蹤模型時所帶來的效能提升差異。

另外這次 Ada Lovelace 的 第三代 RT Core 還導入一個相當重要的設計:Shader Execution Reordering(著色器執行重新排序)技術,在處理光線追蹤時會有相當多不同類型的資料,包括折射、反射或是透射等,雖說 GPU 在本質上具備平行計算的優勢,但仍僅限於相同類型的資料才能發揮效能,而 SER 的目的就是在光線追蹤資料進入 SM 運算前,先將同類型的資料排列在一起,再進入 SM 執行,增加執行時的效率。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
SER 運作的示範,上方為先前的執行過程,下方則是經過 SER 資料排序後的處理過程,可以看到上方一次僅能執行零散的資料,而下方經過 SER 排序後,就能夠一次處理更多光線追蹤資料。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA 官方表示在導入 SER 技術後所帶來的光線追蹤效能提升,大約從 20% 至 44% 不等。

而在增加光線追蹤效能部分,NVIDIA 也導入了 OPACITY MICRO-MASK 設計來減少 Shader 的工作負載,在先前的 Ampere 架構中,要計算如葉子這樣的半透明物體,需要對整個物件中的光線追蹤進行計算。而在 Ada Lovelace 架構中,透過 AI 的辨識設定,就僅需要針對葉子中的輪廓(如邊緣或葉脈)部分進行計算,大幅度減少了 Shader 的工作量來提升效能。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
OPACITY MICRO-MASK 的工作效果示意。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
可以看到在導入 OPACITY MICRO-MASK 前(左邊影像)與導入 OPACITY MICRO-MASK 後(右邊影像)所需要處理的資料量差異。

而接下來陳拔就用實測來看 NVIDIA GeForce RTX 4090 FE 顯示卡在光線追蹤效能部分的表現,首先是利用 3DMark 測試軟體裡面的 Port Royal 以及 DirectX Raytracing 兩個測試項目,測試 NVIDIA GeForce RTX 4090 FE 創始版顯示卡的光線追蹤顯示效能。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 創始版顯示卡在 3DMark Port Royal 測試項目中的效能表現,比起 RTX 3090 Ti FE 要多出近 79% 的效能表現。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
另外在利用微軟 DirectX API 的即時光線追蹤效能表現上,RTX 4090 FE 也比 RTX 3090 Ti FE 要多出 130% 的效能表現。

至於在實際遊戲的光線追蹤效能表現上,陳拔先用從遊戲抽取出來的《Boundary Ray Tracing Benchmark》(邊境)、《Bright Memory Infinite RTX Benchmark》(光明記憶無限)兩套光線追蹤效能測試軟體進行測試,測試時將光線追蹤效果調至最高、並且關閉 DLSS 功能,分為 1080p、1440p 與 4K 三個解析度進行測試,測試結果如下:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 創始版顯示卡在《Boundary Ray Tracing Benchmark》(邊境)光線追蹤測試的效能結果,跟 RTX 3090 Ti FE 相比,RTX 4090 平均有 89.1% 的效能提升。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
而在 《Bright Memory Infinite RTX Benchmark》(光明記憶無限)測試軟體中,RTX 4090 FE 則是比 RTX 3090 Ti FE 平均要多出 75% 的效能表現。

而在真實遊戲部分,陳拔則是使用具備光線追蹤功能的遊戲,包括《極地戰嚎 6》(Far Cry 6)、《看門狗:自由軍團》(WatchDogs:Legion)、《大地長征 5》(Dirt 5)、《F1:22》、《古墓奇兵:暗影》(Shadow of the Tomb Raider)、《德軍總部:血氣方剛》(Wolfenstein:Youngblood)、《電馭叛客 2077》(Cyberpunk 2077)共七款遊戲進行測試,測試時均將光線追蹤設定開到最高,並且關閉 DLSS 功能進行測試,以下是測試的結果:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 創始版顯示卡在 1080p 解析度的遊戲光線追蹤顯示效能測試結果,依照個別遊戲的表現不同,RTX 4090 平均有 34.4% 左右的領先。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 創始版顯示卡在 1440p 解析度的遊戲光線追蹤顯示效能測試結果,RTX 4090 平均領先幅度加大到 63.12%。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GeForce RTX 4090 FE 創始版顯示卡在 4K 解析度的遊戲光線追蹤顯示效能測試結果,RTX 4090 領先幅度加大到 73.14%,可以看出隨著解析度提高,RTX 4090 在光線追蹤效能上提升的幅度也就越多,而除了 《看門狗:自由軍團》(WatchDogs:Legion)與《電馭叛客 2077》(Cyberpunk 2077)這兩款遊戲,在 4K 解析度、光線追蹤設定最高的設定下,大多數 3A 遊戲大作在 RTX 4090 下都能跑到 4K 100 fps 的效能表現 。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡 DLSS 效能測試

除了光線追蹤效能的進步外,這次 Ada Lovelace 也在 AI 運算效能上有了很大的進步,在遊戲部分的體現就是第三代的 DLSS 深度學習採樣功能。在 Ampere 架構中的 DLSS 2 中透過分析畫面中的運動向量來進行放大演算,著實可以提升不少效能。而這次 Ada Lovelace 的 DLSS 3 中,則是導入了 Ada Optical Flow Accelerator 光流加速器設計,除了透過放大演算來提高畫質外,透過預測畫面中的運動向量,以神經網路來計算生成補幀,讓 DLSS 3 可以在生成高解析度流暢畫面的同時,仍然保有原本低解析度的低畫面延遲水準。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
原本 DLSS 2 畫質提升技術的工作流程。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現

此外這次 DLSS 3 部分還加入了透過神經網路生成補幀的 Optical Multiframe Generation 設計,除了透過以往的放大技術來增加幀數外,還會在每張遊戲生成幀間再插入一張神經網路生成的畫面來提高遊戲顯示幀數。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
以陳拔測試時使用的支援 DLSS 3 的《電馭叛客 2077》(Cyberpunk 2077)測試版本為例,可以看到在 DLSS 項目中多出了一項『DLSS Frame Generation』功能的選項,就是開啟神經網路生成畫面的功能。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
在 NVIDIA 的官方簡報中,在開啟 DLSS 3 技術後,在 Optical Multiframe Generation 技術的加持下,僅需要渲染顯示幀數的 1/8 資源,就能夠呈現完整的高解析度畫面,自然顯示幀數就能大幅度的提升。不過除了軟體的支援外,在這次 Ada Lovelace 中也需要特定的硬體才能具備這項功能,所以在缺乏第四代 Tensor Core 以及 Optical Flow Accelerator 光流加速器的 RTX 30 系列顯示卡上,就僅能提供 Super Resolution 畫質提升技術。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
這次完整 DLSS 3 架構所需具備的軟硬體功能,軟體部分包括 AI Super Resolution 畫質提升技術、AI FRAME GENERATION 補幀生成以及 NVIDIA REFLEX 反應提升。而相對應的硬體則是需要第四代的 Tensor Core、Optical Flow Accelerator 光流加速器以及後端的超級電腦運算功能。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
所以使用不同的 RTX 顯示卡,可以啟用的 DLSS 3 功能也有所不同,像是 DLSS FRAME GENERATION 畫面生成補幀這部分目前就只有 RTX 40 系列顯示卡可以開啟,而 Super Resolution 以及 Reflex 技術則是較舊款的顯示卡就能支援。

而陳拔也針對 RTX 4090 FE 的 DLSS 效能進行測試,首先是在 3DMark 的 DLSS 測試項目部分,這次陳拔採用的是支援 DLSS 3 的 3DMark 測試版本,不過因為 DLSS 3 的部分僅有 RTX 4090 可以測試,所以陳拔也在 RTX 4090 FE 上測試了 DLSS 2 的部分,比較好跟 RTX 3090 Ti 有個比較基準,設定時均採用『品質』設定取向,在原始解析度部分不會縮減太多,以下是測試結果:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
首先來看在 DLSS 3 的部分,可以看到有 75% 至 3.4 倍的幀數提升。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
而陳拔也測試了在 8K 解析度下,不同 DLSS 3 設定的表現,在由 1440p 放大至 8K 解析度的 Performance 設定中,就能夠達到 60 fps 的表現了。

至於在比較普及的 DLSS 2 效能表現上,陳拔也利用 3DMark 進行測試,並且與 RTX 3090 Ti FE 進行比較,結果如下:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
可以看到在 DLSS 2 下,即便沒有 DLSS FRAME GENERATION 功能,RTX 4090 FE 的效能仍然比 RTX 3090 Ti FE 要提升相當多。

至於在遊戲表現上,先來看目前比較多的 DLSS 2 部分,在 4K 解析度設定、將畫質與光線追蹤功能設定在最高狀態,來看 RTX 4090 FE 的表現,首先是從遊戲中抽取出來的《Boundary Ray Tracing Benchmark》(邊境)、《Bright Memory Infinite RTX Benchmark》(光明記憶無限)兩套光線追蹤效能測試軟體的結果:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GEFORCE RTX 4090 FE 顯示卡在 《Boundary Ray Tracing Benchmark》(邊境)光線追蹤測試軟體中,開啟光線追蹤、 DLSS 『品質』設定的測試結果。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GEFORCE RTX 4090 FE 顯示卡在 《Bright Memory Infinite RTX Benchmark》(光明記憶無限)光線追蹤測試軟體中,開啟光線追蹤、 DLSS 『品質』設定的測試結果,可以看到在兩套測試軟體中,RTX 4090 FE 在 4K 解析度下就能有 75 fps 以上的顯示效能。

另外在支援舊版 DLSS 的遊戲效能部分,陳拔則是利用《看門狗:自由軍團》
(WatchDogs:Legion)、《 地平線:期待黎明》(HORIZON
ZERO DAWN)、《F1:2021》、《古墓奇兵:暗影》(Shadow of the Tomb Raider)、
《德軍總部:血氣方剛》(Wolfenstein: Youngblood)等五款遊戲,在 4K 解析度下進行測試,DLSS 設定同樣為『品質』、畫質與光線追蹤設定為最高,以下是測試結果:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
可以看到在舊款 DLSS 遊戲效能表現部分,RTX 4090 FE 的效能比起 RTX 3090 Ti FE 平均有 64.37% 的效能提升。

接著就來看 RTX 4090 FE 在開啟 DLSS 3 後實際在遊戲中的表現狀況,這次陳拔使用支援 DLSS 3 的遊戲測試版本,包括《F1:22》、 《電馭叛客 2077》(Cyberpunk 2077)、《微軟模擬飛行》(Microsoft Flight Simulator)這三款遊戲,不過在測試 《電馭叛客 2077》(Cyberpunk 2077)時,陳拔發現遊戲內效能測試的成績與 NVIDIA FrameView 軟體所呈現出的幀數有差異,而且剛好差了一倍,可能是測試版本的 《電馭叛客 2077》(Cyberpunk 2077)在幀數計算上僅計算到遊戲本身所生成的畫面,並沒有將 RTX 4090 FE 顯示卡神經網路渲染的補幀計算進去的原因。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
《電馭叛客 2077》(Cyberpunk 2077)的測試畫面,可以看到左上角的遊戲顯示幀數跟右上角的 FrameView 顯示幀數剛好差了一倍,以下是陳拔的測試結果:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
可以看到在目前支援 DLSS 3 的遊戲部分,若是都以 FrameView 的結果來看,RTX 4090 FE比起 RT X3090 Ti FE 要多出約 88.67% 至 148% 的效能表現,在 4K 解析度下,僅需要將 DLSS 3 開至『品質』模式,再搭配 FRAME GENERATION 功能,即便是 《電馭叛客 2077》(Cyberpunk 2077)或是 《微軟模擬飛行》(Microsoft Flight Simulator)這兩款過往幀數表現都不好的遊戲, 都還有平均超過 100 fps 的顯示效能水準。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡內容創作效能測試

另外在顯示卡很看重的另一塊領域:內容創作部分,這次的 Ada Lovelace 除了透過核心效能的加強外,並且導入了 AV1 硬體編碼的設計,能夠比過去在 Ampere 所使用的 H.264 編碼提升 40% 的效率,對於即時串流來說,可以在相同解析度上減少上傳的資料量,在過去僅能使用 1080p 解析度進行直播,改用 RTX 4090 後,就能夠使用 1440p 來進行更高品質的直播,而目前 Youtube 已經支援 AV1 編碼直播,Twitch 則是在不久後也會跟進。軟體部分目前則是有 OBS Studio 以及 Discord 支援 AV1 編碼直播的功能。

至於在影片創作部分,RTX 4090 這次則是提供了雙 NVENC 編碼器的配置,最高可支援一部 8K60p 或是同時四部 4K 60p 的影片進行處理,對於內容創作的效率提高不少,陳拔也透過 UL Procyon Video 影片編輯效能測試以及 PugetBench 的 Adobe Premiere Pro 影片編輯增益集進行測試,以下是測試結果:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA Geforce RTX 4090 FE 在影片編輯效能的測試結果,比起 RTX 3090 Ti FE 要多出 11 % 左右的效能,不過目前 Premiere Pro 尚未完全支援 AV1 編碼(需安裝額外的增益集),所以 RTX 4090 FE 的測試結果未來還可能會有差異。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA RTX 4090 FE 在 UL Procyon Video BenchMark 的分項測試表現。

陳拔也利用 PugetBench 針對 Adobe Premiere Pro 的測試增益集進行 4K 影片編輯的效能測試,結果如下:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA RTX 4090 FE 創始版顯示卡在 PugetBench for Adobe Premiere Pro 的效能測試表現,可以看到在影片編輯的效能部分,RTX 4090 比起 RTX 3090 Ti 平均要多出 12% 的效能,不過這還不算是利用 AV1 編碼加速的部分,這個部分之後陳拔會在另外寫一篇為大家介紹。

另外在 3D 創作部分,陳拔則是利用 V-Ray 5 以及 Blender 測試組件進行測試,以下是測試結果:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA RTX 4090 FE 創始版顯示卡在 V-Ray 5 影像渲染效能部分的表現。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA RTX 4090 FE 創始版顯示卡在 Blender 影像渲染效能測試部分的表現,比起 RTX 3090 Ti 則是有平均 88.98% 的增幅。

NVIDIA GeForce RTX 4090 FE 創始版顯示卡顯示核心溫度與功耗表現

而在先前 RTX 3090 Ti 顯示卡測試時,最高功耗基本上都上看 500W 等級,這也讓許多玩家在面對 RTX 40 系列產品時,都抱持的將會有更高功耗設定的態度,加上這一次 RTX 40 系列在電源供應部分,採用可單條提供最高 600W 的 PCIe 12VHPWR Auxiliary Power 電源供應設計,這也使得 RTX 4090 發表前,傳出有上看 500W 單卡功耗的消息。不過在實際發表時,NVIDIA 這次採用台積電 N4 製程,將 TGP 壓制在跟 RTX 3090 Ti 同級的 450W 水準,至於實際表現是否如此,先來看一下陳拔在測試時,以 NVIDIA PCAT 套件記錄到的單卡最高功耗:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA RTX 4090 FE 創始版顯示卡在進行效能測試時的單卡最高功耗表現,可以看到在 3DMark 的相關測試部分,NVIDIA RTX 4090 FE 創始版顯示卡的最高功耗平均為 462W 左右,比起 RTX 3090 Ti FE 還要少了 6%。而在影像應用相關的測試部分,則是 329 W 左右,也比 RTX 3090 Ti FE 要低了 7.5%。

接下來是在遊戲執行時的功耗表現,採用 4K 解析度設定,並且開啟 DLSS 與光線追蹤功能,以下是 NVIDIA RTX 4090 FE 創始版顯示卡在這部分的測試結果:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA RTX 4090 FE 創始版顯示卡在進行 4K 解析度遊戲效能測試時的單卡最高功耗表現,平均值為 418 W,比起 RTX 3090 Ti FE 大約減少了 9% 左右的功耗,在效能大幅度提升下,功耗表現卻是降低,在這部分 RTX 4090 FE 的表現真的很不錯。

另外在溫度表現部分,先前在外觀開箱時(請見:NVIDIA GeForce RTX 4090 FE 創始版顯示卡外觀開箱 在經典設計內增加散熱效率),陳拔就有提到這次 RTX 4090 FE 在散熱設計上有所提升,是否能真正反映在實際的溫度表現上呢?以下是陳拔在測試時,利用 GPU-Z 軟體記錄到的顯示卡最高熱點溫度:

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA RTX 4090 FE 創始版顯示卡在進行效能測試時的顯示卡最高熱點溫度,平均值為 77.35℃,比起 RTX 3090 Ti FE 要多出約 3% 左右的溫度,以這次 RTX 4090 效能提升的幅度來看,這樣的溫度控制表現算是相當不錯。

另外陳拔也用 FLIR 紅外線儀拍攝了 NVIDIA RTX 4090 FE 創始版顯示卡在進行 3DMark TimeSPY Extreme 壓力測試時的表面溫度,所拍攝到結果如下:

顯示卡側面
NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
電源連接處
NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
顯示卡風扇正面
NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
IO 檔板
NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
顯示卡背面
NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現


可以看到表面溫度大致在 47℃ 以下,跟先前 RTX 3090 Ti FE 在測試時會燙手的外殼相比,這次 RTX 4090 在測試時的表面溫度算是較低的(不過還是會有點燙啦....)

NVIDIA GeForce RTX 4090 FE 顯示卡測試結語

NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能實測 以 4K 解析度達成 100 fps 以上遊戲流暢表現
NVIDIA GEFORCE RTX 4090 FE 創始版顯示卡。

就效能表現來說,這次 RTX 4090 FE 的表現無疑是在將旗艦顯示卡的天花板再往上推升,基本上在傳統 3A 遊戲大作中,要在 4K 解析度下達到 100 fps 的效能表現可說是輕而易舉,甚至不用開啟 DLSS 功能就能有這樣的表現,可說真正讓玩家來到 4K 遊戲順跑的世代。另外在內容創作的部分,即便採用非 AV1 解碼的工作,也能有 10% 以上的效能增幅,也讓人更為期待這次 RTX 4090 的雙 AV1 編碼器在影片處理效能的提升。

不過這樣的效能提升幅度,相對應帶來的的就是功耗跟熱量的增加,雖說這次 NVIDIA 透過更改微縮製程的方式來降低功耗,讓 RTX 4090 FE 維持與 RTX 3090 Ti FE 相同甚至是較低的功耗表現,但是在溫度控制上就要更花功夫,這部分就要看接下來的 AIC 合作廠商產品,各家廠商是否會透過更為獨特的設計,讓 RTX 4090 的溫度控制在更理想的程度了,陳拔也會陸續送上測試報告,敬請期待。
NVIDIA GeForce RTX 4090 FE 創始版顯示卡效能還真不錯! 不過最近顯示卡價格還有降落的空間,再等等觀察一下!!
感覺實際功耗比 3090 Ti 低,然後散熱器更大,但是溫度沒有比較低? o_O
http://kheresy.wordpress.com/
陳拔
採用台積電先進製程的產品大部分都會有這樣的特性,畢竟電晶體密度大幅增加,發熱度當然也是急速增加
Nebuchadnezzar
主要是顯存(顯示記憶體)密度翻倍,這次顯存顆粒都集中在正面而背面沒有,好在散熱器的均熱板有擴大覆蓋到顯存
4090真的很猛!但是感覺N就是鐵了心跟買家比誰口袋深!其他卡就是不降價不然就是消失無影蹤!一副不買就拉倒!!
奇峰道眉
股市會教訓牠的
duckbill360
人家畢竟是商人咩
感謝陳拔的評測~ 4090不愧是卡皇
照這個刀法來看 4080 12G 可能就和 3090 Ti 差不多了
效能好,但我還在等其他降價
看了文章介紹~感覺效能挺厲害的!
高規的物品很不錯
眼睛一亮
陳拔 wrote:
NVIDIA GeF...(恕刪)

效能蠻強的
看起來不錯
陳拔
真的很強
NVIDIA GeForce RTX 4090 FE 採用TSMC 4N製程,CUDA核心數、RT Core 光追和DLSS 3 遊戲性能優化讓影音娛樂推至最高層級,頂級顯卡配備850W以上高功率電供已成趨勢
關閉廣告
文章分享
評分
複製連結

今日熱門文章 網友點擊推薦!