
AMD 在 2 月 28 日晚上發表了新一代的 RDNA 4 架構以及 Radeon RX 9070 系列顯示卡,在看過了官方的發表與介紹後(請見:【採訪】AMD 發表新一代 Radeon RX 9070 XT/9070 顯示卡 加入 FSR 4 技術提升畫質 高階版本還比對手便宜),接著來看這次 RDNA 4 顯示架構的深度介紹,

這次 RDNA 4 架構的比較新的亮點,包括針對高階遊戲重負載進行最佳化、提高光柵化與運算效率、顯著的光線追蹤效能提升、高性能的綜合機器學習支援、顯示頻寬的增加以及多媒體效能的提升。

首先來看整體架構的部分,目標就是針對 4K 解析度的遊戲顯示效能所設計,採用第三代的光線追蹤單元、最佳化的快取系統設計、改良的命令處理器、第三代矩陣加速單元、Radiance 顯示引擎、GDDR6 記憶體、最佳化架構配置,另外這次還加入了兩組媒體引擎設計,提供更好的媒體編碼/解碼效能。(點擊可看大圖)

在這次新增的媒體引擎部分,主要針對遊戲串流與錄製的效能進行增強,主要在直播主較常用的低碼率格式部分提供更低的延遲以及更高的畫面品質,在 H.264 部分提高了 25% 的畫質表現,在 HEVC 編碼格式提供了 11% 能源效率提升、而在 720p 解析度部分提供了 30% 以上的編碼效能成長。
另外在格式支援度部分,除了針對 FFMPEG、OBS、Handbrake 軟體進行最佳化外,也透過 VCN 低功耗影片回放,提高 AV1/VP9 影片格式 50% 的效能提升,並且減少記憶體的寫入需求。



而 AMD 在這次簡報中表示,遊戲畫面表現的進步速度越來越快,從傳統的光柵化設計、光線追蹤/神經網路升頻/幾何細節提升、到路徑追蹤全域光照/神經網路模擬等,提供更逼真的畫面,而 AMD 也表示光線追蹤功能在未來的大多數遊戲中將會成為不可或缺的要素,AMD 目前也正在致力於路徑追蹤技術的最佳化,並且將會應用到部分遊戲中。

所以在這次 RDNA 4 架構中,光線追蹤加速器也是相當大的升級重點,改為 8 組方形/2 組三角形的配置,比起上一代增加一倍,另外在 BVH 結構跟走訪(Traversal)效能上也透過新的節點與定向包圍盒(Oriented Bounding-Box,OBB)設計來降低 BHV 記憶體用量、減少延遲以及錯誤相交的產生,另外透過動態 VGPR 管理來增加渲染效率。

其中又以導入定向包圍盒(Oriented Bounding-Box,OBB)設計為最大的改變重點,在傳統的 BVH 包圍設計中因為幾何不對齊的緣故,導致產生大量內部為空的錯誤盒,增加無效相交的數量,而 AMD 的解法是每個盒節點中允許一個特定的定向來對齊,來減少無效相交的數量,進而增加整體效能。

另外在記憶體部分 AMD 表示他們發現光線追蹤負載對於記憶體的延遲相當敏感,所以在 RDNA 4 架構中加入了亂序記憶體設計,可以讓渲染器有效地忽略某些比較高延遲的要求,來增加較多負載時的效能表現。

而在導入上述設計後,RDNA 4 的運算單元 (CU)可以獲得兩倍的光線走訪(Traversal)效能表現。

至於在渲染器的部分,則是導入了動態寄存器(Dynamic Registers)的概念,在 RDNA 4 渲染器中提供了動態分配寄存器的選項,透過軟體分配寄存器來達到更有效率的資源分配。

在 AI 部分,RDNA 4 架構也透過增強的 WMMA(Wave Matrix Multiply Accumulate)運作,緊密結合矩陣運算跟資料移動來最佳化效率與功耗,並且支援 8 bit 浮點運算能力。

而實際在 UL Procyon 的 SDXL FP16 效能測試上,RDNA 4 架構在 FP16 資料格式中,每 CU 的效能比起 RDNA 3 要成長了一倍左右。

而在這次新的 FSR 4 畫質提升技術部分,則是走向了 NVIDIA DLSS 的路線,遊戲開發商會先透過 AMD 的 INSTINCT 加速器進行客製化的機器模型訓練,然後產出 FSR 4 的 AI 畫質提升演算法導入到遊戲中,在執行遊戲時,Radeon RX 9000 系列顯示卡在利用這個模型進行 AI 畫質提升,所以並不會像 FSR 3 或是更早兩代,只要遊戲有支援 FSR,不管是用哪家的顯示卡都可開啟,FSR 4 目前就僅限於 Radeon RX 9000 系列顯示卡才能用。

當然這樣的設計一定會帶來更顯著的效能提升,AMD 官方表示跟原生 4K 解析度設定相比,開啟 FSR 4 的畫質提升與幀間生成功能後,在遊戲中可以獲得 2.1x 到 3.7x 不等的效能提升。

另外在光線追蹤部分,則是以路徑追蹤(Path tracing,下圖)來取代傳統的光線追蹤(上圖),可以渲染出更真實的畫面,但相對的 Pathtracing 需要更大量的運算資源,AMD 也簡單展示了他們路徑追蹤的渲染步驟:
- 像素採樣
- 進行 RESTIR 重採樣與全域照明演算
- 進行神經引擎畫質放大與降噪

而 AMD 表示運用了 RDNA 4 技術的 Radeon RX 9000 系列顯示卡,則是具備了下一代的遊戲與內容創作效能,並且具備更先進的光線追蹤與機器學習放大技術,另外顯示記憶體的容量配置也能支援目前大多數的遊戲與應用需求,加上新的影片編碼與串流能力支援,能提供更多的生產力與媒體製作效能。