AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
AMD 在 2 月 28 日晚上發表了新一代的 RDNA 4 架構以及 Radeon RX 9070 系列顯示卡,在看過了官方的發表與介紹後(請見:【採訪】AMD 發表新一代 Radeon RX 9070 XT/9070 顯示卡 加入 FSR 4 技術提升畫質 高階版本還比對手便宜),接著來看這次 RDNA 4 顯示架構的深度介紹,

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
這次 RDNA 4 架構的比較新的亮點,包括針對高階遊戲重負載進行最佳化、提高光柵化與運算效率、顯著的光線追蹤效能提升、高性能的綜合機器學習支援、顯示頻寬的增加以及多媒體效能的提升。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
首先來看整體架構的部分,目標就是針對 4K 解析度的遊戲顯示效能所設計,採用第三代的光線追蹤單元、最佳化的快取系統設計、改良的命令處理器、第三代矩陣加速單元、Radiance 顯示引擎、GDDR6 記憶體、最佳化架構配置,另外這次還加入了兩組媒體引擎設計,提供更好的媒體編碼/解碼效能。(點擊可看大圖)

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
在這次新增的媒體引擎部分,主要針對遊戲串流與錄製的效能進行增強,主要在直播主較常用的低碼率格式部分提供更低的延遲以及更高的畫面品質,在 H.264 部分提高了 25% 的畫質表現,在 HEVC 編碼格式提供了 11% 能源效率提升、而在 720p 解析度部分提供了 30% 以上的編碼效能成長。

另外在格式支援度部分,除了針對 FFMPEG、OBS、Handbrake 軟體進行最佳化外,也透過 VCN 低功耗影片回放,提高 AV1/VP9 影片格式 50% 的效能提升,並且減少記憶體的寫入需求。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能在畫面顯示體驗部分,RDNA 4 針對 FreeSync 抗撕裂技術提供功耗最佳化的設定,可以在 連接 2 具顯示器的設定下降低螢幕待機時所需的功耗表現。另外透過硬體 Flip Queue 的支援,來減少 GPU 的顯示幀率負載,也節省 CPU 在播放影片時的功耗。Radeon Image Sharpening 2 技術則是可跨 API 來提升高品質的畫面表現。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能在 RDNA 4 架構中的 CU 運算單元部分,這次 AMD 做出了相當多的改變,包括兩組 SIMD 向量單元、增強的媒體運算器、升級的純量單元、排序器的升級,另外在光線追蹤加速器部分也做了相當大的改版。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
而 AMD 在這次簡報中表示,遊戲畫面表現的進步速度越來越快,從傳統的光柵化設計、光線追蹤/神經網路升頻/幾何細節提升、到路徑追蹤全域光照/神經網路模擬等,提供更逼真的畫面,而 AMD 也表示光線追蹤功能在未來的大多數遊戲中將會成為不可或缺的要素,AMD 目前也正在致力於路徑追蹤技術的最佳化,並且將會應用到部分遊戲中。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
所以在這次 RDNA 4 架構中,光線追蹤加速器也是相當大的升級重點,改為 8 組方形/2 組三角形的配置,比起上一代增加一倍,另外在 BVH 結構跟走訪(Traversal)效能上也透過新的節點與定向包圍盒(Oriented Bounding-Box,OBB)設計來降低 BHV 記憶體用量、減少延遲以及錯誤相交的產生,另外透過動態 VGPR 管理來增加渲染效率。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
其中又以導入定向包圍盒(Oriented Bounding-Box,OBB)設計為最大的改變重點,在傳統的 BVH 包圍設計中因為幾何不對齊的緣故,導致產生大量內部為空的錯誤盒,增加無效相交的數量,而 AMD 的解法是每個盒節點中允許一個特定的定向來對齊,來減少無效相交的數量,進而增加整體效能。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
另外在記憶體部分 AMD 表示他們發現光線追蹤負載對於記憶體的延遲相當敏感,所以在 RDNA 4 架構中加入了亂序記憶體設計,可以讓渲染器有效地忽略某些比較高延遲的要求,來增加較多負載時的效能表現。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
而在導入上述設計後,RDNA 4 的運算單元 (CU)可以獲得兩倍的光線走訪(Traversal)效能表現。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
至於在渲染器的部分,則是導入了動態寄存器(Dynamic Registers)的概念,在 RDNA 4 渲染器中提供了動態分配寄存器的選項,透過軟體分配寄存器來達到更有效率的資源分配。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
在 AI 部分,RDNA 4 架構也透過增強的 WMMA(Wave Matrix Multiply Accumulate)運作,緊密結合矩陣運算跟資料移動來最佳化效率與功耗,並且支援 8 bit 浮點運算能力。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
而實際在 UL Procyon 的 SDXL FP16 效能測試上,RDNA 4 架構在 FP16 資料格式中,每 CU 的效能比起 RDNA 3 要成長了一倍左右。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
而在這次新的 FSR 4 畫質提升技術部分,則是走向了 NVIDIA DLSS 的路線,遊戲開發商會先透過 AMD 的 INSTINCT 加速器進行客製化的機器模型訓練,然後產出 FSR 4 的 AI 畫質提升演算法導入到遊戲中,在執行遊戲時,Radeon RX 9000 系列顯示卡在利用這個模型進行 AI 畫質提升,所以並不會像 FSR 3 或是更早兩代,只要遊戲有支援 FSR,不管是用哪家的顯示卡都可開啟,FSR 4 目前就僅限於 Radeon RX 9000 系列顯示卡才能用。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
當然這樣的設計一定會帶來更顯著的效能提升,AMD 官方表示跟原生 4K 解析度設定相比,開啟 FSR 4 的畫質提升與幀間生成功能後,在遊戲中可以獲得 2.1x 到 3.7x 不等的效能提升。

AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
另外在光線追蹤部分,則是以路徑追蹤(Path tracing,下圖)來取代傳統的光線追蹤(上圖),可以渲染出更真實的畫面,但相對的 Pathtracing 需要更大量的運算資源,AMD 也簡單展示了他們路徑追蹤的渲染步驟:

像素採樣
AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
進行 RESTIR 重採樣與全域照明演算
AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
進行神經引擎畫質放大與降噪
AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能



AMD RDNA 4 顯示架構解析 以光柵最佳化/路徑追蹤/機器學習設計提供更高遊戲與創作效能
而 AMD 表示運用了 RDNA 4 技術的 Radeon RX 9000 系列顯示卡,則是具備了下一代的遊戲與內容創作效能,並且具備更先進的光線追蹤與機器學習放大技術,另外顯示記憶體的容量配置也能支援目前大多數的遊戲與應用需求,加上新的影片編碼與串流能力支援,能提供更多的生產力與媒體製作效能。
畫質放大跟降躁也太強了吧
不知道實際上應用效果如何?
希望這次的效能可以一次到位
出貨的量也可以足一些
聽說代理商初期沒太大供貨意願🤔
plue2100
rollover Tom's Hardware求證了,MSI整代RNDA4 9000系都不會出,當然未來也不會有絕對,不過基於吃瓜群眾心理,俺還蠻想知道動機 [沒圖沒真相]
plue2100
我就是愛拍照 別帶著偏好看事情喔,AMD旗艦X870E/X870晶片組,MSI主機板只比華碩少一款,但華碩是WIFI/沒WIFI型號再切分,華碩實際型號反而還比微星少 [幫不了你]
這FSR 4感覺畫質提升蠻有感的
A辣愛怕跑
GOOD~5
陳拔 wrote:
而在這次新的 FSR 4 畫質提升技術部分,則是走向了 NVIDIA DLSS 的路線,遊戲開發商會先透過 AMD 的 INSTINCT 加速器進行客製化的機器模型訓練,然後產出 FSR 4 的 AI 畫質提升演算法導入到遊戲中,在執行遊戲時,Radeon RX 9000 系列顯示卡在利用這個模型進行 AI 畫質提升

所以到底是通用好還是客製化好,NVIDIA 會不會回到客製化模型呢?

陳拔 wrote:
在 H.264 部分提高了 25% 的畫質表現,在 HEVC 編碼格式提供了 11% 能源效率提升、而在 720p 解析度部分提供了 30% 以上的編碼效能成長。

這是多年來首度有提升,下面是之前的樣子

雖然單位不同,但是 25% 提升夠嗎?
我就是愛拍照
請問一下,這個圖的bitrate 怎麼是愈小愈好?不是應該是愈大愈好嗎?
85683213
大了還要編碼幹嘛...同畫質當然是越小越好
研究了一下文章 覺得非常的不錯 很優秀
> 遊戲開發商會先透過 AMD 的 INSTINCT 加速器進行客製化的機器模型訓練,然後產出 FSR 4 的 AI 畫質提升演算法導入到遊戲中

所以 AMD FSR 以後也不是通用的了?
陳拔
FSR 4 就是 RDNA4 專用了,其他架構就是用 FSR 3 跟以前的版本囉
雖然看不懂什麼意思,但好像有點意思
看了介紹好像效能提升不少~
陳拔 wrote:
AMD 在 2 月 28...(恕刪)


有兩家競爭是好的~
選舉
希望可買到便宜的二手顯卡
關閉廣告
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!