
在先前的 Snapdragon X 系列處理器中,較弱的 GPU 效能設計讓高通在遊戲或是顯示效能表現上相較於競爭對手略嫌薄弱,所以在這次高通在推出 Snapdragon X2 Elite/Extreme Edition 處理器的時候,也將 GPU 的效能補強列為重點項目,推出了 Adreno X2 架構,跟前一代相比具備了 2.3 X 的效能提升、支援光線追蹤、可變幀率渲染等功能,並且在高通拿手的效能/功耗比部分提升了 125%。
更多高通 Snapdragon X2 Elite 系列處理器介紹文章請見:
高通 Snapdragon X2 Elite 處理器深度剖析 Part 1 平台架構篇:效能/續航力/AI 功能我全都要!
高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能

這部分的內容由另一位負責技術的資深副總 Eric Demers 上台介紹,跟先前一樣接下來的內容陳拔會用高通提供的簡報畫面來解說,比較清楚。

這次高通的 Adreno X2 GPU 共推出兩個版本,分為 X2-90 跟 X2-85,其中在較高階的兩款 X2E-96-100/X2E-88-100 處理器上採用 X2-90 GPU,中階的 X2E-80-100 則是採用 X2-85 版本,Eric Demers 表示這三款 GPU 基本上採用同樣的架構,只有在時脈設定上略有不同,在以下的簡報中將會以高階的 X2-90 進行解說。

整體來說,新一代的 Adreno X2 GPU 比起上一代效能提升至 2.3X、在電源效率部分提高了 125%,但這並非一蹴可及的成就,Eric Demers 表示,其實高通在上一代 Snapdragon X1 Elite 處理器發表前,就已經在進行 Adreno X2 的開發了,在經歷了兩年的開發時程後,終於推出了具備更高效能,但是晶片面積更小的 Adreno X2 GPU,這也是高通在 GPU 產品線中目前最大且最快的產品。

這次高通在 Adreno X2 中沿用了行動平台 Snapdragon 架構中的切片(Slice)架構,在高階的 X2-90 中採用 4 組切片設計,在 X2-85 部分則是採用了 3 組切片的配置。這個切片架構可以讓高通更具彈性的去配置 GPU,可以依照需求設計出具備 1-4 組、甚至是更多切片的產品。

在每組切片中,高通配置了兩組著色處理器 Shader Processor、ALU 計算單元以及紋理過濾單元,並且具備獨立的兩組前端設計,提供了更具效能的資料處理路徑。另外在圖片裡也可以看到高通採用將光線追蹤單元放在切片裡的設計,以硬體方式加速光線追蹤效能,每組切片中會有兩組光線追蹤單元配置以及對應的後端處理。
至於在 GPU 的記憶體管理部分,高通這次也在每個切片中加入了獨立的 AHPM(Adreno High Performance Memory)高性能記憶體,採用快速的 SRAM 架構,讓 GPU 在進行渲染的時候,優先使用 AHPM 進行處理,超出的部分才會使用主記憶體,每組切片具備 5.25 MB 的 AHPM 配置配,在 4 切片的配置共有 21MB。
而 L2 快取記憶體部分,就如同 Snapdragon X2 Elite 系列處理器的其他元件一樣,在 Adreno X2 GPU 內具備了共享的 L2 快取記憶體,提供了 2MB 的容量設定,並且可讓 GPU 內所有切片共享。另外 Adreno X2 GPU 也採用了 通用頻寬壓縮(Universal Bandwidth Compression)技術,這個技術廣泛的應用在這次 Snapdragon X2 Elite/Extreme Edition 處理器的各處理單元以及記憶體中,資料在送出單元時會進行壓縮,減少傳輸量,而到下一單元收到後再解壓縮,最高可以壓縮到 1/8。而在記憶體介面部分,Adreon X2 GPU 則是提供 228 GB/s 的高速規格,Eric Demers 甚至表示還可以達到更高的 320 GB/s,來對外部的 LPDDR5x-9523 記憶體進行存取。

(點擊可看大圖)接著直接進到效能表現的數據,Eric Demers 表示 Snapdragon X2 Elite Extreme 處理器(X2E-96-100)跟前一代產品相比,平均有 2.3X 的遊戲顯示效能提升,即便在未開啟 Super Resolution 畫質提升技術的狀態下,Snapdragon X2 Elite Extreme 處理器在如《黑神話:悟空》、《電馭叛客 2077》這樣的 3A 遊戲大作中,在 1080p 解析度下中等遊戲畫質設定下,仍有超過 30 fps 以上的顯示幀率。而在競技類遊戲的《Fortnite》堡壘之夜或是《Overwatch 2》鬥陣特工 2 遊戲中,Snapdragon X2 Elite Extreme 處理器可以提供超過 100 fps 的遊戲幀率,跟前一代相比真的提升許多。

(點擊可看大圖)而跟競爭對手相比,對照同樣為整合顯示晶片的 Intel Core Ultra Series 2 處理器(這邊是用 Core Ultra 9 288V 來比較),Snapdragon X2 Elite Extreme 處理器約有 50% 的遊戲效能領先。而跟 AMD 的 Ryzen AI 9 HX 370 處理器相比,Snapdragon X2 Elite Extreme 處理器也有 29% 的遊戲效能領先幅度。
不過跟競爭對手相比,這次高通仍然沒有在 Adreon X2 GPU 設置矩陣運算單元(反而是在 Oryon CPU 裡面有),對於這個等級需要利用 XeSS 或是 DLSS 這類 AI 畫質提升技術來增加遊戲顯示幀率的狀態,(雖然說有支援 AMD 的 FSR 加速功能,但是效果並不明顯),加上大部分遊戲仍要經過編譯器處理,雖然說高通表示大部分遊戲已經可以透過編譯器執行,但整體來說 Snapdragon X2 Elite Extreme 處理器在遊戲效能部分就不免顯得吃虧一些。

至於在高通的強項功耗控制部分,這次 Adreno X2 GPU 在每個切片中加入了 General Purpose Registers(通用目的暫存器,GPR),在運作時會建立一個即時的 GPU 功耗模型,控制 GPU 的電壓以及頻率,並且跟系統層進行溝通,當使用電池電力或是沒有太多工作時,就會進入節能狀態,甚至關閉部分切片的電源來進行省電(像是單純只有更新顯示畫面的靜止狀態)。反應在實際表現上,在 3DMark Time Spy 的顯示效能測試中,在同樣 25W 的功耗設定下比起前一代效能提升了 70%,而在相同的效能表現下,Adreno X2 GPU 所需的功耗則是從先前的 25W 降低至只要 10W,節省了 125% 的功耗。

接著進入更仔細的 GPU 架構說明。Eric Demers 表示這次 Adreno X2 GPU 支援了微軟 DirectX 12.2 Ultimate 裡的 Shader Model 6.8 功能,具備 DirectX 光線追蹤、網格著色、可變幀率渲染以及 Sampler Feedback 等功能。

進入單一 Slice 切片來看,直接講這次的光線追蹤支援部分,Adreno X2 GPU 在每個切片中具備兩組光線追蹤單元(RTU),除了支援微軟的 DXR 1.1 API 外,也支援 Vulkan 的 Ray Pipeline。而 RTU 內部的遍歷樹單元(Tree Traversal Unit)也得到了加速。

在這次 Adreno X2 GPU 架構中另一項特點就是內建了 AHPM 高性能記憶體,可以儲存 QHD+ 解析度的資料加速 GPU 的顯示與 Ai 運算效能。由於 AHPM 是建構在每個切片中,所以相對的頻寬也比外部記憶體要高出許多,可以提供給著色處理器高達 4 TB/s 的頻寬,這也讓每個切片減少了對外存取資料所需要的記憶體頻寬,最高可以減少 40%,也由於減少了資料搬運的頻率,相對的也降低了資料傳輸過程中所產生的功耗。

另外這次 Adreno X2 GPU 也具備更快的幾何處理能力,可以更頻繁的處理大量的小型幾何圖形要求,比起先前要快了 4 倍左右,並且因為每個切片都具備幾何處理能力,所以在處理時可以工作均勻分配給各個切片,獲得更好的性能表現。

在工作排程部分,怎麼最大化 GPU 的利用率成為提升 GPU 效能的最大關鍵,在這部分 Adreno X2 GPU 透過增加更小呼叫的方式來處理,並且透過增加 GPRs 微架構至 128 KB 的方式(前一代是 96 KB)來處理更多或是更複雜的波。

至於在 GPGPU 效能的部分,這次則是除了具備 32 位元的 ALU 外,也加入了 16 位元 ALU 的配置,提供了兩倍的數量以及執行速度。另外在 AI 的支援部分,也原生支援了 Windows Copilot runtime(WCR,可支援 ML/DML 機器學習)、 BF16 資料格式、本地記憶體廣播以及通用隨機播放的設計,可以更有效率的利用 GPU 內的各個執行緒進行處理。

至於在軟體層面,Eric Demers 表示過去一年他們對 Snapdragon X1 處理器的支援(包括編譯器以及驅動程式)做得相當好,基本上是以一季更新一次的頻率進行推進,不過高通內部則是設定了每個月都會發布更新的目標,並且正在朝向這個目標努力中。而在 Snapdragon X2 Elite 處理器部分,目標則是在明年上半年上市時,可以支援的應用程式能超過 90%。(Eric Demers 也說這個目標已經比現在要好很多了),另外針對 Vulcan 跟 DX9 的部分也會推出新的驅動程式,並且原生支援 OpenCL 3.0。

另外在遊戲玩家關心的反作弊系統的支援上,Eric Demers 表示預計將會支援各大主流遊戲平台的反作弊引擎,以解決目前 Snapdragon X1 在這部分所遇到的問題。

(點擊可看大圖)最後再來回顧一下這次 Adreno X2 GPU 的特色,包括採用獨特的切片設計架構,
比起上一代提升 2.3X 的顯示效能、支援微軟 DXR 1.1/Vulkan Ray Pipeline 的光線追蹤功能以及原生支援 DirectX 12.2 API 等等。
接著陳拔還會針對這次 Snapdragon X2 Elite/Extreme Edition 裡的 Hexagon NPU 以及電源管理設計進行介紹,請大家持續看下去囉。




























































































