高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
高通 Snapdragon X2 Elite/Extreme Edition 處理器。

在看完了對於整體平台的介紹後,接著就進行個別核心的架構與性能介紹,首先來看 Oryon CPU 的部分。

更多高通 Snapdragon X2 Elite 系列處理器介紹文章請見:

高通 Snapdragon X2 Elite 處理器深度剖析 Part 1 平台架構篇:效能/續航力/AI 功能我全都要!
高通 Snapdragon X2 Elite 處理器深度剖析 Part 3 Adreno X2 GPU 篇:顯示效能提升 2.3X 支援性更加完整

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
這部分由另一位高通資深副總 Pradeep Kanapathipillai 上台講解。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
這次高通 Snapdragon X2 Elite/Extreme Edition 處理器採用第三代 Oryon CPU架構,主要的設計目標就是要兼顧效能與電源效率,跟先前的單一核心架構相比,第三代 Oryon CPU 採用 Prime 跟 Performance 兩款異質核心組成,來達到上面所說的兼顧效能與電源效率的表現。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
(點擊可看大圖)在這次高通 Snapdragon X2 Elite/Extreme Edition 處理器的 SOC 中提供了最高三組 CPU 叢集(X2E-96-100/X2E-88-100)/兩組 CPU 叢集(X2E-80-100)的配置,分為 Prime 叢集跟 Performance 叢集(X2E-96-100/X2E-88-100 為 2 組 Prime +1 組 Performace、X2E-80-100 為 1 組 Prime + 1 組 Performance),不過在簡報中都會是以最高階的 Extreme Edition 處理器(三組 CPU 叢集,2 組 Prime +1 組 Performace)配置來介紹。

而在個別叢集的配置部分,Prime 叢集採用 6 核心配置,具備共享的 16 MB L2 快取、高通矩陣引擎,增強的分支預測、載入儲存、預取設計等。而在 Performance 叢集部分也一樣為 6 核心配置,共享 12 MB 的 L2 快取記憶體,也一樣具備高通矩陣引擎,並且針對功耗以及效能進行最佳化。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
首先來看 Prime 叢集的部分,這是針對峰值效能所設計,主要都會在較高的時脈上進行運作,基礎時脈為 4.4 GHz、加速時脈則是 5.0 GHz。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
接著進到單一的 Prime 核心來看,依照不同的指令程序區分成不同的處理區塊。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
首先在指令提取跟解碼的部分,這部分 Prime 核心具備了 9 Wide 的解碼器設計,透過更有效率的預取指令設計來提高效能,另外也透過較大的 L1 快取來提高指令的傳輸效率。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
另外在暫存器部分,除了跟解碼器搭配採用 9 Wide 的配置外,也將不同執行單元的暫存器實體隔離,讓整數、向量單元都具備獨立的暫存空間。另外這次也加入了檢查點(check point)的設計,來重新整理錯誤的指令狀態,提高整體的指令效率。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
在整數執行器的部分,採用 6 Wide 64 bit 管線設計,在每個週期中可進行 6 ALU μops 微操作,提高整體的運算頻率。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
在向量/浮點執行單元中,則是採用 4 Wide 的 128 bit 向量管線,每條管線每週期最高可提供 4x FP32/INT32 的運算能力,而在這次的高通 Snapdragon X2 Elite/Extreme Edition 處理器中,還加入了 BF16 資料格式的支援。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
在載入/儲存指令(Load/Store instructions)部分,則是透過大型的 L1 快取、可支援不同組合指令,更快速管線設計(每個週期可提供 4 次 load-store 運算)以及與更大型的 L2 快取貼近來提高指令運算效率。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
在記憶體管理單元部分,則是透過兩級式的 TLB 提供更好的最佳化設計。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
接著進入到叢集中的 L2 共用快取部分,在每個 Prime 核心叢集具備 16MB 的 L2 快取,快取的運作頻率跟核心是相同的,來確保整體處理器的運作效率,也針對 L2 快取的延遲進行最佳化設計,平均降低至 21 個週期。也因為這個 L2 快取是設計在叢集內部,所以除了 Prime 核心外,也提供給高通矩陣引擎以及 Fabric 使用,所以在這部分高通也做了一些特殊設計,來確保快取使用的分配效率。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
既然提到了高通矩陣引擎(Qualcomm Matrix Engine,QMX),那就來看看這個部分,內部由 64 x 64 的矩陣組成一個 Numeric element,然後以 8x8 跟 4x8 Numeric element 的配置組成網格,可以提供 CPU 矩陣以及 ML 加速的效能。不過這個矩陣引擎在硬體上是獨立在 CPU 叢集之外的,所以在電源/時脈控制上可以跟 CPU 分開運作,來降低運作時的相互影響。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
在安全性的設計部分,在 Prime 叢集部分也使用了 Trustzone 安全架構,從硬體端提供防護設計,並且透過軟體設計來對記憶體進行隔離防護。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
(點擊可看大圖)回到實際的效能表現,Pradeep Kanapathipillai 表示在 Prime 核心部分,在同樣的功耗設定下比起前一代效能提升了 39%,而在同樣的效能設定下,功耗則是將低了 43%,不管從哪個層面上來看都相當顯著,不過這部分並沒有說明是 IPC 的效能提升還是透過高速時脈所達成的效能提升。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
接著來看 Performance 核心的部分(取這個名字陳拔一直都會跟 Intel 的 P 核搞混),但是在高通 Snapdragon X2 Elite/Extreme Edition 處理器中的 Performance 核心設計則是著重在效能與功耗的平衡設定上,主要負責需要持續運作的負載工作,並且降低運作時的功耗。另外跟 Prime 叢集一樣,高通也利用 6 個 Performance 核心組成一個叢集,基礎頻率為 3.6 GHz,搭配 12 MB 的共享 L2 快取,並且同樣具備 QMX 高通矩陣引擎。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
而 Performance 核心設計也跟 Prime 核心類似,但是在架構上以較少的管線、執行窗以及減少快取大小來降低功耗,設定是以 2W 的低功耗提供更好的能效比,並且減少 Die Size。

高通 Snapdragon X2 Elite 處理器深度剖析 Part 2 Oryon CPU 篇:以更高時脈/更多核心數堆疊性能
(點擊可看大圖)最後來看整體第三代 Oryon CPU 的重點概要,主要是在 Prime Core 部分提供更快的效能,並且加入了 QMX 高通矩陣引擎來加速 CPU 在 AI 運算時的效能,另外也將 L2 快取加大到 44MB來降低延遲。
細節實在是太期待了
想看看高通如何靠更高時脈與更多核心堆出實際性能
期待
感謝分享&介紹,高通 Snapdragon X2 Elite 讚的啦
期待實際的產品上市?
不知道實測會怎麼樣
新一代核心數都堆到18核心了,效能明顯進步不少,售價不知道會提高多少?

期待品牌廠可以設計得更輕薄+高續航力,目前WoA筆電還是有進步的空間。

等看明年X2 Elite & Panther Lake & Gorgon Point & M5的正面對決了。
雖然看不懂但感覺很厲害
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!