新一版 3D V-Cache 技術登場!AMD 正研發堆疊 L2 快取技術 提供更快指令集運算速度

新一版 3D V-Cache 技術登場!AMD 正研發堆疊 L2 快取技術 提供更快指令集運算速度
AMD 3D V-Cache 技術示意圖。

在將 L3 快取記憶體以 3D V-Cache 堆疊技術提高處理器效能後(以市場反應來說這招的確有用),AMD 這次打算更進一步的要朝 L2 快取記憶體下手了,根據 AMD 最新向 USPTO 美國專利辦公室提出的申請來看,AMD 打算將 L2 快取記憶體以類似的堆疊技術加大容量,由於 L2 快取距離處理器核心運算單元更近,相對來說可以透過縮短指令週期、加大 L2 記憶體頻寬來提高處理器效能。

新一版 3D V-Cache 技術登場!AMD 正研發堆疊 L2 快取技術 提供更快指令集運算速度
AMD 向 USPTO 提出專利申請的解說圖之一,可以看到除了原本與處理器核心搭配的 L2 快取記憶體外,在上方還加入了一個 L2 Die,以堆疊的方式增加 L2 快取的大小。

新一版 3D V-Cache 技術登場!AMD 正研發堆疊 L2 快取技術 提供更快指令集運算速度
而跟現有的 L3 堆疊快取合併的設計中,可以看到 L2 快取晶粒會跟 L2 快取晶粒在不同的連接通道上,利用 「混合鍵合」(Hybrid Bonding)技術來跟 Base Die 連接。

新一版 3D V-Cache 技術登場!AMD 正研發堆疊 L2 快取技術 提供更快指令集運算速度
更詳細的連接示意圖。

而將 L2 快取容量加大的好處在於能顯著提高了「快取命中率」(Cache Hit Rate)(畢竟容量就是加大了),減少處理器再去存取較慢 L3 快取記憶體的次數,有效的縮短核心運算時的指令週期,另外對於 AI 運算來說,透過加大 L2 記憶體的設計也能夠減緩對記憶體頻寬的需求。

不過相對的因為 L2 快取記憶體距離處理器核心更近,所以在散熱跟電路設計上更加要求,而堆疊的 L2 快取記憶體相比原生 L2 來說訊號傳輸的距離更長,要如何解決延遲問題也是相當大的挑戰。

雖然說目前 AMD 官方並未表示這項技術會應用/首發在哪一款處理器上,但是以目前的進度來看,可能要到 Zen 6 以後的架構才會看到(或是不會看到)應用這項技術的產品出現,如果真的實現的話,那麼對於 AMD 在產品架構上又提供了更強大的優勢。
感謝分享&介紹,新技術感覺有利害
新的校能提升不少~
選舉
不好說 有時候效能只有增加一些些 不過價格高蠻多的
陳拔 wrote:
相對的因為 L2 快取記憶體距離處理器核心更近,所以在散熱跟電路設計上更加要求,而堆疊的 L2 快取記憶體相比原生 L2 來說訊號傳輸的距離更長,要如何解決延遲問題也是相當大的挑戰。

這也注定了比較難全面普及,應該可能是高階產品吧?
這個成本不知道會墊高多少…不過還是期待
產品如果沒有順勢加價賣那就是一個好的技術
chanp
成本墊高,順勢加價
很強悍
看起來很強大 非常的讓人期待
感覺還不如期待台積電最新的製程加上新開發的記憶體封裝等技術

現在這世代

有誰說能做的比台積電更好?

這你信?
willypipi
對AMD來說 專利重點在於如何布置導熱用的矽穿孔 如何讓電源線穿透時不要影響訊號等設計 Intel如果也玩疊疊樂本身不會踩專利 但是面對同樣問題的解決方案有可能會踩
chanp
矽穿孔TSV為電氣連接。積熱問題已藉改變堆疊方式解決:ZEN3/4在CCD建構TSV,將3D V-Cache堆疊在其上。Zen 5改成在3D V-Cache建構TSV,再將CCD堆疊在其上。
陳拔 wrote:
AMD 3D...(恕刪)
不過相對的因為 L2 快取記憶體距離處理器核心更近,所以在散熱跟電路設計上更加要求,而堆疊的 L2 快取記憶體相比原生 L2 來說訊號傳輸的距離更長,要如何解決延遲問題也是相當大的挑戰。

雖然說目前 AMD 官方並未表示這項技術會應用/首發在哪一款處理器上,但是以目前的進度來看,可能要到 Zen 6 以後的架構才會看到(或是不會看到)應用這項技術的產品出現,如果真的實現的話,那麼對於 AMD 在產品架構上又提供了更強大的優勢。

等到上市大概要很久

幫補
論文中以 1 MB 與 2 MB 的平面式 L2 快取作為比較基準。傳統平面式 1 MB L2M 快取的典型延遲約為 14 個時脈週期,而採用堆疊設計的 1 MB L2M 快取,延遲則可降低至 12 個時脈週期。

中央佈線設計,帶來延遲與功耗優勢
AMD 指出,透過將連接用的矽穿孔集中設置於堆疊快取系統的中央,可在存取堆疊快取時降低回應延遲,並同時達到節能效果。與傳統平面式快取需額外佈線(亦稱為管線階段)將資料從 I/O 傳送至較遠區域不同,該設計避免了額外的佈線階段。

由於資料進出距離縮短,堆疊快取的兩側能達成延遲平衡(或相同延遲)。相較於平面式 1 MB L2M 快取的 14 個週期延遲,堆疊設計可降至 12 個週期,讓更大容量的快取仍能維持甚至優於傳統的延遲表現。

此外,由於存取週期縮短,快取單元啟用時間減少,也能更快從運作狀態切換至閒置狀態,進一步降低功耗。加上佈線更短、電容更低、訊號負載減少,整體發熱量也隨之下降。
等到我要換電腦時,應該更強大
關閉廣告
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!