Intel 攜手 AMD 發佈 ACE 架構提升 AI 性能,x86 矩陣計算密度提升 16 倍

報導稱英特爾和 AMD 聯合發佈人工智慧計算擴展(ACE)白皮書,將其定位為 x86 架構的標準矩陣加速方案。

現有 AVX10 等 SIMD 擴展雖能處理矩陣運算,但在計算密度與擴展性上存在侷限,ACE 正是為突破這一瓶頸而生。

ACE 作為 x86 指令集的關鍵擴展,核心目標是大幅提升矩陣乘法性能、擴展性與能效。矩陣乘法作為神經網路與大語言模型的核心計算模組,其效率直接決定 AI 工作負載的表現。

技術層面,ACE 引入基於外積運算(outer product operation)的矩陣加速機制,無縫整合 AVX10。白皮書資料顯示,在消耗相同數量輸入向量的前提下,ACE 外積運算的計算密度比等效的 AVX10 乘加運算(multiply-accumulate operation)高出 16 倍。

ACE 在底層計算方面,支援 INT8、OCP FP8、BF16 等主流 AI 資料格式,其設計兼顧靈活性與擴展性,旨在建構覆蓋筆記型電腦到超級電腦的全場景矩陣加速框架。

在軟體生態方面,ACE 整合低精度 GEMM 等深度學習和高性能計算庫,並啟動適配 NumPy、SciPy 等 Python 庫以及 PyTorch、TensorFlow 等主流機器學習框架。


Intel 攜手 AMD 發佈 ACE 架構提升 AI 性能,x86 矩陣計算密度提升 16 倍
阿鬼 你要不要考慮講中文?
就Intel搞得爛攤子 變成X86的鍋
蘇嬤沒辦法 現在一起下場收

故事的開始就是AVX512
本來你X86架構要發展AVX512你就好好做
結果Intel一代支援 一代不支援
一代大核支援 小核不支援
一代又是大小核通通不支援
搞得非常破碎化
AMD就是從 Zen4開始支援
Zen5就持續支援下去 Zen6也還是會繼續支援
如果Intel也這樣從某代做了之後也持續做就根本沒事
結果他搞得亂七八糟
11代做下去
12代要塞小核心 小核心放不下
為了軟體相容性 大核心就算有你也不能用
開了過熱 那就先關掉
這就造成軟體開發非常痛苦

AMD從 Zen 4架構開始全面原生支援 AVX-512
這使得在當前主流桌機平台上
若需要跑 AVX-512 特定的模擬器或科學運算
反而是 AMD 陣營具備硬體優勢

Intel 急需推出AVX10
打破消費級無法跑高階AVX的問題
總之你就把AVX10想像成經過重新包裝
模組化且支援大小核的AVX-512

因為他的設計上是遇到只有AVX2的核心
會模組化的處理分拆成AVX256兩組來做的
也就解決小核心只有AVX256的問題
kkcity59
CFD不用遊戲GPU是NV把FP64單元幾乎砍光的關係,即使這樣廠商還是鼓勵你用GPU,很多場景單精度已經足夠了,越多平台能用它越可以賣更多種授權。Ansys就用H100跟Ada6000比較過。
kkcity59
而且像他的Fluent就單精度跟倍精度可選。當然跑CFD還有記憶體容量的問題。
只要软件跟的上。 e核靠avx10 ,p核有amx 基本把amd能走的路都全堵了 。
kkcity59
轉成兩組AVX256然後還在小核心上執行效能非常低 但為了不當機還是得要這樣做 因為Intel的大小核心微碼不一致程式遷移困難 AMD的C版處理器則是維持完整核心只砍快取 沒這個問題
andrewchu
看amd怎麼打臉https://www.amd.com/zh-tw/products/processors/server/epyc/switch-to-epyc.html
kkcity59 wrote:
就Intel搞得爛攤子 變成X86的鍋
蘇嬤沒辦法 現在一起下場收

+1

因為X86專利,多數是Intel持有,或者跟AMD共同持有,又或者交互授權

AMD想要做啥X86平台的衍生架構

要嘛打官司把Intel打死!自己搞!

要嘛拉著Intel共同發展!不用打官司內耗

目前看來兩家都耗不起

只能聯合一起搞

你說是合作,其實是迫於無奈
David-Kuo wrote:
+1因為X86專利,...(恕刪)


X86只是微碼 只是一種功能載體
微碼就好像倉頡造字的字形跟意義
你們以後用倉頡創的文字寫的文章
不管內容為何物
全都要付給倉頡版權費
所以微碼能不能算專利都曾經有過爭議
X86-64全都是AMD制定的
他就直接跟Intel做了授權交換

換言之制定微碼的技術含金量沒那麼高
但是要讓微碼普及則是大工程
讓X86微碼普及的大功臣叫做IBM跟微軟
他們反而完全沒有因為微碼得到好處
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!