Intel 攜手 AMD 發佈 ACE 架構提升 AI 性能,x86 矩陣計算密度提升 16 倍

報導稱英特爾和 AMD 聯合發佈人工智慧計算擴展(ACE)白皮書,將其定位為 x86 架構的標準矩陣加速方案。

現有 AVX10 等 SIMD 擴展雖能處理矩陣運算,但在計算密度與擴展性上存在侷限,ACE 正是為突破這一瓶頸而生。

ACE 作為 x86 指令集的關鍵擴展,核心目標是大幅提升矩陣乘法性能、擴展性與能效。矩陣乘法作為神經網路與大語言模型的核心計算模組,其效率直接決定 AI 工作負載的表現。

技術層面,ACE 引入基於外積運算(outer product operation)的矩陣加速機制,無縫整合 AVX10。白皮書資料顯示,在消耗相同數量輸入向量的前提下,ACE 外積運算的計算密度比等效的 AVX10 乘加運算(multiply-accumulate operation)高出 16 倍。

ACE 在底層計算方面,支援 INT8、OCP FP8、BF16 等主流 AI 資料格式,其設計兼顧靈活性與擴展性,旨在建構覆蓋筆記型電腦到超級電腦的全場景矩陣加速框架。

在軟體生態方面,ACE 整合低精度 GEMM 等深度學習和高性能計算庫,並啟動適配 NumPy、SciPy 等 Python 庫以及 PyTorch、TensorFlow 等主流機器學習框架。


Intel 攜手 AMD 發佈 ACE 架構提升 AI 性能,x86 矩陣計算密度提升 16 倍
阿鬼 你要不要考慮講中文?
就Intel搞得爛攤子 變成X86的鍋
蘇嬤沒辦法 現在一起下場收

故事的開始就是AVX512
本來你X86架構要發展AVX512你就好好做
結果Intel一代支援 一代不支援
一代大核支援 小核不支援
一代又是大小核通通不支援
搞得非常破碎化
AMD就是從 Zen4開始支援
Zen5就持續支援下去 Zen6也還是會繼續支援
如果Intel也這樣從某代做了之後也持續做就根本沒事
結果他搞得亂七八糟
11代做下去
12代要塞小核心 小核心放不下
為了軟體相容性 大核心就算有你也不能用
開了過熱 那就先關掉
這就造成軟體開發非常痛苦

AMD從 Zen 4架構開始全面原生支援 AVX-512
這使得在當前主流桌機平台上
若需要跑 AVX-512 特定的模擬器或科學運算
反而是 AMD 陣營具備硬體優勢

Intel 急需推出AVX10
打破消費級無法跑高階AVX的問題
總之你就把AVX10想像成經過重新包裝
模組化且支援大小核的AVX-512

因為他的設計上是遇到只有AVX2的核心
會模組化的處理分拆成AVX256兩組來做的
也就解決小核心只有AVX256的問題
kkcity59
OS層級原本要設計出處理指令不對齊的問題也可以 只是效能會非常非常低落 所以目前的設計處理器對外所有的核心指令一定要對齊 不對齊OS沒有處理就是當機 也就是由外部看起來大核心小核心都是一樣的意思
wonderzero2
x86有AVX-512 好處是讓程式員方便調用讓程式員 更懶。avx512 其實是gpu的功能
只要软件跟的上。 e核靠avx10 ,p核有amx 基本把amd能走的路都全堵了 。
kkcity59
轉成兩組AVX256然後還在小核心上執行效能非常低 但為了不當機還是得要這樣做 因為Intel的大小核心微碼不一致程式遷移困難 AMD的C版處理器則是維持完整核心只砍快取 沒這個問題
andrewchu
看amd怎麼打臉https://www.amd.com/zh-tw/products/processors/server/epyc/switch-to-epyc.html
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!