https://www.techbang.com/posts/85890-nvidia-gtc21-gtc

NVIDIA創辦人暨執行長黃仁勳於GTC21(GPU技術大會)開幕演說中發表了Grace處理器與多項軟、硬體產品,全面深化AI應用。

Nvidia 自家CPU發表,效能海放x86
▲ GTC21開幕演說以直播影片的方式進行,影片仍於老黃自家拍攝。




專為AI超級運算設計的Grace處理器
Grace是NVIDIA專為AI運算與高效能運算(HPC)所設計的Arm架構處理器,它以美國程式設計先驅葛麗絲•穆雷•霍普(Grace Murray Hopper)為名,並可協同繪圖處理器(GPU)與資料處理器(DPU)等運算單元共同運作。根據NVIDIA的官方說明,搭載Grace處理器與GPU的系統能帶來10倍於x86架構處理器NVIDIA DGX系統的效能。

Grace處理器的開發目標在於滿足自然語言處理、推薦模型、AI超級運算等需求,由於這些應用必須分析龐大的資料集,因此其最大的改進就是提升系統主記憶體與繪圖處理器(GPU)之間的頻寬。

以NVIDIA DGX運算平台為例,每個Ampere繪圖處理器具有頻寬為2TB/s的80 GB HBM2e記憶體,整合4個Ampere繪圖處理器就能組成頻寬達8 TB/s的320GB顯示記憶體,相較之下系統的主記憶體容量雖然大了3倍共有1TB,但與處理器之間的頻寬卻只有200GB/s,速度慢了40倍之譜,而透過PCIe介面連接處理器與繪圖處理器,頻寬也只有64GB/s。

然而目前的x86架構處理器皆不支援NVIDIA的NVLINK高速匯流排技術,且PCIe的頻寬也不夠使用,因此NVIDIA打造了專為自家AI運算平台最佳化設計的Arm架構處理器,並著重於提升系統主記憶體與繪圖處理器之間的頻寬。

Grace將繪圖處理器與主記憶體的頻寬提升至2TB/s,並透過第4代NVLink匯流排技術,能提供處理器與繪圖處理器之間高達900 GB/s的資料傳輸速度,與當今技術領先的伺服器相比,聚集頻寬增益達30倍。Grace也將採用LPDDR5x記憶體子系統,與目前的DDR4記憶體相比,能夠提供2倍的頻寬以及10倍的能源效率。此外全新的架構利用單一記憶體位址空間,提供統一的快取記憶體一致性,能夠整合系統主記憶體與繪圖處理器上的HBM高頻寬記憶體,簡化程式開發流程,讓使用者能將有效率地應用節點中總共1,320GB的記憶體總量,提升AI模型訓練的效能。

其成果是能讓單顆處理器提供300分以上的SPECint效能成績,在具有8組繪圖處理器的DGX系統上,將能帶來超過2,400分的SPECint總分。相較之下,身為目前世界上效能最高的電腦,當代DGX僅能跑出450分的成績,可見其效能成長相當顯著。

值得一提的是,瑞士國家超級計算中心(Swiss National Supercomputing Centre,CSCS)與美國能源局的洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory),都將採用由Hewlett Packard Enterprise(HPE)打造、採用Grace處理器的超級電腦,可見其應用潛力已經獲得頂尖研究機構的肯定。

Nvidia 自家CPU發表,效能海放x86
▲ NVIDIA Grace是專為高效能運算設計的Arm架構處理器。

Nvidia 自家CPU發表,效能海放x86
▲ 在由x86架構處理器的伺服器中,系統主記憶體與繪圖處理器之間的頻寬只有0.2TB/s。

Nvidia 自家CPU發表,效能海放x86
▲ Grace處理器一改這個情況,將提繪圖處理器與主記憶體之間的頻寬提升至2TB/s,將可帶來顯著的AI效能成長。

Nvidia 自家CPU發表,效能海放x86
▲ 瑞士國家超級計算中心將採用Grace處理器搭配GPU打造Alps超級電腦,預計於2023年上線服務。(圖為概念示意圖)

向Tick-Tock策略制敬?
Tick-Tock是Intel於2007年提出的處理器開發戰略模式,第1年將推出新架構、第2年將推出新製程,如此交錯重複進行。

黃仁勳於GTC21開幕演提到,目前NVIDIA資料中心的發展藍圖將由處理器、繪圖處理器、資料處理器(即CPU、GPU、DPU)等不同類型的運算單元構成,每種晶片都有2年的研磨改進周期,其中1年專注於x86平台,另1年專注於Arm平台,讓每年都有讓人振奮的產品於不同平台推出,以滿足不同差異化市場與客戶的需求。

另一方面,Grace處理器除了應用於資料中心與超級電腦之外,也將搭載於至預計於2025年推出的DRIVE Atlan車用SoC。DRIVE Atlan將採用Grace處理器,搭配NVIDIA次世代繪圖處理器,除了整合AI、軟體、網路、安全等功能,也能提供超過1,000TOPS的運算效能,大幅提升自動駕駛車的AI運算能力,並透過安全的無線更新升級(OTA),打造具有豐富可程式化能力的軟體定義車輛。

Nvidia 自家CPU發表,效能海放x86
▲ NVIDIA資料中心的發展將有處理器、繪圖處理器、資料處理器等不同運算單元交互推出。


Nvidia 自家CPU發表,效能海放x86
▲ 預計於2022年出廠的DRIVE Orin車用SoC將具有254TOPS運算效能,遠高於目前DRIVE Xavier的30TOPS。


Nvidia 自家CPU發表,效能海放x86
▲ 預計於2025年推出的DRIVE Atlan將採用Grace處理器並提供超過1,000 TOPS的運算效能。
請問N家的CPU能執行Win10作業系統嗎?
可以的話才能拿來做比較.
TianNeng wrote:
請問N家的CPU能執(恕刪)


apple M1也沒有一定要執行WINDOWS,也是能比
用專業跑分軟體橫向比較即可

不過連NV都跨到CPU,那AI/data center這塊目前intel利基就要當心了
以後的事還真不一定

CCD被CMOS取代
LCD被OLED取代, OLED被mini LED >>> micro LED取代
IDE被SATA取代, SATA被SSD取代

只要ARM處理器足夠強
可能X86/X64處理器也會逐漸式微
神祕幻影 wrote:
以後的事還真不一定CCD...(恕刪)


而且這是第二個強力design house採用ARM架構
第一個水果可以凹不夠大,目前顯卡龍頭/AI & server大咖NV夠有力量了吧?
只要需要辦公
WINTEL就不會消失
把握當下、愛要即時;勿以惡小而為之、勿以善小而不為。
神祕幻影 wrote:
CCD被CMOS取代
LCD被OLED取代, OLED被mini LED >>> micro LED取代
IDE被SATA取代, SATA被SSD取代


LCD並沒有被OLED取代...目前主流還是LCD
目前市面上的螢幕多數還是LCD(LED背光+LCD面板)
只有背光從早期的CCFL 進化到LED
面板從TN進化到顏色更好的IPS或VA
以實用性還是LCD>OLED

SSD目前有走nvme跟走傳統sata ahci的
同樣實用性還是傳統sata ahci好用

回到主題...等ARM能跑3A大作
能算Matlab...等再說

拿M1編譯10萬行的C++程式
算10萬*10萬的反矩陣,特徵向量,特徵值
以泰勒級數 算Pi或exp 的小數點10萬位數字
跟5900x或是10900K 差多少
老黃要買ARM當然就是為了主打這個...

至於X86能不能堆出這樣的寬頻效能,
個人是覺得可以,
只不過設計成本較高...而且要看Intel臉色,
加上目前M1成功的例子,
NV當然不會再處處依賴X86...

至於會不會取代都是講太早...
像幾年前吵過的
平板會取代筆電...

結果筆電現在還是活的好好的...
自律努力讓自己變大隻
apple有軟體 可以量身訂做cpu 所以效率能在特定用途嬴過x86!
nvidia能否成功要看微軟或google要不要支援他!
但是 聽說google和微軟要自研cpu了!
手機甚麼的就隨便,
那pc就得開win10.
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!