NVIDIA繼DGX之後,今日在美國聖荷西San Jose舉行的GTC 2018技術大會上再度發表了全新的DGX-2加速AI人工智慧、Deep learning深度學習運算應用。NVIDIA新推出的DGX-2搭載了16張32GB HBM2版本的Tesla V100 GPU,並透過12顆NVSwitch晶片來連結溝通每一組GPU,也因此讓DGX-2就如同一個具備81920個CUDA運算核心的超大型的GPU,且運算效能表現更是上一代DGX-1的10倍之多。NVIDIA DGX-2預計將會在2018年第三季開始發貨,建議售價為39.9萬美金,折合台幣約是1200萬元。


NVIDIA DGX-2的設計是一般伺服器10U的大小,上層3U+3U空間分別搭載了8張32GB HBM2版本的Tesla V100 GPU以及6組NVSwitch晶片。





NVIDIA DGX-2內的每一張Tesla V100 GPU皆具備了5120個CUDA運算核心以及32GB HBM2顯示記憶體,而且每張Tesla V100 GPU也都具備了6條NVLink通道分別連接一組NVSwitch晶片來與其它組GPU連結,所以透過這樣的架構設計便可讓GPU與GPU之間的傳輸頻寬達到300GB/s,以減少多GPU串連時的延遲狀況。





至於底下2U空間主要是搭載了兩組Intel Xeon Platinum CPU、1.5TB記憶體、30TB NVMe SSD以及8組100Gb網路卡等硬體。



就官方表示,在Train FAIRSEQ的表現方面,NVIDIA DGX-2比起上一代DGX-1所需訓練天數從15天大幅縮短至1.5天,效能提收幅度達到10倍之多。若是相比更久之前搭配兩張GTX580顯示卡的平台,NVIDIA DGX-2在Train AlexNet所需點時間更從以往的六天大幅縮短至18分鐘,效能幅度成長500倍之多。





這次的GTC 2018技術大會上除了發表新一代的DGX-2之外,在自家針對電腦繪圖應用的Quadro系列產品也發表了一款全新的Quadro GV100繪圖卡。NVIDIA Quadro GV100繪圖卡與新款Tesla V100 GPU同樣是搭配了32GB HBM2顯示記憶體,並具備5120個CUDA運算核心,單精度與雙精度運算分別可達到14.8/7.4 TFLOPS,深度學習運算效能方面的應用則可達到118.85 TFLOPS。此外,NVIDIA Quadro GV100繪圖卡也有支援NVLink 2技術,可連結兩張Quadro GV100來提昇工作站電腦的即時渲染或是深度學習方面的運算效能表現。





NVIDIA Quadro GV100繪圖卡上會提供四組DP1.4影音輸出端子,最多可同時輸出4組4096x2160@120Hz、4組5120x2880@60Hz或是2組7680x4320@60Hz。


底下是官方提供的NVIDIA Quadro GV100繪圖卡硬體規格表,給大家做個參考。


NVIDIA在沒多久前的GDC遊戲開發者大會中也有發表了全新的NVIDIA RTX光影追蹤技術,搭配這次推出的NVIDIA Quadro GV100繪圖卡將可提供專業繪圖工作者更快速且即時的光影追蹤效果。底下是GTX 2018會場上實際展示的影片,從展示內容可以看到畫面上材質與光源的快速切換時也都能夠即時呈現光影追蹤效果。