自從2012年Alex Krizhevsky透過兩張NVIDIA GeForce GTX580 GPU來訓練自己研發的AlexNet圖片辨識模型並贏得當時的ImageNet比賽冠軍之後,NVIDIA開始發現透過GPU能夠更有效率地執行深度學習與辨識運算,並且在這幾年持續開發許多軟硬體來應用於深度學習加速,而在今年台灣GTC大會上除了發表了DGX-1深度學習運算超級電腦、Tesla P4與Tesla P40加速卡、Jetson TX1模組化嵌入式系統、Drive PX 2自駕車開發平台等硬體之外,還提供了TensorRT深度學習模型函式庫以及NVIDIA DeepStream SDK,希望能夠藉著這些工具來加速AI人工智慧的研究與發展。


在GTC大會上,NVIDIA CEO黃仁勳先生有提到大腦運作的方式跟GPU很像,當大腦想到兩個人在打乒乓球的時候,腦中自然就會浮現情景畫面,而GPU的功能也正是產生圖像,而且運算的的方式就像也有點類似是大腦神經元的訊號傳導。




深度學習的整個架構模式簡單來說,就是開發者先設計一個演算法出來,並將一些需要讓機器學習資料一起丟到電腦內訓練出一個資料模組,之後裝置在實際運用可透過網路連結到這個學習好的模組來進行語言、圖像或影音之類辨識,而裝置所接收到的資訊也能夠讓機器持續學習,藉此增加資料完整度,進而提昇日後的辨識成功率。而NVIDIA GPU在深度學習中所扮演的角色便是加速深度學習模組的訓練以及裝置辨識的反應速度,讓這些技術在實際應用時能夠更加直覺準確。




於是為了加速深度學習模組訓練運算,NVIDIA近來便針對深度學習運算需求推出了一款DGX-1超級電腦。在這台超級電腦之中不僅搭載了兩顆20核心的Intel Xeon E5-2698v4處理器、512GB DDR4-2133記憶體以及4組容量1.92TB的Raid 0固態硬碟等硬體,還直接搭載8顆NVIDIA Pascal架構的Tesla P100 GPU,一共具備了28672個NVIDIA CUDA運算核心來加速深度學習方面的運算能力。








除了NVIDIA直接建構設計的DGX-1超級電腦之外,在今年台灣GTC會場上還發表了兩款針對深度學習運算所推出的Tesla P40與Tesla P4兩款加速卡,讓使用者能夠建構自己的深度學習運算平台。其中的Tesla P40加速卡將能夠達到40倍的CPU運算效能。




NVIDIA新推出的Tesla P40加速卡中搭載的NVIDIA Pascal架構晶片內具備了3840個CUDA運算核心,並有搭配24GB的快取記憶體,整體運算能力可達到12TFLOPS,功耗設計為250W。至於另一款Tesla P4一樣是搭載NVIDIA Pascal架構晶片,裡面具備了2560個CUDA運算核心,並搭配了8GB快取記憶體,整體運算能力可達到5.5TFLOPS,功耗設計為50W/70W。


NVIDIA推出新硬體的同時,還有提供一個叫作TensorRT的深度學習模型函式庫來提昇深度學習運算的效率。


現場也實際透過NVIDIA的深度學系運算平台直接串流將近100個HD解析度的影像,並透過電腦即時辨識影像的內容與篩選。而這樣的技術與效能,日後在影片分析或是監控辨識等方面的應用也能夠有相當不錯的成效。











目前針對自動駕駛汽車方面的應用,NVIDIA也有推出一款DRIVE PX 2運算平台,在這個運算平台上整合了Pascal架構GPU,整體系統平台的功耗僅10瓦電力,可用來加速分析接收到的影像、雷達、超音波等資訊,藉此提昇物體辨識與路線規畫的準確性,為乘坐者帶來更安全的自動駕駛體驗。


而NVIDIA目前已經透過這個DRIVE PX 2運算平台建構了一台NVIDIA BB8人工智慧汽車,並持續進行各種駕駛狀況學習與測試,提昇自動駕駛的安全性。除了自家的BB8之外,台灣工研院第一台自動駕駛汽車也同樣搭載了NVIDIA 的DRIVE PX 2運算平台。




另外像是百度、Volvo、WEpods等公司也都已經採用DRIVE PX 2運算平台來開發自家的自動駕駛汽車。


人工智慧的應用其實非常廣泛,除了自動駕駛汽車之外,像是在醫學方面,透過圖片辨識的學習可以讓機器直接辨識MRI核磁共振與斷層掃描圖像,甚至進行初步的病情診斷作業。加入人工智慧的機器人,也可以應用在類圾分類、家庭照護、宇宙探索...等各方面的工作,或許以前只會在電影上出現的科幻情結很快地就會出現在真實生活中。