AMD第三代的APU- Kaveri帶來的啟示


大關 wrote:
老實說hUMA到底怎樣運作我不是很清楚

不過目前可以肯定跟Intel那用L3快速存取不一樣就對啦


巨量資料要給GPU運算的話,hUMA有它的好處,但是資料量不大時,INTEL的作法會快很多,
可惜的是一般人使用上來說,幾乎沒辦法感受到hUMA的好處,沒那麼大量的東西要給GPU算。

如果真的有巨量資料要計算的需求,又回到我前面說的了,應該用Xeon Phi、NV Tesla
這類產品比較適合這樣的需求。


vincent323 wrote:

如果真的有巨量資料要計算的需求,又回到我前面說的了,應該用Xeon Phi、NV Tesla
這類產品比較適合這樣的需求。


實際上的情況是
因為現在GPGPU需要把CPU記憶體拷貝到GPU記憶體
所以除非是大量的運算
丟給GPU根本划不來因為Copy Penalty的關係

而hUMA的好處是去掉這個Penalty
而且簡化程式不用記憶體移來移去的寫法
Oracle和Qualcomm才會希望用GPU來取代大量的浮點運算
拿Java 9 Search來說,如果沒有unified memory access用CPU的話
根本用GPU來算就划不來
資料不是很多的情況下
因為大部分的性能耗損都是再把資料從CPU傳到GPU Memory Space
然後還要從GPU Memory傳回CPU Memory Space

而用HSA的人就可以直接從同一塊記憶體丟入GPU
也是為甚麼Java 9只支援AMD的HSA
而不支援Intel所謂GPGPU的做法
這也就是為甚麼XBOX one和PS4會選用APU了
尤其是Kinetic 2的高階析度辨識就需要大量的GPU運算
如果是傳統Intel/Nvidia GPGPU的做法根本不夠快
光是在記憶體拷貝來拷貝去GPU運算就不實用了
除非是大量的資料

Whistle Blow wrote:

另外AMD的HSA是著重在CPU+GPU,但是ARM的HSA是著重在big.LITTLE大小核心架構(A7搭A15,A53搭A57),兩家公司的重點跟方向差很多。


Big.little叫做Heterogeneous Multiprocessing (HMP)
和HSA是兩碼子事情

http://www.forbes.com/sites/patrickmoorhead/2013/11/18/qualcomm-dont-confuse-heterogeneous-computing-hc-with-heterogeneous-multiprocessing-hmp/

高通寫的很清楚
在HSA這一塊
AMD和ARM陣營是在一起的

Intel不加入會被ARM打得更慘
Nvidia不加入就是被高通打
來段去年HSA基金會成立的新聞稿:
-----------------------------------------
AMD 與 ARM 攜手推廣 HSA 基金會

有一句話叫「敵人的敵人就是朋友」,這句話現在用到 AMD 和 ARM 身上真是再恰當不過了。
作為 Intel 的兩個對頭,這兩家日前結盟,
連同 Imagination Technologies、MediaTek 以及 Texas Instruments 一起推廣 HSA 基金會(異構系統架構基金會)。
雖然 HSA 所推廣的概念在計算機界算不上新,但基金會的成員還是希望能讓它被更廣泛地應用。

和市面上一些產品追求更复杂晶体管設計的做法不同,HSA 希望通過平行運算來提升處理器的表現。
比如圖像處理器將不僅僅用於圖像、遊戲等方面,普通的任務和 App 也可以用到它。
雖然用 OpenCL 已經能達到這種效果,但 AMD 認為這樣的做法太複雜,而且主流的開發者也不容易接受。NVIDIA 那邊也有自己的 CUDA 運算架構,不過可惜那是私有的。
HSA 基金會的目標是一種更簡單、開放,同時還可以涵蓋 PC 與行動設備(不光是跨 OS)的標準。
如果一切順利的話,到 2014 年我們應該就能在日常生活中享用到他們的成果了。
-----------------------------------------
此外,稍稍Google了一下。
卻實在基金會成立之前,沒『heterogeneous systems architecture』的詞彙。
稍稍翻了一下基金會的網頁。
技術方面是陳腔濫調,反正就是heterogeneous computing的原理,技術拿來唬一唬,貼一貼。
願景方面就是新聞稿那樣了。希望這是一個更簡單,開放,同時可以涵蓋所有裝置的標準。
所以才基於『heterogeneous computing』,創了一個『heterogeneous systems architecture』。
只是目前還看不出來這新詞彙的技術,原理有什麼不同於老詞彙
這套用開發流程的話,可以說現在處在發芽期。
所以仰賴heterogeneous computing的土壤,之後會結出什麼果?
就稍稍期待看看囉。
Wow_Senior wrote:
只是目前還看不出來這新詞彙的技術,原理有什麼不同於老詞彙


前面寫過很多次了
HSA的硬體技術就是可以讓GPU去直接存取CPU使用的記憶體
這樣可以避免現有GPGPU把資料從CPU記憶體傳到GPU記憶體再轉回來的問題
畢竟寫過程式的都知道自己來做記憶體管理有多麻煩
光是這一步就可以讓支援GPGPU的程式更加廣泛
但是如果硬體本身不支援HSA
反而不能利用HSA架構的應用程式

這也就是在HSA之前,JVM沒支援GPGPU
因為要支援CUDA/OpenCL光是記憶體轉來轉去反而把GPU多出來的效能都浪費了
但是現在卻會在APU上面支援
光是Java 9支援HSA搜尋速度就快三倍以上
你覺得有沒有用?

如果ARM的廠商跟進
Intel更是騎虎難下
因為支援HSA等於是在PC和AMD在不擅長的GPU競爭
不支援HSA就只能眼睜睜看著高通繼續霸占移動市場
類似的問題Nvidia也是遇到
說HSA是AMD的王牌也不足為過

Windwaker wrote:
前面寫過很多次了HS...(恕刪)


你要說的是hUMA?
這東西與其解釋成你那樣子,我倒覺得解釋成『共用記憶體定址』比較不會令人誤會。

至於,你要提的直接存取。
有一個很老的詞彙叫『DMA』

然後...你能佐圖嗎?純文字看了很累。
光什麼資料搬來搬去的。你講了半天還是沒辦法讓人理解你在講什麼。
大關 wrote:
產品還沒出來你就能這...(恕刪)


01電腦版編輯發的那幾篇裡面那裡有提到Kaveri的效能。
對比現行的GPU來看,一點也不會有什麼自大的疑慮。

我覺得該期待的不是CPU本身,或者準確點該說APU本身。
而是新得API有多少廠商願意採用。


vincent323 wrote:
INTEL不是沒搞行...蘋果不是做CPU的,也沒能力提升CPU效能(恕刪)



APPLE處理器是APPLE設計再找人代工

APPLE和高通都是買ARM授權來再自己設計喔

你要不要GOOGLE一下再來討論?
vincent323 wrote:
巨量資料要給GPU運...(恕刪)


浮點運算就可以給GPU運算了

AMD一直砍CPU部分的浮點處理能力,就是因為APU的統一尋址可以利用GPU作浮點運算,剩下就是軟體支援

小量是多小量?大量是多大量?

要不先google一下下?
vincent323 wrote:
巨量資料要給GPU運...(恕刪)


你說到重點了

因為現在就是要資料量多的運算

簡單的舉例就是遊戲

超多的吧?


現在核心太強大拉

隨便一顆APPLE的A7能耗2W

跑個GEEK3跟低階桌電差不多

比PENTIUM 4 強上數倍

你不會以為還是在開個網頁要等數秒的時代吧?

現在開網頁,小程式都馬瞬間開啟

不說的話,是用哪顆核心根本分不出來

差就差在大型程式的開啟速度

如果GPU輔助運算能有不錯效果的話

我想做大型程式的人是會共襄盛舉的






文章分享
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 25)

今日熱門文章 網友點擊推薦!