HASWELL的進步真的只有這樣嗎?

我覺得這不能怪 INTEL
有點像處理器的極限到了
除非架構大改 (把 X86 換掉)
那就是一個新的開始

lovesharepc wrote:
我覺得這不能怪 INTEL
有點像處理器的極限到了
除非架構大改 (把 X86 換掉)
那就是一個新的開始


為什麼不能怪intel?
增加核心數不就得了嗎?
要6核心以上又得花大錢到2011
看到Haswell那種幾近殘障的效能增進
都快吐血了
nigi123 wrote:
為什麼不能怪intel?
增加核心數不就得了嗎?
要6核心以上又得花大錢到2011
看到Haswell那種幾近殘障的效能增進
都快吐血了.(恕刪)


intel 又不是做慈善事業 怪它有用嗎??

增加 核心 成本就增加 它當然要賣貴一點

它現在沒有對手 當然利潤最大化

Haswell 太爛 你可以買AMD 你買下去?

沒什麼進步 不要換錢省起來 也沒什麼差
就算是8核,效能增加也有限

8核心要軟體支援才有用

在大部分軟體都還在單核.雙核打轉時

英呆爾就沒必要太早亮出王牌
潛水中
異構運算不是只有AMD在搞,Haswell的HD4600內顯也不是只能拿來玩遊戲,還具有很不賴的OpenCL通用計算能力,請一併考量進來。要看一個新架構跟某顆新CPU是否有進步,一些老舊的Benchmark跟腦袋理的舊觀念,也要跟著更新。

Nuclearus Multi-Core、Cinebench 11.5......這些Benchmark當然還是可用,只是別忘了,Haswell還有不小的計算潛力,是這些Benchmark根本用不上、也測不到的。

OpenCL是CPU跟GPU異質協同運算的標準,也是趨勢,但似乎大部分認為Haswell跟IVB沒差的,還是停留在只有CPU能計算、GPU只能玩遊戲那種老舊觀念,如果是這樣,根本不需要關注新Haswell架構。

下面這些幾乎都是真實應用程式測試,用上了CPU+GPU協同計算,涵蓋的應用面也蠻廣的,包括影音編輯/轉檔、Photo編輯/製作、資料壓縮、財務計算、3D rendering算圖等等。

中央處理器版上常見硬體進步,軟體卻不跟上的抱怨;但是已經有軟體跟上了,這下似乎卻換成不少人腦袋裡的舊觀念跟不上了.....

影音應用:




Photo應用:




資料壓縮應用:




財務分析計算應用:






3D Rendering算圖應用:

在GPU越來越重要的現在,AMD下一步就是玩hUMA了
CPU/GPU共用位址之後,計算資料就不用經由轉譯來互傳資料
可以省下很多時間,增加效率

Intel支援OpenCL是對的,接下來就看他們能不能想出更有效率的CPU+GPU協同機制
hanzo0313 wrote:
Intel支援OpenCL是對的,接下來就看他們能不能想出更有效率的CPU+GPU協同機制...(恕刪)

關於更有效率的CPU+GPU協同機制,AMD在搞還沒推出的hUMA,Intel則是早早就做了,Intel的作法是從Sandy Bridge開始,就已經讓內顯CPU跟CPU核心都掛到內部超高速Ring Bus上,內顯GPU可以跟CPU核心處於同等地位、從L3快取直接存取CPU/GPU之間共享的資料,不透過比快取慢很多的記憶體。先把基礎建設做好,接下來就是持續在IVB、Haswell、Broadwell、Skylake....一代代繼續加強GPU跟異質計算的能力,並持續改進高速Ring Bus的頻寬跟運作。

兩家的設計各有千秋,Kaveri APU將會是hUMA,Llano/Trinity/Richland APU是透過更傳統的Snooping的方式,但Kaveri/Trinity/Richland/Llano都還只是在較慢的記憶體階層下功夫,還不敢大刀闊斧把GPU直接連到內部快取上。畢竟AMD礙於製程問題,在APU上連L3快取都取消了;有L3快取的FX系列,則是根本無法再納入內顯。架構設計跟製程,彼此間有雞生蛋、蛋生雞問題。

下圖是Sandy Bridge的示意圖。



下圖是hUMA的概念:



hUMA只是用來解決AMD自家CPU/內顯GPU溝通效率未最佳化的問題,因為Intel早在Sandy Bridge時就已經把CPU/內顯GPU之間的溝通方式打掉重練過了,接下來就是持續增進GPU以及Ring Bus的效能。以在Intel處理器上執行OpenCL程式來說,CPU跟GPU就已經可以共享/存取相同的記憶體,不需要複製來、複製去,也就是尚未推出的AMD hUMA想達成的目標。

http://software.intel.com/en-us/forums/topic/277703
http://software.intel.com/en-us/articles/opencl-the-advantages-of-heterogeneous-approach

換個角度看,Intel若要進一步改進記憶體共享的機制,不會比當初加入Ring Bus架構、並且把GPU也掛上L3快取更難。但是AMD要大幅度敲掉架構、把內顯也掛到L3快取上面去,不管從架構設計面、生產製程面,那就工程浩大了。

http://www.realworldtech.com/sandy-bridge/8/
hanzo0313 wrote:
在GPU越來越重要的...(恕刪)


AMD專注異構運算蠻久了...這部分起早得比Intel快很多。
年底的HSA等各項規範隨著Kaveri的出現,應用會廣更多...

Intel的驅動&開發包也應該要跟上才行,還曾發生AMD的ICD套用在Intel的CPU上
結果比Intel的IDC還更快的事情...

Intel現在研發內顯的應該是由原ATi R600團隊挖過去在加新血補充的團隊吧...
有了Larrabee讀顯失敗的經驗,以後應該會好一些吧
hUMA應該不只這樣
因為HSA最終目標是要讓指令集進CPU之後能夠自由決定是交給CPU/GPU處理

要解決這個問題首先就是要讓CPU/GPU能同樣存取共同的記憶體

因為不管是Intel UMA or A/N的獨顯,在交換系統記憶體時都還是需要轉譯
也就是GART,這部分一刀一槍都是要一個一個來,佔了很多記憶體cycle

所以hUMA要做的是這一步,跟Intel做的用快取來加速不太一樣
intel內顯還需要加油啦...但是有進步就是好事

不然一次解決,去找NV談GPU授權直接包進CPU比較快...
文章分享
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 7)

今日熱門文章 網友點擊推薦!