HASWELL的進步真的只有這樣嗎?

lovesharepc

716分

31樓

lovesharepc

個人積分：716分

文章編號：44465122

我覺得這不能怪 INTEL
有點像處理器的極限到了
除非架構大改 (把 X86 換掉)
那就是一個新的開始

nigi123

75分

32樓

nigi123

個人積分：75分

文章編號：44485825

lovesharepc wrote:
我覺得這不能怪 INTEL
有點像處理器的極限到了
除非架構大改 (把 X86 換掉)
那就是一個新的開始

為什麼不能怪intel?
增加核心數不就得了嗎?
要6核心以上又得花大錢到2011
看到Haswell那種幾近殘障的效能增進
都快吐血了

淡定999

22分

33樓

淡定999

個人積分：22分

文章編號：44486989

nigi123 wrote:
為什麼不能怪intel?
增加核心數不就得了嗎?
要6核心以上又得花大錢到2011
看到Haswell那種幾近殘障的效能增進
都快吐血了.(恕刪)

intel 又不是做慈善事業怪它有用嗎??

增加核心成本就增加它當然要賣貴一點

它現在沒有對手當然利潤最大化

Haswell 太爛你可以買AMD

你買下去?

沒什麼進步不要換錢省起來也沒什麼差

我愛鮑魚

40分

34樓

我愛鮑魚

個人積分：40分

文章編號：44487188

就算是8核，效能增加也有限

8核心要軟體支援才有用

在大部分軟體都還在單核.雙核打轉時

英呆爾就沒必要太早亮出王牌

潛水中

Lake Shore

27分

35樓

Lake Shore

個人積分：27分

文章編號：44488689

異構運算不是只有AMD在搞，Haswell的HD4600內顯也不是只能拿來玩遊戲，還具有很不賴的OpenCL通用計算能力，請一併考量進來。要看一個新架構跟某顆新CPU是否有進步，一些老舊的Benchmark跟腦袋理的舊觀念，也要跟著更新。

Nuclearus Multi-Core、Cinebench 11.5......這些Benchmark當然還是可用，只是別忘了，Haswell還有不小的計算潛力，是這些Benchmark根本用不上、也測不到的。

OpenCL是CPU跟GPU異質協同運算的標準，也是趨勢，但似乎大部分認為Haswell跟IVB沒差的，還是停留在只有CPU能計算、GPU只能玩遊戲那種老舊觀念，如果是這樣，根本不需要關注新Haswell架構。

下面這些幾乎都是真實應用程式測試，用上了CPU+GPU協同計算，涵蓋的應用面也蠻廣的，包括影音編輯/轉檔、Photo編輯/製作、資料壓縮、財務計算、3D rendering算圖等等。

中央處理器版上常見硬體進步，軟體卻不跟上的抱怨；但是已經有軟體跟上了，這下似乎卻換成不少人腦袋裡的舊觀念跟不上了..... orz

影音應用：

Photo應用：

資料壓縮應用：

財務分析計算應用：

3D Rendering算圖應用：

hanzo0313

7分

36樓

hanzo0313

個人積分：7分

文章編號：44490827

在GPU越來越重要的現在，AMD下一步就是玩hUMA了
CPU/GPU共用位址之後，計算資料就不用經由轉譯來互傳資料
可以省下很多時間，增加效率

Intel支援OpenCL是對的，接下來就看他們能不能想出更有效率的CPU+GPU協同機制

Lake Shore

27分

37樓

Lake Shore

個人積分：27分

文章編號：44491004

hanzo0313 wrote:
Intel支援OpenCL是對的，接下來就看他們能不能想出更有效率的CPU+GPU協同機制...(恕刪)

關於更有效率的CPU+GPU協同機制，AMD在搞還沒推出的hUMA，Intel則是早早就做了，Intel的作法是從Sandy Bridge開始，就已經讓內顯CPU跟CPU核心都掛到內部超高速Ring Bus上，內顯GPU可以跟CPU核心處於同等地位、從L3快取直接存取CPU/GPU之間共享的資料，不透過比快取慢很多的記憶體。先把基礎建設做好，接下來就是持續在IVB、Haswell、Broadwell、Skylake....一代代繼續加強GPU跟異質計算的能力，並持續改進高速Ring Bus的頻寬跟運作。

兩家的設計各有千秋，Kaveri APU將會是hUMA，Llano/Trinity/Richland APU是透過更傳統的Snooping的方式，但Kaveri/Trinity/Richland/Llano都還只是在較慢的記憶體階層下功夫，還不敢大刀闊斧把GPU直接連到內部快取上。畢竟AMD礙於製程問題，在APU上連L3快取都取消了；有L3快取的FX系列，則是根本無法再納入內顯。架構設計跟製程，彼此間有雞生蛋、蛋生雞問題。

下圖是Sandy Bridge的示意圖。

下圖是hUMA的概念：

hUMA只是用來解決AMD自家CPU/內顯GPU溝通效率未最佳化的問題，因為Intel早在Sandy Bridge時就已經把CPU/內顯GPU之間的溝通方式打掉重練過了，接下來就是持續增進GPU以及Ring Bus的效能。以在Intel處理器上執行OpenCL程式來說，CPU跟GPU就已經可以共享/存取相同的記憶體，不需要複製來、複製去，也就是尚未推出的AMD hUMA想達成的目標。

http://software.intel.com/en-us/forums/topic/277703
http://software.intel.com/en-us/articles/opencl-the-advantages-of-heterogeneous-approach

換個角度看，Intel若要進一步改進記憶體共享的機制，不會比當初加入Ring Bus架構、並且把GPU也掛上L3快取更難。但是AMD要大幅度敲掉架構、把內顯也掛到L3快取上面去，不管從架構設計面、生產製程面，那就工程浩大了。

http://www.realworldtech.com/sandy-bridge/8/

nvfans

948分

38樓

nvfans

個人積分：948分

文章編號：44495111

hanzo0313 wrote:
在GPU越來越重要的...(恕刪)

AMD專注異構運算蠻久了...這部分起早得比Intel快很多。
年底的HSA等各項規範隨著Kaveri的出現，應用會廣更多...

Intel的驅動&開發包也應該要跟上才行，還曾發生AMD的ICD套用在Intel的CPU上
結果比Intel的IDC還更快的事情...

Intel現在研發內顯的應該是由原ATi R600團隊挖過去在加新血補充的團隊吧微冷笑

...
有了Larrabee讀顯失敗的經驗，以後應該會好一些吧

。

hanzo0313

7分

39樓

hanzo0313

個人積分：7分

文章編號：44495394

hUMA應該不只這樣
因為HSA最終目標是要讓指令集進CPU之後能夠自由決定是交給CPU/GPU處理

要解決這個問題首先就是要讓CPU/GPU能同樣存取共同的記憶體

因為不管是Intel UMA or A/N的獨顯，在交換系統記憶體時都還是需要轉譯
也就是GART，這部分一刀一槍都是要一個一個來，佔了很多記憶體cycle

所以hUMA要做的是這一步，跟Intel做的用快取來加速不太一樣

hanzo0313

7分

40樓

hanzo0313

個人積分：7分

文章編號：44495433

intel內顯還需要加油啦...但是有進步就是好事

不然一次解決，去找NV談GPU授權直接包進CPU比較快...

HASWELL的進步真的只有這樣嗎?

小惡魔新聞台

小惡魔廣編特輯

HASWELL的進步真的只有這樣嗎?

小惡魔新聞台

小惡魔廣編特輯

今日熱門文章 網友點擊推薦！

今日熱門文章　網友點擊推薦！