今年出推土機&Llano,明年出增強型推土機&推土機APU 並統一腳位
後年的Bulldozer NG可能就會有接近5870的GPU性能,也可能會出現專屬指令集
另外從今年的Bulldozer跟APU可能看不出AMD的優勢,其實這兩項產品理念非常強大
因為X86架構的CPU本身已經遇到瓶頸了,就是只能靠增加核心數量跟頻率來提高效能
現在沒有企業有能力作出一顆單核心頻率1.0GHz效能還可以打趴i7的CPU
但X86現在也遇到兩個問題
1、功耗 因為單執行緒成長太慢,CPU要達到摩爾定律就必須堆疊核心,效能才能倍數成長,但相反的,堆疊核心的同時功耗就會被限制住,32nm的八核心沒辦法比45nm的四核省電,32nm的四核比45nm的四核效能成長又不夠多。
2、軟體 從M$的態度當中就可以看的出來,X86這種用多核心增加效能的方式是不被軟體商青睞的,軟體商更注重兼容性,微軟選擇同時兼容X86跟ARM就看的出來。
然後AMD要解決以上兩項問題的方法就是APU,好 怎麼解決?
首先,為什麼同樣32nm SNB只有4C 推土機卻是8C
然後intel要再出一個LGA2011的X79並且移除內建GPU才有辦法堆到6-8C?
推土機是8C就已經證明這個架構的用意,那就是暴力堆核心同時壓低功耗,針對問題一而衍生出的架構
再來APU,因為多數軟體商與其選擇對多線程的X86進行優化這種花錢費力的工作,他們更偏向對各種平台架構的兼容性質,所以APU就提供了另一條路
藉由GPU的性能來補足CPU的不足,省掉一張顯卡等於省掉了功耗也省掉了體積,也就省掉了成本,間接解決掉X86的功耗跟軟件商難以進行優化的問題。
當然理論跟實際是不一樣的,AMD是預計要在2015年推出有融合指令集的新架構
但以AMD工作進度來看最好不要抱有太樂觀的想法,還有在完全融合之前的產品都只能算是...
PhysX2 wrote:
從這幾天的情報已經可...(恕刪)
Llano和APU這種怪獸以成就高性能處理器來看有些愚蠢.
高性能CPU需要低延遲的cache,而GPU需要高頻寬的Memory BUS,這壓力會落在cache和Memory控制器上,不幸的是AMD的cache頻寬和延遲比Intel爛很多,雪上加霜的是Memory BUS又要負擔CPU和GPU的需求,不難看出來Llano和APU為何只能是兩個虛弱核心的結合,否則Memory控制器要爆肝了.相同的理由Intel i7就不含繪圖核心.
有一說CPU和GPU連在一起用cache溝通更方便,可是兩者之間的問題是指令集不相同,獨立的排程單元,在溝通上出現的是語言隔閡跟指揮權的分立運作,所以連在一起的優點十分有限,除了節省晶片封裝成本.
另一個呆瓜行為是CPU和GPU的規模到一定程度後,兩個熱源放在起對散熱系統又是場災難,結果降電壓和降時脈,又得到兩個虛弱核心,何苦呢?
推土機的4M8C的悲劇就更悲慘了,8 cores聽起來很強,悲慘的是每個core都是經過削減弱化的,跟AMD的GPU的號稱1600個SP弱點類似.
平均每個core只有Phenom 2的2/3數量的解碼和執行單元,FPU更只有1/2的規模,除了多出一個排程單元.增加一點使用彈性,但對性能提升幫助幾乎沒有.;更悲慘的是SSE單元自K7爛到現在,推土機跟隨傳統一樣爛,基於SSE對影音多媒體計算的重要性(IBM和Intel相對重視這個向量單元的重要性),放棄這個部份其實等於放棄跟Intel決戰的機會.
由於core的弱化,AMD必須不計一切的提高時脈(4Ghz起跳),來掩飾core弱化的問題,可是Intel Pentium4的前例加上AMD缺乏trace cache的能力,高時脈之路困難重重.
10多年來都只用AMD的產品,連notebook也用Turion加RS482M,理由只因他的價格讓人滿意而已,技術方面從沒看好過.
AMD的技術有太多是買來的,K6核心從NexGen的Nx686買來,K7~K10 micro code核心和BUS從DEC工程師借來,銅製程和SOI製程從IBM買來的.在核心技術上AMD幾乎不下工夫,分支預測能力和L2 cache自K7以來來依然很爛,complex執行單元K7以來到推土機沒變過,這個單元在DEC 21064時代就是64 bit,AMD發展Athlon 64其實只是藉著DEC 64bit核心順水推舟,沒出多少力.
最後,AMD到底是胖子還是瘦子,就看他有多少覺悟了.



























































































