AMD原生四核之戰(下),初代 Phenom 的敗北

AMD原生四核之戰(下),初代 Phenom 的敗北

AMD去年購併ATI的主要原因,除了吸收顯示技術準備與CPU合體之外,平台化是另一個重點。過去AMD推出新CPU都要搭配其他公司的晶片組(K8時代主要是NVIDIA,K7的話則是VIA),Spider是他們第一次以完整平台來推出新產品,直接用自家ATI的晶片組,不必再依靠別人。其實也就是照抄Intel多年以來的手法,新世代的CPU綁新的晶片組,將來AMD也會持續以平台來更新產品線,說的好聽是給玩家「完整的解決方案」,但大家應該都心裡有數,就是模仿Intel的腳步,朝著壟斷的方向前進。

上一篇我們已經紙上談兵分析了Barcelona新架構,這篇就來看實際的產品。Spider由Phenom處理器、AMD 790晶片組和Radeon 3800系列顯示卡組成,Radeon 3800已經在另外一篇文章測過了,這篇單純針對CPU和主機板。

很多人已經知道Phenom贏不了Intel的Core 2,認為「原生四核有個屁用?還不是照輸,玩家根本不在乎真四核還是假四核,管它是飛龍還是烤土瓜,只要速度夠快就好了」。沒錯!Phenom的確輸了,但它還是有許多好玩的地方值得一看,就算輸了,也可以來看看飛龍為什麼慘敗,推測一下AMD未來該怎麼走。

搞不好換掉CEO是個不錯主意......。


AMD Phenom 處理器

Intel新架構的CPU通常從筆電開始,AMD則從伺服器開始(桌上型PC真的是利潤最小的市場),Barcelona架構第一顆衍生CPU是Opteron,過了數個月的風風雨雨才推出桌上型的Phenom,上市前網路上就有唱衰的消息,像是65奈米製程的時脈拉上不去、耗電量破錶,TLB bug等等。下面我們會有超頻、耗電和那個神秘bug的測試,先來看看AMD新的命名。

新的命名
AMD過去Athlon 64系列的PR命名法是以Pentium4的時脈為對應,Athlon 64 4000+就相當於Pentium4 4GHz的效能(事實上Athlon通常還比較快),但Core 2之後Intel就不再主推時脈,AMD一個人繼續用PR命名就很白痴,從Athlon BE-2xxx開始AMD採用新的命名法,而在Phenom之後,全系列CPU將會統一在相同的命名邏輯下,當然也取消64的字眼,原因可想而知,現在不可能找到非64位元的新CPU了。


AMD原生四核之戰(下),初代 Phenom 的敗北


新的命名邏輯不再有X2或X4來標示核心數量,除了最低階Sempron和最高階的FX系列之外,其他都是用四個數字組成型號,第一個數字代表大系列的產品,通常也就是核心數量,剩下三個數字則是該系列裡的高低階型號,數字越大越強,列表如下:

Phenom 高階四核心:FX-9x / FX-8x
Phenom 四核心:9000
Phenom 三核心:8000
Athlon 雙核心:6000
Athlon 單核心:1000
Sempron 單核心:LE-1000


Phenom 9600/9900
AMD在11/15發表兩顆Phenom,9600與9500都是四核心CPU,兩顆規格很接近,差別只有時脈高低,分別是2.3Ghz和2.2GHz,現在售價約在台幣8600和6500元。Phenom 9500有個很大賣點--它是市面上最便宜的四核心CPU,比Intel的低階四核心Q6600還便宜,之後購物台大概會出現「四核飛龍魔獸機,挑戰全台最低價」的套裝電腦了....。

我們除了拿到市售版的9600之外,還有明年會出的極品飛龍Phenom 9900工程版,核心和北橋時脈都更高,官方售價未定,但應該在台幣一萬左右。


AMD原生四核之戰(下),初代 Phenom 的敗北
Phenom 9600本尊。


AMD原生四核之戰(下),初代 Phenom 的敗北
Phenom 9600的CPU-Z資訊。


AMD原生四核之戰(下),初代 Phenom 的敗北
從CPU-Z的快取資訊裡可以看到Phenom的快取配置,128KB x4的獨立L1快取、512KB x4的獨立L2快取,和2MB的共享L3快取。


AMD原生四核之戰(下),初代 Phenom 的敗北
Phenom 9900工程版,預計2008年上市的高階四核心。


AMD原生四核之戰(下),初代 Phenom 的敗北
CPU-Z目前還秀不出Phenom 9900的資訊,這裡貼上Overdrive的圖(以下會詳細解說Overdrive是啥),雖然名稱還是Engineer Sample(工程樣品),但其他資訊都是正確的,Phenom 9900是目前已知最快的飛龍,時脈達2.6GHz。


簡化記憶體時脈公式
說到時脈,這次Phenom計算記憶體時脈的公式跟之前AM2腳位的Athlon64不一樣。之前Athlon64的DDR2記憶體時脈是:[CPU頻率] / [CPU倍頻/2],如果CPU倍頻不是整數就無條件進位產生除頻值,這可能會造成記憶體時脈無法精確對應,比如Athlon BE-2350和2300用的就是非整數的除頻值,分別是2100MHz(200x10.5)和1900MHz(200x9.5),進位之後的除頻值為6和5,因此兩顆CPU支援的記憶體時脈最高只到DDR2-700和DDR2-760,到不了DDR2-800,這會稍微影響效能。

AM2腳位的Athlon64可能是倍頻除頻沒有做好,Phenom則改回跟Socket 939一樣,雖然Phenom一樣有非整數的倍頻,但它只用單一200MHz的外頻做為基準,透過簡單的比值來支援標準的DDR2時脈,比如1:2比值就支援DDR2-800(外頻x2變記憶體的基準時脈,DDR再x2),除非有超頻,不然Phenom的記憶體時脈都可以正確對應。另外,Phenom內部有兩個倍頻值,分別給核心和內建的北橋,比如Phenom 9600的核心倍頻11.5x,時脈就是2.3GHz;北橋倍頻則是9x,北橋時脈就是1.8GHz。


AMD原生四核之戰(下),初代 Phenom 的敗北
CPU-Z的資訊不夠完整,這裡貼Overdrive偵測到的。圖中的HT ref clock就是基準外頻200MHz,Core Speed(核心)和NB Speed(北橋)有不同的時脈,事實上,在AM2+腳位下核心和北橋甚至有不同的電壓。


一顆CPU、兩個時脈
這個北橋時脈很重要,它代表HyperTransport 3.0的速度,也就是CPU連接主機板晶片組的頻寬,而且北橋時脈同時也是Phenom的L3快取的時脈,Phenom只有L1和L2是跑CPU的核心頻率,L3快取會稍慢一點,所以Phenom 9600和9500的L3快取速度是一樣的。L3快取和CPU不同步多少會影響效能,但L3快取超頻的方法就是超那唯一的基準外頻,那會連帶影響核心、記憶體、HyperTransport和L3時脈。

L3快取和核心不同步的原因可能有兩個,一是北橋與L3快取連為一體比較方便,對外是連接記憶體,對內則溝通四核心的資料;另一個原因,可能是AMD造不出全速的L3快取


[註:HyperTransport跟DDR記憶體一樣是雙倍速度傳輸,所以Phenom的HT真實時脈都要x2才是有效時脈,比如Phenom 9600的HT有效時脈是3.6GHz,Phenom 9900則是4GHz。]


AMD原生四核之戰(下),初代 Phenom 的敗北
這是用Everest測出來的L1/L2/L3快取頻寬,L3快取明顯比L1與L2慢一大截,不過延遲比外部記憶體低多了,Phenom的L3用意主要是做四核心資料同步。


目前這三顆飛龍的詳細規格表如下,另外附上Phenom現在與未來的對手。

AMD原生四核之戰(下),初代 Phenom 的敗北

AMD原生四核之戰(下),初代 Phenom 的敗北


AMD 790 晶片組

代號RD790的晶片組原本是ATI的新產品,去年初就有一些風聲,購併之後ATI晶片組產品納入AMD的品牌之下,最後跟著Phenom一起發表。初期有高階的AMD 790FX和790X,兩者的差別只有PCI-Express 2.0 x16插槽的數量,790FX支援四張顯示卡串連,790X只有雙卡。雖然Phenom的AM2+腳位相容於現有的AM2主機板,但會少掉HyperTransport 3.0和北橋獨立電壓,一定會影響效能和耗電,所以現在要買Phenom,最好搭配AMD 790一起裝,790FX的價格蠻漂亮的,大約是高階Intel P35的價位,但多了一堆PCI-E 2.0的插槽

一般晶片組所用的製程都不是很先進,通常落後CPU製程一兩個世代,但晶片組的功能越做越複雜,主要是為了做多顯示卡的串連和新的PCI-Express 2.0,比如第一顆支援PCI-E 2.0的X38晶片組,上面就裝了鐵蓋幫助散熱。AMD RD790則用了TSMC的65nm製程,降低晶片組的耗電和廢熱,雖然790FX是高階主機板,但通常只有被動散熱片就好了,不必像X38,晶片組散熱連水冷頭都跑出來了。


AMD原生四核之戰(下),初代 Phenom 的敗北
和Phenom一起出的是AMD 790FX與790X,明年會有RS780內建獨立顯示,和筆電用的RS780M。


AMD原生四核之戰(下),初代 Phenom 的敗北
790FX的架構圖,支援AM2/AM2+的CPU(包括現在的Athlon和Phenom),有HyperTransport 3.0和四條PCI-Express 2.0 x16的插槽,南橋則是用了一陣子的是SB600。


技嘉 790FX-DQ6

AMD原生四核之戰(下),初代 Phenom 的敗北
技嘉790FX-DQ6,這是技嘉針對Phenom而出的高階主機板,南北橋和CPU旁的零件都有散熱片,用熱導管連在一起。


AMD原生四核之戰(下),初代 Phenom 的敗北
四條PCI-Express 2.0 x16的插槽,可串連四張ATI Radeon 2000/3800系列顯示卡,全部插滿時,每張卡跑的是PCI-E 2.0 x8的速度,北橋實體只有PCI-E 2.0 x32,只插雙卡的話就預有全速的PCI-E x16。


AMD原生四核之戰(下),初代 Phenom 的敗北
790FX-DQ6有一貫「DQ6」的12相電源設計


AMD原生四核之戰(下),初代 Phenom 的敗北
和一般主機板不太一樣,顏色相同(雙通道)的記憶體插槽是靠在一起的。


AMD原生四核之戰(下),初代 Phenom 的敗北
790FX-DQ6背面也有散熱片,可能會影響一些Cooler的安裝。


AMD原生四核之戰(下),初代 Phenom 的敗北
由於是DQ6高階板,I/O的部分也很豐富,1394、6個USB、兩個網路、兩個eSATA、同軸光纖,該有的都有了,連不該有的Com Port都出現了。


AMD原生四核之戰(下),初代 Phenom 的敗北
790FX-DQ6的超頻介面,時脈、電壓都在這裡調。


AMD原生四核之戰(下),初代 Phenom 的敗北
AutoXpress是AMD 790系列的特殊功能,其實就像NVIDIA的linkboost,只要插上AMD的CPU、ATI Radeon X1000以上的顯示卡、和EPP記憶體,整個系統就會自動超頻。Phenom的話會出現1MHz的超頻微調,PCI-E的頻率會從100Mhz拉到125MHz,記憶體的時脈時序也會自動加快,算是無腦超頻。


Overdrive 軟體監控與超頻

Overdrive是AMD 790晶片組的專用軟體,很像NVIDIA的nTune,是系統監控加超頻的程式。我一直很喜歡這種軟體,不必盯著爆醜的BIOS畫面,直接在漂亮的介面下舒服地超頻(?),而且官方出的監控程式向來都有超完整的資訊,絕對比主機板廠或網友自製的軟體來的詳細豐富。之前只有NVIDIA推出類似的軟體給nForce晶片組用,現在AMD Overdrive也出了,接下來就看Intel的誠意了,不過Intel硬體的驅動程式,向來都「只是驅動程式」而已。

Overdrive沒有nTune那麼華麗,不過功能比nTune強太多了,只是有些地方好像只做一半,而最奇怪的是我在AMD官方上完全找不到Overdrive的下載網址,該不會只附有在AMD 790的主機板包裝盒裡吧?


AMD原生四核之戰(下),初代 Phenom 的敗北
這是AMD Power Monitor,另一支監控用的小程式,可即時顯示四個核心的使用率和時脈電壓,看著那個黃色的Bar上下跳還蠻爽的....。


AMD原生四核之戰(下),初代 Phenom 的敗北
這才是Overdrive,主介面顯示所有重要的系統資訊,包括CPU、記憶體、HyperTransport。圖中是Phenom 9600開啟Cool n' Quiet後的數值,這次C&Q的最低倍頻是詭異的5.75x,而不是之前K8的5x了。


[註:Phenom在Windows XP下開啟Cool n' Quiet的方法跟Athlon64一樣,安裝CPU Driver、BIOS啟動Cool n' Quiet、控制台的電源管理設到「最小電源管理」。]


AMD原生四核之戰(下),初代 Phenom 的敗北
「System Monitor>System Status」顯示的內容有點像AMD Power Monitor,秀出系統裡最重要的幾個時脈和數值。


AMD原生四核之戰(下),初代 Phenom 的敗北
「System Monitor>Voltage/Temperature」秀的是所有晶片的電壓值,包括記憶體、CPU、北橋、PCI-E等等。溫度的部分一直弄不出來,一直都是顯示0度。


AMD原生四核之戰(下),初代 Phenom 的敗北
「Performance Control>Clock Voltage」就是玩超頻的地方了,Phenom四核的倍頻可以獨立設定,不過主要還是調「HT Ref. Clock」,這就是Phenom的基準外頻,牽一髮動全身,調一個就會動到核心、記憶體、HT和北橋(L3快取)時脈。右下角則是調電壓,詭異的是CPU電壓只能往下不能往上.....。


AMD原生四核之戰(下),初代 Phenom 的敗北
記憶體調整的部分就太over了,也許應該在旁邊附個說明,不然這密密麻麻的數值誰看的懂?


AMD原生四核之戰(下),初代 Phenom 的敗北
Overdrive有內建簡單的Benchmark程式,主要是讓你測超頻之後快多少,這個是Phenom限定的,Intel CPU不能跑。


AMD原生四核之戰(下),初代 Phenom 的敗北
除了Benchmark,在「Stability Test」下還有燒機程式,底下的拉Bar可選燒機時間,最長能燒到一個星期,應該很夠了。


AMD原生四核之戰(下),初代 Phenom 的敗北
「Auto Clock」是自動超頻,nTune也有類似的功能,可是我一按「Start」,整個系統就當掉了,大概還沒做好吧?


AMD原生四核之戰(下),初代 Phenom 的敗北
在「Preference」可以設定「Novice Mode」(新手模式)或「Advanced Mode」(進階模式),前面秀的其實都是新手模式,我想你爸媽應該都看的懂那些數值.......。開玩笑的,剛剛都是進階模式。


AMD原生四核之戰(下),初代 Phenom 的敗北
切到新手模式的話,超頻介面會簡化到只剩「1~10」的超頻級數,我試拉了一下,拉到最高第10級之後,外頻居然從200Mhz升到高達205Mhz,PCI-E的頻率從100Mhz提高到120Mhz!真是太驚人了,不知道玩遊戲時會不會多個3張,但至少這是最安全的超頻,新手嘛,別把他們嚇到心臟病發。


其實790FX加上Overdrive還蠻有可看性的,現在支援PCI-E 2.0的晶片組只有AMD 790和X38,而790FX保証比X38便宜多了,又有還不錯的專用軟體,可惜790FX只能插AMD CPU....(呃,這算缺點嗎?)


原生四核 vs 拼裝四核,效能對決

我們拿到Phenom 9600和9900,9600的定價比Q6600稍高,自然是拿Q6600做對照組,9900的話官方還沒決定售價,但猜測應該是夾在Q6600與Q6700之間。原本我想再拿Intel的高階四核QX6850、QX9650,甚至QX9770來對照效能,但測完Phenom 9600、9900和Q6600之後就發現....呃,不必麻煩了。

另外,為了最佳的多執行緒效能,Phenom統一用Unganged模式,不加TLB Patch,但下面會獨立講Unganged/Ganged模式的差異,還有TLB bug問題。

測試平台
CPU Intel Core 2 Quad Q6600
AMD Phenom 9600
AMD Phenom 9900
主機板 MSI P35 Platinum
技嘉 790FX-DQ6
記憶體 Patriot PDC22G9200ELK(DDR2-1033 5-5-5-16) 1GB x2
硬碟 Seagate 250GB 16MB Buffer
螢幕 BenQ 241W(原生解析度1920x1200)
電源供應器 七盟 1000W
作業系統 Windows XP Professional
顯示卡 NVIDIA GeForce 8800GT(Forceware 169.02)



耗電量

AMD原生四核之戰(下),初代 Phenom 的敗北
AMD實作了一堆省電機制,讓Phenom 9600在待機時的耗電量跟Q6600一樣,但全速時就變高了,高階的Phenom 9900更是誇張,CPU時脈才高200MHz,全速耗電量就多了80W。


測試軟體

AMD原生四核之戰(下),初代 Phenom 的敗北

AMD原生四核之戰(下),初代 Phenom 的敗北

AMD原生四核之戰(下),初代 Phenom 的敗北

AMD原生四核之戰(下),初代 Phenom 的敗北
PCMark、Sandra、NuclearMC測試結果蠻一致的,Phenom 9600比Q6600慢了約15%,整數和浮點數運算輸很多,可能因為Phenom這部分跟K8幾乎一樣。不過Phenom 9900就勉強能和Q6600打平,整數和浮點運算雖然還是輸,但整體效能已經小勝Q6600。


一般軟體

AMD原生四核之戰(下),初代 Phenom 的敗北
7-Zip已經支援到八個執行緒同時跑,我測了單執行緒和四執行緒的數據,雖然Phenom 9600輸給Q6600,但可以看到Q6600的多核心成長幅度只有3.4倍左右,而Phenom至少都有3.7倍以上。


AMD原生四核之戰(下),初代 Phenom 的敗北

AMD原生四核之戰(下),初代 Phenom 的敗北
影片壓縮的部分我測了XviD和DivX,XviD壓縮比較偏好Intel,Q6600贏了Phenom 9600快20%,但這是Core 2的2.4GHz相對於Phenom的2.3GHz,比起Athlon 64的影片效能,Phenom有非常大的進步。之前Athlon 64在比Core 2時脈高500MHz的情況下,XviD壓縮都還會輸10%以上,Barcelona大改SSE單元果然有成效。而在DivX壓縮,第一次看到AMD可以追上Intel,Phenom 9600和Q6600非常接近。


AMD原生四核之戰(下),初代 Phenom 的敗北
我用Multithread Lame測試MP3壓縮,圖表愈短愈好,仍然是Q6600大贏20%,但和影片壓縮一樣,過去Athlon64和Core 2的差距更大,Phenom的SSE效能有明顯提升。


AMD原生四核之戰(下),初代 Phenom 的敗北
Cinebench是另一個可以切換「單/多」執行緒的程式,跟7-Zip一樣,雖然Phenom 9600/9900都贏不了Q6600,但多核心的成長明顯是Phenom比較好,將近有3.9倍,而Q6600只有3.5倍,原生四核的架構還是有優勢。


遊戲效能

AMD原生四核之戰(下),初代 Phenom 的敗北

AMD原生四核之戰(下),初代 Phenom 的敗北
遊戲效能是完全一面倒,由Q6600領先,就算是Phenom 9900也贏不了Q6600,現在大部分的遊戲都還沒支援到四核心,Intel單一核心的效能較高,獲勝是必然的。


多工效能

AMD原生四核之戰(下),初代 Phenom 的敗北

AMD原生四核之戰(下),初代 Phenom 的敗北
多工效能比的是相對值,當背景有另外一個很操的程式在跑時,前景程式會慢多少。當背景在影片壓縮,Q6600前景的MP3壓縮會慢35%,而Phenom只慢了7~10%,不過7-Zip測試則是兩者相差不大,都是慢8~9%。


若以整體效能來看,Phenom 9600可說是被完封,價格、效能、耗電全輸,效能差距在15~20%,跟過去一樣,多媒體部分依然AMD的罩門,即使Phenom已經大幅強化SSE效能。至於耗電,桌上型跟伺服器不同,Barcelona架構是裝愈多顆CPU愈省電,但桌上型通常是單CPU,而Phenom 9600的耗電量比Q6600高一截,Intel明年的45nm製程可以省電20%,若Phenom再不加強,耗電量部分會輸更大!


超頻極限
Phenom上市前就有一堆謠言說它上不了高時脈,所以我做了簡單的超頻測試,看看Phenom 9600的極限在哪。在未加電壓的情況下,Phenom 9600真的有夠難超,大概外頻220MHz就開始不穩了,勉強從2.3GHz超到令人心酸的2.5GHz。後來我開始狂加電壓,加到1.45V差不多就到頂了,再把電壓加爆也不會更穩了,最後的極限是外頻253MHz,CPU時脈2.9GHz,離3GHz的關卡只差一步。

這是核心、HT、北橋電壓通通提高才硬撐上去的,耗電量已經多了快80W,但至少可以通過Overdrive的穩定度測試,我猜倍頻解鎖的黑盒版衝破3GHz應該沒問題,可是....這未免太難超了吧?Intel Q6600幾乎是無腦直上3.2GHz,看來65nm製程的Phenom時脈上不去的謠言的真實性還蠻高的。


AMD原生四核之戰(下),初代 Phenom 的敗北
超到外頻235MHz的BIOS設定。


AMD原生四核之戰(下),初代 Phenom 的敗北
超頻後的CPU-Z資訊,最後超到2.9GHz。


相對於K8的單核心效能成長
Barcelona架構改了一大票,但相對於K8到底差了多少?可惜現在Phenom只有四核心,而Athlon64最多只到雙核心,沒辦法精確測出兩者多核心的效率差異。不過倒是測單核心的效能差異,只要用「只有單執行緒」的軟體,就能知道Barcelona單一核心的效能比K8快多少。我抓的對照組是Athlon 64 X2 5000+ Black Edition,把倍頻調到11.5x,讓它的時脈跟Phenom 9600一樣,Phenom 9600則開Ganged模式來類比一般雙通道記憶體,然後用7-Zip與Cinebench R10的單執行緒測試來跑,數據如下:


AMD原生四核之戰(下),初代 Phenom 的敗北


從數據可看出,Phenom 9600在Cinebench測試只小贏一滴滴,7-Zip的部分倒是贏了不少,主要效能差距可能來自於L3快取,7-Zip壓縮需要大量的記憶體存取,而L3快取有助於降低延遲。就同時脈的單核心效能而言,Barcelona比K8稍快一些,不過這是整數和浮點運算的部分,SSE的效能前面已經看到了,Phenom相對於K8有非常顯著的成長。


Ganged & Unganged 效能差異
在前一篇Barcelona架構有提到,Phenom內建兩個64位元的記憶體控制器,可以組合成128位元的Ganged模式和雙獨立64位元的Ungagned模式。實際上使用,這兩個模式都有雙通道的頻寬,差別在於Unganged模式可以在單一時脈下存取兩次記憶體資料,有助於多執行緒的效能,Ganged模式則等於傳統雙通道。

在790FX的BIOS裡,玩家也可以自由調整Ganged或Unganged,若BIOS選項較完整的話,Unganged模式下甚至能分別調整兩個通道上記憶體的時序參數。若插上容量不對等的記憶體,比如一條1GB、另一條2GB時,那BIOS就會強制鎖在Unganged模式,只有這個模式支援容量和時序不同的雙通道。


AMD原生四核之戰(下),初代 Phenom 的敗北
BIOS裡可以選擇DCT(DRAM Controller,記憶體控制器)的模式,Ganged與Unganged。


AMD原生四核之戰(下),初代 Phenom 的敗北

AMD原生四核之戰(下),初代 Phenom 的敗北
開啟Ganged或Unganged的BIOS訊息,一個是128位元,另一個64位元,因此有人會誤解Unganged是單通道,其實這兩個模式都算是雙通道!


AMD原生四核之戰(下),初代 Phenom 的敗北
若BIOS選項比較完整的話,Unganged模式可以獨立調整兩個通道(DCT 0和DCT 1)上記憶體的時序。


AMD原生四核之戰(下),初代 Phenom 的敗北 AMD原生四核之戰(下),初代 Phenom 的敗北
CPU-Z的資訊就寫的很準確,無論是Unganged或Ganged模式,CPU-Z一律判定是Dual Channel雙通道。


所以,Ganged與Unganed的效能有什麼差別?大家可參考下面的數據表格,那是Phenom 9600搭配DDR2-800 1GB x2的記憶體,分別開啟Ganged和Unganged的差異。Unganged真的對多執行緒程式有幫助,當7-Zip以四個執行緒同時跑的時候,Unganged可以增加1.6%左右的效能,而Ganged模式則對單執行緒有幫助,可能是實際頻寬較大的緣故。


AMD原生四核之戰(下),初代 Phenom 的敗北


不過Unganged和Ganged的效能差異非常小,實際使用幾乎可以忽略不計,不妨把Unganged看成彈性極高的雙通道。其實現在玩家可能會覺得2GB記憶體不夠爽,4GB要裝64位元OS又很煩,不妨裝個1GB+2GB開Unganged雙通道,多執行緒的效能還更好,一舉多得!


TLB 臭蟲到底是什麼?
啊!TLB bug....這是Phenom最近鬧最大的新聞。AMD承認在B2 Stepping的Phenom中存在一個臭蟲,B2版就是2007年發售的所有Phenom,這個Bug被AMD標示為「勘誤 298」,俗稱TLB臭蟲。TLB(Translation Lookaside Buffer)是CPU內部管理記憶體的快取,老實說我看不太懂TLB bug的官方說明,大意是在存取TLB特定位址的資料時會產生一個空窗,於是在L3快取寫入錯誤的資料,可能會在四核心完全滿載時造成系統當機。

先不管那有如天書般的原因,AMD宣稱TLB bug會發生的情況非常特定而且罕見,但「我個人」認為CPU是電腦的心臟,任何會造成低於100%穩定性的Bug都很嚴重,AMD居然在出貨販賣之後才發現問題也太扯了。AMD明年會出新的Phenom 9550和9650,從硬體修正這個bug,現階段就只能靠軟體來解決,Linux已經有修正版Kernel,Windows的話要請出微軟老大修正有點難,所以AMD與板卡廠合作,從BIOS解決。


AMD原生四核之戰(下),初代 Phenom 的敗北
新版的790FX BIOS都會有這個「Patch AMD TLB Erratum」的選項,開啟就是用BIOS修正,有些主機板可能為了100%的穩定性,會強制開啟並隱藏這個選項。


BIOS的解法就是就是強制CPU不去存取那個特定位址的TLB,有點像硬碟壞軌那樣,標定出來之後就不去動它,但有標定壞軌的硬碟會讓可用容量縮小,Phenom也是類似,TLB會有一部分無法使用,猜猜看這會發生什麼事?沒錯!理論上這會讓Phenom的效能往下掉。AMD宣稱TLB Patch對效能的影響並不大,但從下面的數據來看,只能說AMD未免太樂觀了,依應用程式的不同,TLB會造成效能下降約3~25%,操記憶體的測試有最明顯的衝擊,像遊戲、壓縮等等。

Phenom的效能本來就不好,為了「原本就應該要有的穩定性」還得再犧牲最多25%的效能,只要TLB bug存在的一天,Phenom就不值得購買,初代Phenom都有「感染」,想入手的最好等明年的修正版Phenom 9550和9650。


AMD原生四核之戰(下),初代 Phenom 的敗北


真正的決戰在2008年!

Intel Core 2的推出是Athlon64榮景的結束,AMD只能用一連串的降價來刺激不斷流失的桌上型市場,而龜了一年的Phenom,應該是扭轉這一切的救世主。結果Phenom敗了,Phenom 9600甚至贏不了比它便宜的Q6600,當然也贏不了Intel明年45nm的Core 2製程升級版,這到底是怎麼回事?

原生四核有個屁用?
原生四核的架構沒用嗎?上面的數據可以証明絕對不是,在7-Zip、Cinebench還有多工測試下,可以看出原生四核在多執行緒環境下,明顯比Intel的拼裝四核來的好,我指的不是最終的測試結果,而是「單執行緒 vs. 多執行緒」的效能成長,Intel頂多只有3.5倍的成長,Phenom則是3.8~3.9倍,這還是在程式尚未對AMD四核心最佳化的成績,原生四核絕對是有優勢的,Barcelona架構不差,只是需要高時脈撐出總效能。

單核心效能不足,時脈太低
Phenom單一核心的效能不高,畢竟這部分跟K8相差不大,如果說「多核心總效能」是「單一核心效能」乘上「多核心效率」的話,Phenom的多核心效率很好,但Core 2每個核心的效能實在太強了,即使Phenom拉近了兩者的差距還是不夠。Athlon64和Core 2要達到相同效能,Athlon64至少要快500~600MHz以上,Phenom只要快200~300MHz就可以打平(不過多媒體部分是贏不了了,尤其Penryn還有SSE4加持),但這也代表Phenom必須要比同價的Core 2有更高的時脈,所以最終問題還是製程。

AMD是可以大改K8的單核心架構,再搭配原生四核,但在現有的65nm製程下,耗電量和die尺寸鐵定大大破錶,飛龍保証變大肥龍,所以AMD只能先改伺服器比較需要的原生四核架構,下一代Bulldozer搭配新製程再改核心部分。即使只改一半,Phenom也顯現了AMD在製程上的弱勢,時脈衝不上去、耗電量高,TLB bug更是雪上加霜拖垮效能。


AMD原生四核之戰(下),初代 Phenom 的敗北
AMD在2007年底的分析師說明會中秀出未來的時程表,要到2008年Q2之後才有45nm的Phenom,而直到2009年之前都不會有新一代的GPU了。


2008年決戰45奈米
所以,AMD接下來怎麼辦?大概只能跟現在的Athlon64和Radeon 3800一樣,效能贏不了,就拼價格吧!AMD必須快速轉換到45nm製程,提高Phenom的時脈並降低耗電,重點是縮小製程之後,Phenom的晶粒尺寸會比Intel的拼裝四核小很多,價格優勢更明顯。現在的Phenom就有削價趨勢了,推出才一個月就已經降價多次,主打低價四核心的意圖蠻明顯的(希望不是只為了出清有TLB Bug的CPU),Phenom 9500已經掉到台幣6000左右,其實低階四核還頗有看頭,畢竟Intel仍把四核心列為中高階產品,未來計畫裡最便宜的Q9300還要台幣8000多。若明年的Phenom能比同價格的Core 2快200~300MHz,也就是Phenom 9900賣到Q6600的價格,那飛龍還有機會,但無論高時脈或低價,都要有45nm製程輔助。

可是降價並不是長遠之計(尤其AMD還欠了一屁股債),或許能擋45nm的Penryn一陣子,但2008年底Nehalem出來怎麼辦?這全新架構有比Core 2更高的單核心效能,而且是原生多核架構外加HyperThreading,內建記憶體控制和QuickPath(類似HyperTransport的技術),可說是集Core和Barcelona架構所有優點於一身,再加上成熟的45nm製程,AMD要拿什麼跟它打?


AMD原生四核之戰(下),初代 Phenom 的敗北
2008年AMD就要面對Intel這十年來改變最大的新架構Nehalem,光從規格來看就有夠嚇人了


Fusion可能是AMD短期內最大的希望了,CPU+GPU合體的多核心處理器可望在中低階和筆電市場大放異彩,而且對手還沒有類似產品,只要提早出就一定贏,AMD已經確定要延後R700顯示晶片到2009年,可能想把資源集中在CPU上,希望Fusion不會像Phenom那麼鳥,也希望AMD能再加把勁。最近Intel一直有消息說要推遲45nm CPU的上市,隱隱感覺Intel想走回過去那種慢慢出、躺著賺、高階產品價格胡亂飆的壟斷之路,我想所有人都不想回到那個時代吧?

最後做個總結,Phenom 9500是目前最便宜的四核心,有特殊的賣點,至於其他的Phenom,除非它們比同價格的Core 2快200~300MHz,並解決耗電和TLB的問題,不然四核心還是選Intel吧!
頭推!!

感謝大大如此精闢的解說以及分析
上次看完上集之後 就在等下集阿

看來原生四核還是有它的優點的
希望amd加油!!產生競爭~~
我已經用了很多年的amd 還不想換阿~~

最近amd明顯打不贏intel 所以intel推出新菜的速度也放慢了
不像之前CD-->C2D C2Q衝的那麼快速~~

再次感謝大大精闢的解說阿
感覺不錯啊~

拜托便宜點
太好了,改在01教召30天......
看大哥您的文章真是一種享受
深入簡出的說明讓許多沒機會深入研究的人可以產生新的思考方向
感謝您的分享
AMD多加把勁吧....
我還在等9900上市
我是傻瓜狐狸...對偷懶這件事特別的勤奮 http://www.fox-saying.com
測試辛苦了,寫的真好..很用心的比對了兩大陣營的優劣跟趨勢策略
有些人勇於冒險,死不認錯,好騙難教!聽騙不聽勸.
好可憐的AMD,推出的東西居然連INTEL推出許久的Q6600也沒法幹掉,就算給你超到3GHz,明年的Nehalem一樣出來把AMD壓的死死的,看來ATI要好好賣RV670,才能多少替AMD補貼一點了。
我的天啊,
AMD的隱憂還真多,
偏偏製程方面又要特別倚賴SOI,
產能一直開不出來是AMD最大的痛。

不過我倒是覺得AMD也許需要在架構方面再修改了,
以目前情況而言,
好像不是稍微修改SSE就可以應付了...
看完這一篇之後有一個地方想要請問一下,文中提到的K10可以獨立調整每個核心的時脈
這一部份我看很多關於Phenom測試都只有提到,但沒有實作過,坦白說性能這一部先不要
提好了,獨立調整核心時脈這點個人覺得是原生四核的優勢之一,希望可以看到這一方面的測試~~
看完了上、下集後覺得比起一般雜誌寫得還精彩,只是對k10期待了這麼久卻是這種結果實在令人失望。
AMD的優勢
1.價格
2.功耗

在同時脈底下運作 耗電應是比intel低..

不過這應該維持不了太久..因為
32nm的核心已在intel的roadmap中.

AMD原生四核心良率有待加強
在加上L3 cache在高時脈下運作的問題

雪上加霜...
關閉廣告
文章分享
評分
複製連結