網路上常有人笑那些2000元的顯示卡叫小強卡,因為3D效能貧弱,卡小小一張看起來不怎麼威,我承認我自己過去有時也這樣想(我對不起大家!)。這些入門卡都是高階卡閹割再閹割、削減再削減,不要說跟高階卡比,就連跟中階卡比都遜了一大截,完全是成本考量下的產物,在一兩百元的價差裡殺的你死我活....

可是新時代的小強....呃,入門卡徹底發威了,不管NVIDIA和ATI是故意切分產品定位,或單純只是來不及放進晶片,GeForce 8和Radeon HD 2000系列的入門卡都具備高階卡所沒有的影片加速新技術。雖然在65奈米製程下,這些影片加速的線路只佔晶圓面積不到10%(約4.7 mm^2),但超暴力的GeForce 8800或Radeon HD 2900沒有就是沒有,哭天喊地也沒用,讓高階卡的玩家搥胸頓足,淚流滿面。在DX10的第一代產品,入門卡終於怒吼了:「THIS IS SPARTAN!(踢)」

(註:在ATI最新的簡報有提到,下一代R700顯示晶片裡,高階卡仍然沒有最強的影片加速技術,看來ATI似乎打定主意要以此切分產品定位。)

所以這篇來個入門顯示卡小對決,撼訊的ATI Radeon HD 2400XT青雲的NVIDIA GeForce 8400GS,這兩張都有很強的影片加速能力,看到底誰的影片播放比較厲害。3D效能留到最後簡單帶過就好,現在DX10中低階卡的DX9/DX10效能都不堪入目,想玩DX9遊戲但沒預算的話,7600GS或7300GT還比較超值。這次的主題是影片加速,仔細介紹一下ATI的UVD和NVIDIA新的PureVideo HD技術,這些技術讓2000元的顯示卡播Full HD影片比20000元的還順,真是太過份了!



本次小PK的主角,撼訊的ATI Radeon HD 2400XT青雲的NVIDIA GeForce 8400GS


可能會有人說2400XT的對手並不是8400GS,其實.....也真的不完全是,因為ATI又開始玩價格夾心策略,為了增加競爭力(?),ATI入門卡的定價都故意和NVIDIA錯開。2400XT的價格約2300元,剛好夾在8400GS(1900元)與8500GT(2700元)之間,ATI最低階的2400Pro就比8400GS還便宜了,但因為我還沒借到2400Pro,而且2400Pro的影片加速功能「疑似」「好像」有一些問題,所以就先以兩邊確定有影片加速的最低階卡來做比較,2400Pro到底有沒有問題,等之後測到了再說吧。


PowerColor HD 2400XT

2400XT的GPU核心是RV610,由高階的R600(2900XT)精簡而來,原本的320個Stream Processor運算單元削到只剩40個,是整個R6xx家族裡最低階的晶片,不過跟之前的入門GPU晶片有點不同,40個SP單元分屬兩個群組,而不像過去都只有一個群組,這或多或少可加強Shader效能,尤其是在DX10的Unified Shader架構下。其他部分如材質存取、後端輸出、記憶體控制器也如預期的削減到最少,都只留一組單元,記憶體匯流排為64位元,沒有R6xx招牌的Ringbus。



撼訊的Radeon HD 2400XT,Low-Profile設計,具備DVI和D-Sub輸出各一。



小小的風扇和小小的散熱片,蓋住GPU和記憶體,如果能做成無風扇、純散熱片的話會更好,撼訊說之後會推出這樣的版本。



卡的正面和背面各有兩顆記憶體,畢竟Low-Profile的空間很小。



記憶體型號為「Hynix HY5RS123235B FP-14」,單顆64MB,時脈700MHz的GDDR3,總共256MB。老實說,入門卡用到GDDR3會不會太奢侈了?而且GDDR3的顯示卡做到Low-Profile,佈線的功力也蠻厲害的。



2400XT支援HyperMemory,可抓系統記憶體給顯示卡用,最高到512MB。



一定要來的2400XT裸照一張。



RV610晶片獨照,65奈米製程,700MHz高時脈,180M電晶體。


青雲 8400GS

如果沒記錯的話,GeForce 8系列中低階發表時,零售的版本最低只到8500GT,8400GS原本只計畫出給OEM廠,做套裝電腦整機販售,不知道是不是因為2400XT與2400Pro上市,NVIDIA也把8400GS拱上零售市場了。8400GS和它老哥8500GT幾乎完全一模一樣,都是用G86核心,16個Stream Processor,核心/Shader時脈、官方公定的記憶體時脈等等,各式規格通通相同,只是把GPU的記憶體匯流排從128位元砍到64位元,讓記憶體頻寬減半。



青雲的8400GS,同樣也是Low-Profile設計,DVI和D-Sub輸出各一。



散熱片只蓋到晶片,因為8400GS用的不是GDDR3,沒熱到需要散熱片。不過,跟撼訊2400XT一樣,如果整張卡只有被動散熱片的話會更好。



雖然NVIDIA公定的8400GS記憶體時脈是400MHz,但青雲為了降低成本,換上APOGEE(華東承啟) WA51162E-37的DDR2,這是3.7ns的記憶體,也就是只有266MHz。記憶體時脈降低會影響3D效能,幸好影片加速的部分沒影響。



8400GS的GPU核心是G86-213,210M的電晶體比RV610還多,可能晶片原生的128位元記憶體匯流排佔掉不少電晶體。而80奈米製程也無法縮小die size,目測就比RV610大了不少。



照例附上8400GS裸照一張。



以入門卡來說,青雲8400GS的用料還算OK。



卡的背面也有兩顆記憶體,加上正面的兩顆,總共256MB。



雖然NVIDIA沒有特別強調,不過8400GS支援TurboCache,把系統記憶體拉進來一起用,總共到512MB。(NVIDIA現在都不強調TurboCache了,大概是因為6200TC慢到想哭,改名成7100GS還是清不掉庫存,大家都把「TurboCache」和「名字很快,速度很慢,效能超爛」連結在一起了。)


以上就是ATI Radeon 2400XT和NVIDIA GeForce 8400GS的外觀介紹,附上一張規格表給大家參考。

2400XT vs. 8400GS規格比較表



顯示卡影片播放硬體加速

影片播放功能是顯示晶片近幾年的主力開發項目,DVD播放的部分已經非常成熟,不太操系統資源,播DVD時的CPU佔用率非常低,所以現在GPU針對DVD播放的輔助,都是以「加強畫質」為主,由於DVD輸出時是480i的交錯畫面(但檔案儲存可以是480p),但現在液晶螢幕或電視很普及,它們只能吃循序畫面的訊源,這中間的去交錯演算法的好壞會影響最後DVD畫質的優劣,尤其一些原本就記錄交錯訊源的DVD會更明顯,比如電視影集或早期的卡通。不過就像開頭說的,DVD播放已經很成熟了,現在GPU播DVD的畫質已經跟高檔DVD家電播放機不相上下。

新的720p、1080p高畫質HD影片才是考驗現在GPU的重點,這些HD影片不僅解析度高,流量也比傳統DVD高了三四倍,純用CPU播放的話一定得用中階以上的Core 2 Duo才能保証順暢,而GPU的「硬體加速」則是把影片解碼播放的工作從CPU轉移到GPU上,降低CPU的需求。這些「硬體加速」的技術就是ATI和NVIDIA各自主打的Avivo HD與PureVideo HD,轉移之後,CPU最低只要用舊Pentium4,甚至Celeron就足以播Full HD 1080p的H.264影片了。

(註:以下部分圖片取自AMD與NVIDIA官方公開的技術簡報)


藍光電影和DVD的比較表,藍光電影不只格式多、解析度高、流量大、附加花樣也更誇張。


Entropy Decode
先不管RGB → YUV的色彩空間轉換,影片壓縮會有三大步驟。首先,壓縮時會找出影片中一些做為基準的畫面,然後其他畫面比對基準畫面,找出之間的差異,影片大部分都只記錄這些差異,而不是記錄一張張完整的畫面,這就是「動態補償」(Motion Compensation)。接下來,原本以空間位置做紀錄的畫面,會轉換成以頻率做紀錄,稱為「正餘弦轉換」(Discrete Cosine Transform,DCT),然後把人眼不敏感的高頻訊號(相當於顏色反差大的地方)濾除。最後剩下來的資料,再用「Entropy Encode」做無失真壓縮,Entropy Encode是數學領域的演算法,它是用出現機率來決定代換資料字串的長短,愈常出現的重覆資料,就用愈短的字串代替,因此達成無失真壓縮的目標。

當影片播放時,上面的三個步驟就倒過來執行。前一代的GPU(Radeon X1000、GeForce 7),針對HD影片的硬體加速都只支援到「動態補償」,其他全留給CPU,因為動態補償運算很接近GPU平行化的本質,對廠商來說最好做。可是最操的其實是Entropy Decode,它是連續字串的比對,跟Zip、RAR那種資料解壓縮很像,計算這種資料CPU會比GPU快,可是播HD影片時仍然要耗費相當高的資源,因為CPU的分支預測機制不太能正確預測Entropy Decode。因此ATI和NVIDIA都決定直接在新一代的GPU裡內建專屬的解碼線路,特別針對現有的HD影片格式做完整解碼,包括Entropy Decode的部分。這些專屬線路除了影片解碼,其他什麼事都不用做,所以效率比CPU高又省電。ATI的解碼線路叫UVD(Universal Video Decoder),NVIDIA則叫新PureVideo HD(VP2 + BSP Engine)。



影片解碼各步驟所佔的CPU,H.264的Entropy Decode是最操的,再來才是動態補償。(註:CABAC、VLC那些是Entropy Encode時所用的演算法;pixel prediction就是動態補償,由差異值計算出完整畫面;freq trans就是iDCT,逆轉DCT轉換,把頻率記錄變回空間記錄。)


NVIDIA PureVideo HD

GeForce 8600/8500/8400新的PureVideo,比GeForce 7多了VP2、BSP Engine和AES128。VP2做動態補償、正餘弦轉換,而BSP Engine負責Entropy Decode,AES128則是解密藍光電影裡的AACS保護。



PureVideo HD分成新舊兩版。舊版的只支援動態補償,其他還是由CPU負責,GeForce 7和GeForce 8800都是用舊版的PureVideo HD。注意,就算是新版的PureVideo HD,也只支援H.264的完整解碼。



有VP2的才支援新版PureVideo HD,從表格可以看到,只有GeForce 8系列的中低階卡才有,而8400GS是其中最便宜的一張。


ATI AVIVO HD(UVD)

ATI的UVD跟NVIDIA的VP2類似,但它可以完整解碼兩種格式,VC-1和H.264。



ATI Radeon HD 2600/2400的UVD(Avivo HD)才支援Entropy decode的解碼,前一代的Avivo還不支援。注意,支援Avivo HD不一定就有UVD,比如2900XT就支援Avivo HD,但它「並沒有」內建UVD,因為UVD算是Avivo HD裡的一個技術,2900XT有支援Avivo HD所包含的其他視訊技術,所以.....shit,煩死了!這些廠商的命名策略是不是故意來混淆消費者的?



跟NVIDIA的VP2/BSP Engine相比,ATI UVD多支援VC-1格式的Entropy Decode。但有ATI UVD的顯示卡跟NVIDIA類似,都只有中低階卡才支援,2400XT是其中比較便宜的。


測試方法
常有人以為PureVideo HD與Avivo本身就是解碼器,其實它們都只是「解碼技術」,要啟動它們,解碼器廠商得跟GPU廠商合作,必須「解碼器」、「驅動程式」、「顯示晶片」三方面都支援才能啟動,目前能同時支援UVD和PureVideo HD的只有Cyberlink PowerDVD Ultra裡的解碼器。



測試時是用PowerDVD Ultra零售版,加上最新的Patch,測試環境是Windows Vista Ultimate。



PowerDVD Ultra的影像設定裡勾「啟用硬體加速」,就可以啟動UVD和PureVideo HD。



X-Men 3是我選的測試影片之一,H.264壓縮,尖峰流量約40Mbps。雖然還不是最高(最高的是Transporter 2的預告片),但也已經很少見了。



King Kong是第二個測試影片,VC-1壓縮,尖峰流量約30Mbps。附帶一提,King Kong這部片的畫質很好。



播放影片CPU佔用率的記錄方法是用Windows內建的「perfmon.msc」,記錄1分40秒內的平均與最高CPU佔用率,平均值是看出硬體加速的能力,最高值則不能超過100%,因為這就代表影片播放時會有延遲。兩者都是愈低愈好。


測試平台
CPUIntel Core 2 Duo E6700 @1.6GHz(266 x 6)
主機板MSI P35 Platinum
記憶體Kingston KHX9600D2K2(DDR2-886 5-5-5-16)
硬碟Seagate 250GB 16MB Buffer
螢幕BenQ 241W(原生解析度1920x1200)
電源供應器七盟 1000W
作業系統Windows Vista Ultimate
驅動程式ATI Catalyst 8.39 RC4
NVIDIA Forceware 162.18


測試結果
為了讓硬體加速的效果更明顯,我把測試平台的Core 2 Duo E6700降到6倍頻,只剩1.6GHz,先不開硬體加速,純用CPU播放做對照組,然後再開啟UVD和PureVideo HD看加速的效果,而為了增加刺激性,GeForce 8800GTX也一併加入測試,看高階卡也有被打趴的一天。以下就是測試結果:



首先是H.264壓縮的X-Men 3,若沒有開硬體加速,CPU佔用率最高已經接近100%,影片播起來也不太順,開了硬體加速後,2400XT和8400GS的表現都非常好,兩者相差不大,平均都只有15%左右,最高都還不到30%,非常順暢。至於8800GTX的硬體加速就蠻爛的,最高都還吃到80%,雖然說還是很順,但播影片時就不能做別的事了。



再來是VC-1壓縮的King Kong,VC-1本來就不是很操,純軟體播放大約佔60%。開了硬體加速後,8800GTX和8400GS差不多,可見新的PureVideo HD對VC-1的Entropy Decode無效,但至少還有動態補償的加速效果,平均大約降到35%左右。至於2400XT的表現就超好,平均降到14%,最高才21%。



kwpt網友提到想知道硬體加速時的耗電量,我覺得真的是超棒的idea,謝謝kwpt,我自己都忽略這個問題了,所以這裡補測一下。測試平台在降頻之後,待機的耗電量約143W,而從測試結果來看,用CPU播放時上升到160W左右,但開啟硬體加速之後就有明顯的省電效果,尤其是2400XT,只上升了2W就可以播放H.264的HD影片了(在影片流量最高的時候);8400GS稍差一些,但相較於CPU軟體解碼仍然有10W左右的省電效果。這些入門卡的TDP都極低(低於40W),就算全速跑也比CPU省電,何況硬體加速只用到GPU的一部分功能,自然就更省電了。老實說,我猜到純硬體線路可以有省電效果,但沒料到ATI的UVD有這麼出色的表現。


ATI UVD略勝一籌
就影片加速的能力來說,2400XT明顯比8400GS好,不過兩者的H.264解碼能力幾乎一樣,差別只在VC-1格式。幸好VC-1不算很操,而且8400GS仍然有基本的加速效果,只要CPU別太差,8400GS要順暢播放VC-1的HD影片並不難,只是2400XT的VC-1加速能力就更勝一籌了,可以搭配更低階的CPU,當然,2400XT的價格也較高一些。

整體來說,2400XT的UVD比8400GS的PureVideo HD強,而且2400XT還內建HDMI,不用從主機板或音效卡接線就可以輸出視訊和音訊,若想組一台HTPC(Home Theater PC,用電腦當家庭劇院播放機)播影片的話,我會比較推薦2400XT,雖然全速耗電高一些,但差距很小。如果預算不太夠,想少花個四五百元,或是有NVIDIA品牌情結的話,那8400GS也是很不錯的選擇。

講H.264、VC-1、HTPC、HD影片好像很遙遠,其實H.264並不是藍光光碟裡才有,Apple Quicktime的1080p預告片用的就是H.264,網路上也有很多H.264壓的動畫,只要用PowerDVD Ultra的解碼器來播就有明顯的加速效果。至於VC-1就真的在HD DVD光碟裡才比較常見了,但現在XBOX 360的USB外接HD DVD光碟機只要幾千元,直接接PC也能播HD DVD電影,不一定要接XBOX 360。要享受Full HD 1080p,其實並不那麼遙不可及。



3D能力 & 結語

項目撼訊2400XT青雲8400GSNVIDIA GeForce 8500GT
3DMark05(1024x768 / no AA/ no AF)477225774684
3DMark06(1280x1024 / no AA/ no AF)212212422279
Prey(1024x768 / no AA / no AF)312028
FEAR(1024x768 / no AA / no AF)332949
FEAR(1024x768 / 4x AA / 8x AF)151129
COH(800x600 / High / no AA / no AF)44.722.526.9
HL2:Lost Coast(1024x768 / no AA / no AF)48.6730.9643.99
耗電量(待機)174174172
耗電量(全速)197191193


最後附上3D效能的測試,2400XT的價格高了不少(在2000多元的定位裡,差400元就差很多了),所以3D效能大勝8400GS是必然的,當然,更貴的8500GT就更快了。但無論2400XT或8400GS玩遊戲都只能開1024x768,想開AA反鋸齒就真的是想太多,DX10就更別妄想了,現在跑DX10遊戲連GeForce 8800都會lag。若預算不到3000元,而又想讓DX9遊戲效能快一點的話,7600GS或7300GT GDDR3版會比較好,可是它們的H.264影片播放性能就超差,差到可以叫做硬體減速卡,開了「硬體加速」影片播放反而會更不順。

在過去,入門卡都等於高階卡的閹割版,不是閹掉「小」地方,而是幾乎頸部以下全部切除,所有效能和功能一律連降五級,但2400XT和8400GS是ATI和NVIDIA第一次讓入門卡享有更好的影片功能。2400XT和8400GS都足以播放新世代的藍光電影,從測試結果來看,對CPU的要求大概一顆P4 Celeron等級的就夠了。除非未來UVD和新PureVideo HD下放到內建顯示的主機板上,不然真的沒有更好的HTPC方案了。如果你不太打電動,喜歡整天看片,到處抓思路高清檔案,那2400XT和8400GS就是最好的影片播放卡!


最後我只有一個抱怨:為什麼GeForce 8800和Radeon HD 2900沒有?(怒)


ps.如果想更好的「利用」PowerDVD的解碼器,可參考這篇文章