ATI 第一代的 DirectX 10 高階卡賣相實在不佳,晚出半年的 Radeon HD 2900XT 無法超越 GeForce 8800GTX ,頂多小勝 8800GTS,而且高熱、高耗電、低畫質成為 2900XT 的致命傷,各大硬體網站人人喊打。之前有網站專訪 ATI GPU 研發部門的頭,網站很白目的問說 ATI 是不是要放棄高階顯示卡的市場了,ATI 卻回答說我們哪有放棄,兩張 2900XT 明明就比一張 GeForce 8800 Ultra 來的快.....(是沒錯啦,但聽起來怪怪的)。

高階顯卡本來就不是獲利的主要來源,更不是一般玩家敗得起的東西,所以在本月初 ATI 推出中階的 Radeon HD 2600XT 和 2600 Pro,代號 RV630,同時還有代號 RV610 的入門卡 2400XT 和 2400Pro,這些卡都發表好一段時間了,但直到最近才有實際的產品上市。這篇我們先挑中階的2600XT,看ATI是否解決了3D畫質不佳的問題,和期待已久的 UVD 影片硬體加速,還有 2600XT 能否和開賣好一陣子的 GeForce 8600GTS/8600GT 相抗衡。

最重要的,這些新卡的推出,代表 ATI 和 NVIDIA 高中低全產品線到位,我們終於要進入 DirectX 10 的新時代了...嗎?

1.全靜音硬體設計

我們借到的是GV-RX26T256H,這是技嘉非公板設計的 Radeon HD 2600XT 。 2600XT 有 GDDR4 和 GDDR3 兩種版本,我不知道為什麼 ATI 會這樣分產品線,型號相同卻有兩種記憶體規格,這裡借的是 GDDR3 的版本,卡的長度比較短,也沒有外接電源。至於 GDDR4 的版本我只有在 Computex 展場看過,長度拉長許多,也加上 6-pin 的外接電源,看起來不像中階卡,反倒像高階卡。



GV-RX26T256H 的正面圖,這張採技嘉 Silent Pipe II 的全靜音設計,但跟之前的 Silent Pipe II 不太一樣,表面少了一層灰撲撲的鍍鎳,改成比較酷的全黑色。



Silent Pipe II 是單插槽的散熱片,除了電容有挖洞避開之外,整張卡都被散熱片蓋住了。而在擋板處還有三個細細的長條狀開口,幫助對外散熱。



卡的背面,可看到散熱片突出於顯示卡之外,底下還有一條熱導管。



散熱片內埋一條熱導管,正中央接觸GPU核心的部分是銅底,連接熱導管往左右端散熱。大型散熱片加上熱導管,Slient Pipe 2的散熱效果相當不錯。



GV-RX26T256H 的裸體照,這張卡並沒有 6-pin 電源插孔,直接靠 PCI-E 的75W供電。上方的兩個金指是新的 CrossFire,ATI Radeon 2000 系列已經全部換成這種不需要轉接線的顯示卡串連技術。



沾滿散熱膏,看起來有點噁心的 RV630 晶片,怎麼擦都擦不乾淨。 2600XT 的核心時脈為800MHz,採用最新的 TSMC 65奈米製程,而不是 2900XT 所用的80奈米。65奈米讓2600XT比較省電、發熱量比較少、die size 也較小可省錢(比 GeForce 8600 還小,但電晶體比較多)、而且時脈可以拉更高,這對 R6xx 的架構很有用。RV630 有390M的電晶體,比 2900XT 的700M少,但已經比前一代的高階卡(約300M)多了一截。



卡上的記憶體是 Hynix HY5RS123235B FP-14。GDDR3,單顆64MB,時脈700MHz,有效時脈為1.4GHz,總共四顆256MB。



照技嘉的慣例,卡上所有電容通通改成固態電容(真懷疑技嘉工廠內是不是「只剩下」固態電容了?),雖然沒幾顆,但爽度仍然蠻高。


2.DX9/DX10效能測試


二話不說,直接上機看 2600XT 的3D效能如何吧!對照組是 NVIDIA GeForce 8600GTS 和 8600GT,標準測試解析度為1280x1024與1920x1200。既然這是DX10的卡,3D測試也分成DX9和DX10兩個部分,DX10當然是在 Vista 下測。測試的軟體與遊戲如下:

DirectX 9:
3DMark05/06
Prey
STALKER
F.E.A.R
Company of Heroes
Supreme Commander
Half-Life 2 : Lost Coast


DirectX 10:
Company of Heroes DX10 Patch
Lost Planet
Call of Juarez



測試平台



測耗電量的海韻PowerAngel。

CPUIntel Core 2 Duo E6700 @3.1GHz(310 x 10)
主機板MSI P35 Platinum
記憶體Kingston KHX9600D2K2(DDR2-1033 5-5-5-16)
硬碟Seagate 250GB 16MB Buffer
螢幕BenQ 241W(原生解析度1920x1200)
電源供應器七盟 1000W
作業系統Windows XP Professional
Windows Vista Ultimate
驅動程式ATI Catalyst 7.6
NVIDIA Forceware 162.18




測試的對照組,青雲 8600GTS 和 8600GT,都是公板設計,預設時脈。


3DMark05/06

首先是必測的 3DMark,在預設值下 2600XT 大約落在 8600GTS 和 8600GT 之間,但只要開啟4x反鋸齒,2600XT 立刻掉到比 8600GT 還低。


Prey


Prey 是 Doom3 引擎的遊戲,測試驅動程式和 GPU 對 OpenGL 的效能,NVIDIA 之前的 OpenGL 效能非常好,GeForce 8反而有點走下坡了,2600XT 在不開反鋸齒的情況下,1280x1024和1920x1200都能超越 8600 系列,但只要一開反鋸齒,馬上就輸 8600GT。

STALKER

STALKER 支援 HDR 高動態光影特效,主要也是測 HDR,2600XT 完全被打爆了,和 8600GT 的差距有25%。STALKER 在 HDR 下無法開反鋸齒,不然 2600XT 可能會輸更多。

FEAR

FEAR 是測試DX9的整體效能,一樣輸給 8600GT,差距在20%以上,而且一開高解析度或反鋸齒,落差就更大了。

Supreme Commander

SupCom 是測試即時戰略遊戲的效能,這遊戲對 ATI 的支援不錯,2600XT 和 8600GTS 非常接近。

HL2:Lost Coast

Lost Coast 也是測DX9整體效能的好遊戲,和 Prey 的狀況一樣,不開反鋸齒,1920x1200和1280x1024兩種解析度都超越 8600 系列,但只要一開反鋸齒,立刻就比 8600GT 還慢。


Company of Heroes


Company of Heroes 雖然是 NVIDIA 的綁標遊戲之一,但 ATI 的卡卻表現很好,超過 8600GTS 蠻多的。

Company of Heroes DX10 Patch

Company of Heroes 最新的 Patch 之後就支援DX10,不過這Patch問題還蠻大的,特效沒加多少,張數卻狂掉一大堆。測試時是用跟DX9版本完全相同的設定,可是 2600XT 卻變的比 8600GT 還慢了。


Lost Planet DX10 Demo


Lost Planet 是完全針對 NVIDIA 而出,ATI 的卡跑出來的畫面會出錯(雪花都不見了),所以測試成績僅供參考。因為 LP 完全對 NVIDIA 最佳化,2600XT 除了狂輸沒有第二條路了。

Call of Juarez DX10 Demo

和 Lost Planet 相反,COJ 的DX10版本是對 ATI 最佳化(但這遊戲也和 NVIDIA 綁標,只要有錢,廠商一定是牆頭草),好玩的是 2600XT 卻贏不了 8600GT。

耗電量

最後是測耗電量,我沒有那種可以測單卡耗電的特殊裝備,所以這裡的數值是整機的耗電。65奈米的2600XT並沒有特別突出的表現,耗電量比8600略高一點點,可是這裡測的2600XT是只有散熱片的版本,而兩張8600都是有風扇的,所以2600XT 的晶片耗電量一定高於8600,但對比過去 ATI 的90/80奈米產品,2600XT 已經進步很多了。


我本來還想測前兩天出的World in Conflict,因為現在能跑的DX10遊戲沒幾套,每套我都想試試看。結果NVIDIA 把WIC綁標綁的超徹底,用目前 ATI 的Catalyst 7.6驅動程式跑出來連字都變一團亂碼....。唉,ATI 自己的綁標計畫要加油啊!!


整體來說,2600XT的3D效能有點難以評斷,2600XT 好的時候會比 8600GTS 還快,差的時候則比 8600GT 還慢,變成有點看遊戲,雖然這樣寫有點不太負責任,但 2600XT 的效能好壞決定在你想玩什麼遊戲,可惜我無法測試市面上所有遊戲。不過可以確定一點,2600XT 的反鋸齒性能有很大的問題,只要一開AA,2600XT 的效能絕對輸給 8600GT,如果你是玩遊戲會開反鋸齒設定的人,那 2600XT 就不太適合了;如果不常開反鋸齒,那種看你玩什麼遊戲來挑卡吧。


3.依然模糊的AA畫質

ATI 在 Radeon HD 2000 系列加入新的反鋸齒技術,稱為 CFAA(Custom Filter Anti-Aliasing),傳統AA都是抓一個像素點內的取樣做混色,如果像素點在多邊形內部,那混色前後是一樣的,只有在多邊形的邊緣,取樣點分屬不同多邊形時才會有反鋸齒效果,因此傳統的AA只對物體邊緣做反鋸齒。至於 CFAA,它在混色時會抓「周圍」像素點的取樣一起進來做混色,不論有沒有在同一個多邊形內,因此 CFAA 「對整個畫面都有做反鋸齒」。可是抓周圍的像素點做混色,這就是影像處理中的模糊化,之前我測 2900X T時,CFAA 雖然有更好的反鋸齒效果,但畫面也跟著變模糊,相當極端。

在 2600XT 的驅動程式裡,有 CFAA 的 Box、Narrow、Wide 三種過濾模式,「等級」的拉bar是控制一個像素要產生多少取樣,「範例」的原文是「Samples」,也就是反鋸齒時混合多少取樣點。Box 就是原始的反鋸齒,只混合像素內的取樣點,Narrow 和 Wide 則會納入周圍的取樣點。比如Wide模式下,當等級設為4x時,一個像素會產生4個取樣點,但最後則混合8個,額外的4個就來自於周圍像素的取樣點。



2600XT 驅動程式裡的反鋸齒選項,有 box、Narrow-Tent 和 Wide-Tent 三種模式。


很不幸的,Narrow 和 Wide 在混合周圍像素的取樣點時會造成畫面模糊,這是 2900XT 就存在的問題,我本來以為過了兩個多月,ATI 應該會修正或減輕這個問題了。因為之前我測的時候,ATI 正打算做一個「邊緣偵測」(Edge Detect)的新模式,可以有效解決模糊的狀況。可是 2600XT 仍然沒有加入 Edge Detect,而 Tent 也依然模糊。







上面這三張圖,是設定等級4x時,使用 Box、Narrow-Tent 和 Wide-Tent 三種模式的抓圖,可以看出 Narrow 和 Wide 下的文字變模糊了,在材質越細緻的遊戲裡,這種模糊的情況就越明顯。不過畫面模糊也有好的副作用,後面的鐵絲網也有反鋸齒效果了。這是傳統反鋸齒無法產生作用的地方,但因為 CFAA 對全畫面都有效,所以讓鐵絲網這種透明材質也做反鋸齒了。


用Shader做反鋸齒
總結 2600XT 反鋸齒的性能和畫質,可以確定 ATI Radeon HD 2000 全系列應該都是靠 Shader 來做反鋸齒的混色動作。在 Tent 模式下,愈到周圍像素的取樣,顏色加權值就愈低,雖然這需要數學公式運算(像一個中央突起三角形,所以才叫「帳篷」模式),但還是可以從硬體實作。我本來以為只有 2900XT 少了這樣的硬體單元,測完 2600XT 之後有點沒力,因為如果整個 Radeon HD 2000 系列都靠 Shader 來運算反鋸齒的混色,那就代表只要一開反鋸齒,2000系列每一張卡的3D效能都會狂掉,更別提開了Tent模式還會讓畫面變模糊,這讓在意畫質的玩家情何以堪?

GeForce 8就沒這個問題,在意畫質和反鋸齒效能的玩家請先選 NVIDIA,至於 ATI,再觀望一下他們之後有沒有修正吧。


4.UVD影片播放加速

啊啊啊!這是 2600XT 少數能讓我興奮的地方啊!ATI 在發表 Radeon HD 2000 系列時,提到 GPU 將會內建 UVD(Universal Video Decoder),這是針對HD影片的100%硬體加速線路。之前的 Radeon X1000 或 GeForce 7 都只能加速影片的動態補償,GeForce 8600/8500/8400 率先加入 H.264 的 Entropy Decoding 加速,Entropy Decoding 之前都只靠 CPU 解碼,而且非常吃重,8600/8500/8400 靠新的 PureVideo VP2 加速線路,讓 H.264影片播放時的CPU佔用率低到難以想像。

ATI 的 UVD 比 NVIDIA 的 VP2 更猛,不止對 H.264 加速,VC-1 格式也能完整加速。而就跟 GeForce 8800 沒有VP2 一樣,高階的 2900XT 也「沒有」UVD,中低階的2600與2400才有。為了看硬體加速的效果如何,我把測試平台的 Core 2 Duo E6700 降到266 x 6,約1.6GHz而已。



這些硬體加速都要搭配解碼器,訊連的 PowerDVD Ultra 零售版已經支援了,馬上跟台灣之光訊連要了一盒來測。



PowerDVD 的影像設定裡會自動偵測到 ATI Avivo,Avivo 是 ATI 影像相關技術的總稱,UVD 只是其中之一,所以 2900XT 雖然沒有支援 UVD,但仍然有 Avivo...



首先測 X-Men 3 的 Blu-Ray 影片,這是 H.264 壓縮,最高尖峰流量有 40Mbps,用 CPU 軟體解碼,佔用率最高會接近100%全滿,平均也有70%以上,但只要一開 UVD 硬體加速,CPU 立刻降到15%左右,甚至比 8600 系列還低。



再來是測 King Kong 的 HD DVD 影片,這是 VC-1 壓縮。VC-1 不像 H.264 那麼操,但還是頗吃資源,純 CPU 軟體解碼大概平均要吃到50%,用 ATI 的 UVD 也降到只有15%。至於 8600 系列,因為 VP2 不支援 VC-1 格式的 Entropy Decoding,只有動態補償加速,CPU 佔用率只小降到35~40%。

仔細觀察 UVD 的測試數據,會發現它其實對 VC-1 的格式的加速效果比較差,因為 King Kong 的 VC-1 流量頂多30Mbps,而 X-Men 3 的 H.264 尖峰流量卻高達40Mbps,更別提 H.264 本來就比 VC-1 來的操了,可是最後加速過的 CPU 佔用率卻很接近。我猜 UVD 的 Entropy Decoding 應該是特別針對 H.264 設計,但透過一些方式來適應 VC-1 的格式,所以 VC-1 的加速效果會稍差一點。但就算較差,還是比 NVIDIA VP2 只能做動態補償來的強啊啊啊!

無庸置疑,Radeon HD 2600XT 的硬體加速比 GeForce 8600 系列強多了!!而且 2600XT 就像高階的 2900XT,GPU 已經內建 HDMI 1.2 輸出,甚至內建音效 Codec,不需要轉接 SPDIF 音訊進顯示卡,2600XT 自己就是顯示卡+音效卡。HDMI、HDCP、完整的硬體加速,加上平實的價格,2600XT 不僅可用來打電動,也非常適合拿來裝多媒體電腦,享受1080p藍光電影的高畫質。


 
在 Windows XP 的裝置管理員和音訊設定裡,會看到 ATI function driver for HD audio 和 ATI HD Audio output,這是 2600XT 內建音效 Codec 的驅動程式。只要插上隨卡附送的 DVI 轉 HDMI 轉接頭,2600XT 就能直接輸出視訊+音訊。



PowerDVD 播放 X-Men 3,即使 CPU 只跑1.6GHz,CPU 佔用率依然保持在很低的狀態。



PowerDVD 播放 King Kong,ATI 2600XT 的 UVD 對 VC-1 格式的HD影片也有明顯的加速效果。


5.測試總結


ATI Radeon HD 2600XT 和 NVIDIA GeForce 8600 的規格比較表



從架構規格來看,2600XT 明顯弱勢的地方只有後端的 ROP 單元,ROP 負責反鋸齒和 HDR,由於數量少,HDR 的性能會受影響,前面所測的 STALKER 就是最明顯的例子。但在最重要的 Shader 部分,2600XT 有120個 Stream Processor,比8600系列的32個多了一大截,就算 GeForce 8 有較高的 Shader 時脈,加乘之後 2600XT 應該還是能全面勝過 8600GTS 的,只是 2600XT 的 Shade r還要兼做反鋸齒混色的動作,而且記憶體頻寬也輸了不少(難怪 2600XT 會有 GDDR4 的版本),甚至驅動程式的 VLIW 排程可能也還沒完全最佳化,這些都讓 2600XT 無法和 8600GTS 相抗衡。

不過,ATI 其實也沒打算把 2600XT GDDR3 版當成和 8600GTS 同等級的卡,以價位來看,它反而是打 8600GT。若不考慮反鋸齒的效能(買這價位產品的玩家,通常不會開AA),其實 2600XT 並不會輸給 8600GT,而且還有更棒的影片硬體加速。只是想到 GeForce 8600 已經出了快半年,我原本期望 ATI 來個中階大反撲的,就像讓人印象深刻的 X1950 Pro 那樣。

現階段,ATI 和 NVIDIA 兩邊初代的DX10中階卡都讓人不是很滿意,8600GTS 的DX9性能根本比不上前一代的中階卡,2600XT 出來也是跟 8600GTS 打爛泥巴仗,仔細對照現有DX10高階卡和中階卡的性能差距,中間幾乎是一片空白,而那部分應該是DX10中階卡原本要佔的位置才對。這一點蠻奇怪的,因為這些初代DX10中階卡的電晶體數量都超過前一代的頂級卡,可是DX9效能落差卻超大,上次訪問 NVIDIA Purevideo 的頭目時,他說影像加速的電晶體大約只佔10~20%,難道DX10和 Unified Shader 真的得耗用大量電晶體?以致於現有的製程都還不足以造出 die size 符合成本和預期耗電量的中階卡?老實說,我不知道,這些只是猜想。

當然,這些都還是初代的DX10中階卡,等製程再進步一點,DX10大作出多一點,驅動程式成熟一點,或許就會出現能完全踢爆前一代高階卡的DX10中階卡。

最後,附上 Radeon HD 2600 和 GeForce 8600 的架構圖,有興趣深入的自行研究囉!

ATI Radeon HD 2600架構圖


NVIDIA GeForce 8600架構圖



亂入一張01的陋規....呃...是優良傳統



GV-RX26T256H 優缺點
優點:
.全靜音設計
.省電
.C/P值和 GeForce 8600GT 相當
.超棒的 H.264 與 VC-1 影片硬體加速
.內建 HDMI 視訊加音訊輸出,支援 HDCP

缺點:
.反鋸齒效能不佳
.Tent 反鋸齒模式造成畫面模糊