NVIDIA 費米架構次世代繪圖卡將定名為「GeForce GTX 470 / 480」

cupidchen wrote:
Fermi並沒有L3...(恕刪)


ECC記憶體也不一定貴很多,市面上也有跟一般記憶體價差不大的可選

L3的部分記錯了,應該是L2,感謝糾正~


至於拿舊產品修改試刀這種事NV已經做過了,GT210.220.240都是把舊GPU加入新DX指令支援的產品

而且費米SP一旦規模縮減,那像Tessellator這些被整合進SP內的相關性能也會等幅縮減,不如向ATI那樣以專用單元附加在GPU內不是很好?

如果要走專用市場的話就該另出專用晶片,這樣想專用/GAME通吃是會遇上很多製程.量產能力跟成本限制的
看來需要上傳一張費米的架構圖會比較清楚



第一張圖片為GF100的完整架構..可以清楚的看到512個CUDA核心(實際上就是流處理器SP),而512個核心分為16組SM(Streaming Muitiprocessor),其中每4組SM加上.一組raster engine.稱為一組GPC陣列(Graphic processing cluster)而GPC陣列算是Fermi的繪圖處理架構..完整的GF100是由4個GPC陣列合併而成,共享768K 的L2 cache..由這張架構圖不難推論日後的低階版本..可能會是2GPCs及1GPC的GF100閹割板

第二張圖片為SM架構組成..由32個SP合併成一組SIMD運算核心每組SM中還用16個Load/Store單元用以存儲Cache或者顯存(DRAM)中尋址數據。最右邊有四個SFU(special function unit-特殊函數單元),可以執行正弦/餘弦等數學或者插值運算。在幾何效能加強方面NV也在每組SM中加入了硬體功能管線稱之為PolyMorph Engine.基本上GF100的做法是在每組SM中準備對vetex processing有幫助的相關指令,舉凡Vertex Fetch, Tessellator, Viewport Transform, Attribute Setup和 Stream Output等部分

從上面架構圖來看圖說故事..由於NV是基於每組SM下對應一組PolyMorph Engine.所以未來閹割版的geometry性能的確是有可能會隨著刪減SM而降低..也就是說高低階晶片效能也跟著不同..這點與ATI目前的作法比較起來ATI的tessellation速度應該高中低都差不多,但是NVIDIA就有可能高階比低階快,並且某些應用下單一的tessellation引擎會有瓶頸。


2.GT210,220,240只不過是由原本支援DX10進而能支援DX10.1..事實上變動部份不多..修改難度不高
但DX10和DX11有著完全不同的Shader架構...事實上無論是修改g92或g200的工程..都不如直接layout新硬體架構來的輕鬆..如果真的dx10的產品能夠稍做修改後就能支援全新的dx11..那nv也不用那麼辛苦一路從去年10月唉打到現在都還拿不出dx11的產品

3.NV畢竟目前主要業務還是在顯示晶片..在G200尚未上市前,NV賴以維生的只有顯示晶片業務..我不認為NV有能力能夠在現行顯示晶片的業務外另闢爐灶..因為一旦失敗.就如同走入歷史.NV沒有能力承擔這樣的風險,所以最安全的作法自然是基於現行業務中去開發新應用,策略一旦成功再另闢新市場.若是市場反應不如預期..也沒關係.因為
也可以當成顯卡來賣.進可攻退可守..這就是為何NV會將兩項不同的商品,卻設計成同樣架構的考量..另外..不可否認的GPGPU也間接的推波助瀾

很多看似不解的設計或策略..如果能夠從廠商本身的角度去思考..其實不難發現..其背後所隱含的意義
eclair_lave wrote:
ECC記憶體也不一定...(恕刪)


Fermi基本上設計是以通用運算卡為主,再將其賦予顯卡任務,最終生成GeForce GTX 470 / 480,
GF100的設計是非常巨大的,但若要閹割出個功能縮減版似乎也不是問題。
比如說,NVIDIA沒有專用的tessellators,他的作法是用每個SM下的Polymorph引擎,在其下增加子集,用那子集來來執行tessellators的任務,這和AMD用一個專門的tessellators單元有所不同,所以變成GF100的tessellators要跟著SM綁在一起,而在GF100的設計上,是每4個SM組成一個GPC,每個GPC擁有128個sp,
原本GF100的設計是512個sp,但最近NV面世的Tesla卡則僅有448個sp,僅少了64個sp,僅閹割了半組GPC,
所以基本上GF100還是保留了相當的向下閹割的可能性。

至少初期可以用Harvesting的方法把一些壞掉的功能屏蔽掉就好,尤其GF100良率甚差,一定有不少。
另一方面,GF100架構過於龐大,要用repairablility的方式多做幾個備用的單元來提升良率似乎有難度。
從良率和晶圓面積來看,命中注定GF100賣價必定驚人。

隨著良率提升,就不需要用Harvesting的方法來出中低階卡了,要做中低階的顯卡,只要設計成一個GPC(128sp)或兩個GPC(256sp)的晶片就好了,從剛發表的Tesla卡來看,要出個192sp或320sp的Fermi也不會是問題,甚至還可以出個64sp的入門卡。

GF100已經是最高級的顯卡了,再上去就沒有了,主要是耗電量的考量,現在GF100一顆芯片已經來到280W,
HD5970透過降低頻率的方法把耗電量控制在294W,就算超頻HD5970還會自動降低工作效能來降低耗能,
現在主板的設計,一張PCIe顯卡的吃電上限是300W(主板75W,6pin75W,8pin150W),再上去主板和電源的穩定性會是個大問題,所以兩個Fermi核心的商品很難面世,好在下半年台積電28mn製程上線,應該也有助於FermiII的生產。

Fermi在通用運算上前進了一大步,在顯卡上則對玩家來說沒太明顯進化。

至於G92和G200,已經被AMD打了一年(還是用HD4000系列來打,HD5000都上了),
僅是製程提升,再做修改向上提升效能的可能性可以說是沒有了,再提升也不可能贏的過HD5000,
除非是作為超低階的入門卡,問題是這部份市場用INTEL和AMD的內顯就吃掉了,怎麼看,G92和G200都應該要退休了,現在能做的就是降價rename慢慢淡出市場了。
悠哉的人 wrote:
反正...夠用就好了...(恕刪)


我也是

不是那種不怕沒錢花 只怕沒命花的人
自刪.................................................
15151515151515
=..=''
0_____0 放空 空 空 空 空...........
個人對NV的Tegra 2比較有興趣
費米就等上市後看效能如何再說吧

這篇文章有專訪NV的老大,有興趣的可以看看
http://news.mydrivers.com/1/156/156156.htm
Core i7 965 + GTX580 Core i5 2400+ 6970 2G
Jones.W wrote:
個人對NV的Tegr...(恕刪)


我比較期待的是費米的售價跟功耗
大部分的玩家,效能可以跟9600/9800 差不多,就夠打打線上遊戲了
問題只是要賣多少以及功耗多少的問題

我可不想那種幾百瓦的怪物卡在我的電腦裡出現....只為了打線上遊戲.....這可夠蠢的了

如果該架構真的可以如此這樣閹割來閹割去.倒是相當期待
只是經驗告訴我,
再好的技術,只要一天沒有正式在市面上販售,一切都只是嘴砲
kyo1213 wrote:
250應該要換成26...(恕刪)


因為G92要繼續RE下去啊~~
看來GF100跟GT200有類似問題,成本建構太高
良率可能會比GT200低(以那張圖來看,GF100 vs RV8xx,GT200 vs RV7xx)
現在問題就是要降低成本,要不然還是會壓著打
功耗問題其實沒那麼重要了,目前是效能跟價格會比功耗問題還要重要
4850,4870,4890也是又熱又耗電,但還是壓著GTX260/280打




Jones.W wrote:
這篇文章有專訪NV的老大,有興趣的可以看看
http://news.mydrivers.com/1/156/156156.htm


這篇真的不錯!一年後再來看看成敗

此外有趣的事

NV想著的是顯卡除了打電動還能做什麼

而大家想著的是不打電動裝顯卡做什麼

關閉廣告
文章分享
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 7)

今日熱門文章 網友點擊推薦!