POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Eji
打印 上一主题 下一主题

最近越看越有趣的R600 vs G8x

 关闭 [复制链接]
头像被屏蔽
61#
发表于 2008-6-25 23:53 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
62#
发表于 2008-6-25 23:58 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

63#
 楼主| 发表于 2008-6-26 00:03 | 只看该作者
原帖由 1empress 于 2008-6-25 23:49 发表
我对这张图有所疑问

我觉得边上是thread scheduler,中间才是TPC

這你就得問NVIDIA啦_A_ 這是他們給的圖....
回复 支持 反对

使用道具 举报

64#
发表于 2008-6-26 00:05 | 只看该作者
原帖由 1empress 于 2008-6-25 23:58 发表


可能性很小吧    tsmc的55nm没法冲频率,但成本好看一些,
GT200就算做成55nm,频率冲不高的话,效能也很可疑


话说起来离DX11发布还有1年半,算是还有一次更新高端DX10产品的空间,双方全新设计应该都是留 ...


9800GTX做成55nm后难道频率没有上去?谁说的不能提高频率呢?只是能不能达到你说的冲的程度,那就各人评价标准不同了。

想想G80出来的时候DX10真正发布了吗?所以一年后DX11没有正式发布,但是Demo和显卡先出来也不能说有什么可奇怪的。
回复 支持 反对

使用道具 举报

65#
发表于 2008-6-26 00:12 | 只看该作者
先收藏,接着慢慢看。:loveliness:
回复 支持 反对

使用道具 举报

头像被屏蔽
66#
发表于 2008-6-26 00:20 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

67#
发表于 2008-6-26 00:22 | 只看该作者
如果SP频率异步做倍频的话代价大不大?

比如下一步不做2000SP,而是维持800SP做2倍的频率
回复 支持 反对

使用道具 举报

68#
 楼主| 发表于 2008-6-26 02:29 | 只看该作者
原帖由 单晶硅传奇 于 2008-6-26 00:22 发表
如果SP频率异步做倍频的话代价大不大?

比如下一步不做2000SP,而是维持800SP做2倍的频率


那可能比做2000sp 更大XD
其實到25core這麼大的規模,就可以準備開始考慮在core之間用mesh or ringbus了。
現在4~10core的時候AMD還在用Xbar,上面的數字也是把這算進去了,用mesh or ringbus的話還會省很多。
G80是8x2的雙段、GT200現在是10 x 3 way的雙段crossbar,基本上也是在省。

CELL可是在8core時期就在用ringbus....未來的32core應該八成會用mesh interconnection吧。
Larrabee看起來也是會一開始就用ringbus....

[ 本帖最后由 Eji 于 2008-6-26 02:55 编辑 ]
回复 支持 反对

使用道具 举报

69#
 楼主| 发表于 2008-6-26 02:39 | 只看该作者
原帖由 1empress 于 2008-6-25 22:54 发表
3array x 8way SIM"T"(2x4D ALU with SFU、1D gather &scatter)

是4D  shader ?


底層應該是。
雙方都是4cycle latency的FGMT,但是NVIDIA做到了4cycle latency的gather & scatter、local store和SP對應成8way的8bank,每個bank 2KB....
在4cycle latency內,所有的指令和threading交換完全都沒有成本;反過來說,就是這個4cycle的排序下,底層是幾way的ALU完全沒有任何意義。
所以考慮4cycle latency,我認為最可能的數字就是4D unit。
回复 支持 反对

使用道具 举报

70#
 楼主| 发表于 2008-6-26 02:52 | 只看该作者
原帖由 westlee 于 2008-6-25 23:33 发表
现在就看nv会怎么走了,你觉得nv会拿出“只是为了对抗”的产品吗?

看怎麼去tap晶片啦。

如果他們真的想短期內作出對抗的東西的話,有下面幾種模式:

1. GTX260/280的性能是有點低於預期,但是從架構上看不出來會變這樣。
這種狀況其實比較像是那8~10個3SM版TPC現在還在當2SM版用,所以性能只高一點點而已,Driver看能不能修出一點名堂。

2. 也許G92b其實有GDDR5,去和ATI硬幹性能價格比(老實說我還真擔心現在的GTX260連G92b + GDDR5都打不過);
而GTX260/280完全當成Tesla賣,直到GT200的GDDR5版推出為止。G92b完全是G71的觀念,只有砍結構省電晶體然後靠時脈來補....

3. 完全靠TWIMTBP對抗,大推PhysX + AIseek,靠CUDA的優勢來和AMD周旋。

-------
上面三個預想有可能只有其中一個兌現、也有可能三種都有。

比方說,GTX280/260其實是為了G92b + GDDR5暫時賠錢擋一陣(類似G94推出之前拿G92當8800GT用)、
等到G92b 和GDDR5的搭配驗證結束之後,再來個9900GTX + 9900GT的搭配,勉強能和4870對抗,然後GT200看能不能用GDDR5....
老實說GDDR5 support需要改動的地方並不如想像中地多。

然後PhysX + AIseek是已經在某些presentation上看到了....

[ 本帖最后由 Eji 于 2008-6-26 03:00 编辑 ]
回复 支持 反对

使用道具 举报

71#
 楼主| 发表于 2008-6-26 02:56 | 只看该作者
原帖由 我奏是马甲 于 2008-6-26 02:47 发表
问题是,TSMC都是跳过45NM居多吧。直接上40NM的话,260MM左右做2000SP刚好……问题只是时间而已。

嗯.....這倒是啦。 會跳過45nm嗎.... 55nm的前面也還是用65nm啊....(RV670/G92/G94都還是TSMC 65nm,沒有跳過去)

[ 本帖最后由 Eji 于 2008-6-26 03:00 编辑 ]
回复 支持 反对

使用道具 举报

72#
发表于 2008-6-26 03:29 | 只看该作者
半代工艺很多指标都是沿用上代的
从RV630到RV635可以看出效能长进不大。
G92b现在看起来也差不多如此,而且我很失望G92b没有同GT200一样加入新的电源控制,静置功耗依旧很高。

GT200架构现在看起来如果砍成6TPC的话多半不是G92系对手。
所以可能不会推出此架构的中端产品,改用G92b维持中端。

那么双方能用55nm做的事情已经不多了,GT200b已经知道了,那么至多来款G94b。
而AMD已经全线55nm化了,RV730现在不清楚,多半是原生128bit的RV670,稍微再降一些面积。

考虑TSMC的情况,要年底才有可能有更新的工艺可用,那么硬件层面方面就只有如此了。

能周旋的也就是驱动的优化情况,CUDA的支持与反支持(虽然不一定有行动,但Intel、AMD多少会期待短期内支援CUDA的软体少些;而NV自然期望越多越好),The Way虽然也有意义,但短期内支援厂商数量难以产生变化。
回复 支持 反对

使用道具 举报

73#
 楼主| 发表于 2008-6-26 04:07 | 只看该作者
原帖由 我奏是马甲 于 2008-6-26 03:08 发表


eji……这个低级错误……rv670是55nm啊……何况跳过45nm直接40nm是tsmc自己的意思。

http://publish.it168.com/2008/0328/20080328037701.shtml


噗。|||||||

原帖由 我奏是马甲 于 2008-6-26 03:06 发表
GTX280/260现在不卖或变成火星卡的话,GT200b出来前情况就大了。而且从g92b的情况看来,55nm根本对功耗没有什么帮助,98GTX+居然功耗能秒掉90nm的88GTX,g92都没搞定的状况下GT200把宝都押在55nm上太不明智了。


呃,我"非常"懷疑GT200會有55nm.....其中一點原因是先前西川善司有提到,GT200的3SM TPC用的是custom logic design,不是high-level library....
這代表這個結構如果要換製程會很麻煩。

source:
http://www.4gamer.net/games/050/G005004/20080614003/

 ただし,ここで特筆しておきたいのは,GeForce8/9までのシェーダコアが,汎用の半導体(ASIC)をベースに改良を加えていく設計だったのに対し,GeForce GTX200シリーズのシェーダコアが,CPUなどと同じように一から設計されている点だ。つまり,「汎用ロジック」ではなく,「カスタムロジック」が採用されているのである。
 ベースとなるアーキテクチャ,そして“設計図”がほぼ同じ場合,カスタムロジックを採用すると,汎用ロジックを採用するよりも開発期間が長くかかり,コストも高くなるが,その代わりにより高速な動作が可能になる。もしかするとNVIDIAは,フルプロセスチェンジとなる45nm世代を迎えるまでの間,今回開発したカスタムロジック形成のシェーダコアを流用し続けるつもりで,ロジックを設計し直したのかもしれない。


當然我不知道在哪邊看過G80/G92其中一代也是custom logic design就是了

[ 本帖最后由 Eji 于 2008-6-26 04:13 编辑 ]
回复 支持 反对

使用道具 举报

74#
发表于 2008-6-26 04:31 | 只看该作者
我看法是GT200多半有55nm版本,理由是年内用45/40nm的都是当小白鼠,NV和AMD都还不至于用最高端芯片去尝试。
那55nm就是可用的最高制程(要不就道了歉,然后找英特尔代工去)
而NV也不会想未来半年都看起来没法子应付吧。

每1cm^2的风冷散热极限一般被认为是80W,显然GT200巨大的面积有非常大的余地来应付加压超频增长的功耗,哪怕GT200b也应该足有4cm^2……散热余地非常大。
但是,GDDR3也算是到极限了,这就是另一个理由,为了避免白提升频率,支持GDDR5是必须的。
那反正就要基本重新设计了,所以大可放心的用55nm,而不担心麻烦。

而GT200的中端产品,我又认为至少55nm不会出现,我前面表示了,6TPC的GT200恐怕多半不是G92b的对手,而8TPC的还不如直接用GT200的不良品。
真要中端能和4870竞争,最好的选择是出G94b然后搞9600GX2。
回复 支持 反对

使用道具 举报

75#
 楼主| 发表于 2008-6-26 11:28 | 只看该作者
原帖由 我奏是马甲 于 2008-6-26 04:57 发表
未必。RV670是什么时候出来的?tsmc40nm是什么时候宣布的?到今年11月的话55nm都实用一年,40nm宣布9个月了。年底前一定不能推出太武断了。gt200上55nm面积和770也依然是两个级别,对NV最快的方法是优化好G92的55nm版,出g92b2……解决得了功耗和拱频率的问题,和770还是可以一拼的

至于96GX2当笑话看看可以,即使55nm也有19X左右的面积,双PCB 19XX2的面积对4870?还不如大力气把96GT得到的经验来改进g92,其实更应该说是GT200的中端版GT240。如果240的128SP到160SP能优化到96GT X2的级别,那才有戏看


G92b2.....我是覺得不太可能了,G92b不是什麼天大的bug,那只是overclock到頂了,雖然還能往上衝,但是發熱量成長不允許。
應該是用library兜一兜就出來了。

----
96GX2應該是AIC的點子吧?
回复 支持 反对

使用道具 举报

76#
 楼主| 发表于 2008-6-26 11:39 | 只看该作者
原帖由 我奏是马甲 于 2008-6-26 04:13 发表
就算转制程不麻烦,g92b现在这个状况,明眼人都知道55nm除了减成本带不来太多东西了。
eji讨论下GT200的中端大概性能系数?这点好像比较重要……不过话又说回来,如果GT200的中端做到55nm下300MM内,很难想象性能 ...


不知道耶,和G8x/G9x相比,GT200系的TPC最大的修改就是register file整個double。
但是和高複雜度的share memory相比,其實從32KB擴大到64KB的register file並不會讓我覺得TPC整個會double.....
只是因為SM也增加了一組,TMU沒有加、所以怎麼說都會有個至少1.3倍。

所以如果維持256bit、GT200系ROP的話,4~6TPC的中階版個人是估接近700M。
但其實這規模已經和G92差不多了....讓我猛然看到了NV42 vs G73的往事啊。

所以關鍵變成,3SM版的TPC能不能再現當年G73的風光,可以的話事情就好辦了。
回复 支持 反对

使用道具 举报

77#
发表于 2008-6-26 17:52 | 只看该作者
个人感觉GTX280的游戏性能不佳:mad:    CUDA性能不知道
回复 支持 反对

使用道具 举报

78#
发表于 2008-6-26 20:24 | 只看该作者

回复 79# 我奏是马甲 的帖子

我觉得“9800GTX+功耗秒掉8800GTX”的结果有些可疑,主要是不只这一张卡的数据有出入
有兴趣专门收集一下9800GTX+和9800GTX/G80/9800GX2/HD3870X2的功耗对比测试数据吧。
回复 支持 反对

使用道具 举报

79#
发表于 2008-6-27 10:40 | 只看该作者
非运算单元多过运算单元导致GTX280未能征服CRYSIS:mad:
回复 支持 反对

使用道具 举报

80#
发表于 2008-6-27 14:33 | 只看该作者
原帖由 Eji 于 2008-6-26 11:39 发表


不知道耶,和G8x/G9x相比,GT200系的TPC最大的修改就是register file整個double。
但是和高複雜度的share memory相比,其實從32KB擴大到64KB的register file並不會讓我覺得TPC整個會double.....
只是因為SM也增 ...


45nm才能拯救GT200:shifty:
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-4-10 00:45

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表