原帖由 大死人花 于 2006-11-17 11:27 发表
如题,之前的XB360的C1只是简单的把US分为3组,我觉得这样的话,那PS/VS比例无疑就是2:1 或3:0,US的优势跟本没发挥出来。
到了R600这代会怎么样呢?很久前听说4US一组(正好和16TMU,16ROP对应),如果这 ...
原帖由 来不及思考 于 2006-11-17 12:01 发表
http://topic.expreview.com/2006-11-09/1163061761d1465_5.html
偷了后腾大叔一张图 :p
原帖由 shu0202 于 2006-11-17 13:01 发表
认为4D+1D的架构效率不如纯1D是胡说八道。G80的资源利用细节有不少模糊的地方,NV是不会讲的。也许到G85的时候,我们能知道G80的设计在哪方面作了妥协。
原帖由 niwei 于 2006-11-17 14:22 发表
G80线程分配问题是一个不可回避的事实
原帖由 皓龙 于 2006-11-17 14:23 发表
whyw00t)
原帖由 来不及思考 于 2006-11-17 14:20 发表
看来你对渲染体系的了解还有待加深
原帖由 来不及思考 于 2006-11-17 14:24 发表
这话首先应该对R520或R580说
原来相对于G7X,多执行诸体系革新得更彻底的R5XX的线程分配问题也是一个不可回避的事实
原帖由 niwei 于 2006-11-17 14:25 发表
square,几个月没动你筋骨骨头痒了是不:mad:
原帖由 皓龙 于 2006-11-17 14:28 发表
看来你的恶习始终难改w00t)
原帖由 来不及思考 于 2006-11-17 14:32 发表
说过N遍了,太简单了,4个标量可以当一个矢量用,而且这个合成在G80上是免费的
但1个矢量就永远不能分成4个标量
首先这在指令执行效率上就有本质区别,因为流水线中的状况是很复杂的,最基本最“细致”的 ...
原帖由 大死人花 于 2006-11-17 14:55 发表
为什么G80 4个标量当一个矢量用是免费的?
如果是一个4D矢量,那G80的执行能力不就减到原有的1/4了么?
另外R600的5D+1D比R580的4D+1D多了什么?
原帖由 fineday 于 2006-11-17 15:00 发表
:wacko: 4个1D合并成一个“4D”难道还不是免费的……
原帖由 大死人花 于 2006-11-17 14:55 发表
为什么G80 4个标量当一个矢量用是免费的?
如果是一个4D矢量,那G80的执行能力不就减到原有的1/4了么?
另外R600的5D+1D比R580的4D+1D多了什么?
原帖由 来不及思考 于 2006-11-17 15:04 发表
不是4个当一个用,而是1个标量单元用4个周期来完成
期间造成的延迟Gigathread完全可以掩藏,所以说是免费的
原帖由 来不及思考 于 2006-11-17 15:09 发表
C1就是4D+1D
R600继承下来完全不奇怪哦
原帖由 来不及思考 于 2006-11-17 15:11 发表
这个问题比4D SIMD流水线所面临的困扰要小得多
原帖由 来不及思考 于 2006-11-17 15:14 发表
tex fetch那种规模的延迟都能掩盖,相比之下这些算术指令实在不算什么
G80的问题根本就不在于效率,这点我现在就敢保证G80绝对可以有效率优势
G80的问题是执行能力比R600不如
原帖由 ghrs2010 于 2006-11-17 15:11 发表
请看原文,他说的是5D+1D
原帖由 ghrs2010 于 2006-11-17 15:08 发表
非常好奇地问一句:5D是什么玩艺?
原帖由 shu0202 于 2006-11-17 14:16 发表
多数情况下4D比1D的效率要好得多。至于架构的灵活性也只能是在现有工艺局限性下讨论。我想NV可能是想打造一个“彻底的US”架构,所以把空前的灵活性放在了优先考虑的地位。但是理论上讲,4D并不是不灵活。如果设 ...
原帖由 ghrs2010 于 2006-11-17 15:16 发表
问题在于效率和资源往往是矛盾的
原帖由 zl841226 于 2006-11-17 16:41 发表
某人说,R600最多应该可以扩展到256个US........也就是和C1一样,16US per bank.....................:huh:
原帖由 来不及思考 于 2006-11-17 15:04 发表
不是4个当一个用,而是1个标量单元用4个周期来完成
期间造成的延迟Gigathread完全可以掩藏,所以说是免费的
原帖由 来不及思考 于 2006-11-17 20:03 发表
SIMD的特点就是指令发射数和执行能力的不对等
G80在很大程度上粉碎了这个障碍,相对于R600,这些多出的控制指令开销可以说是免费的
原帖由 来不及思考 于 2006-11-18 03:02 发表
G80好玩的地方在于:很少有人理解这个新体系的真正含义
这也正好
我等着看工艺壁垒被粉碎的那天
原帖由 leo8008 于 2006-11-18 02:52 发表
ringbus就是一个明显的为了效率而接近画蛇添足的玩意。
试想r520若是r580的无rb版本(反正晶体管也差不多),g7X系列还能这么轻松么?若rv570缩到2.9亿呢?
原帖由 ghrs2010 于 2006-11-18 07:04 发表
工艺壁垒是对等的吧,如果R600做到256US呢?
好吧,那个某人就是我
另外,个人认为R600很难简单地认为就是C1的方法增强,
不过要说两者没有关系也不至于(所以我觉得思考兄稍微有一些低估的味道,至于Leo大说 ...
原帖由 Eji 于 2006-11-17 16:50 发表
主要都是所謂的overhead....
1D可以帶來100%的使用率,但是結合的時候有overhead、增加的control也是成本,所以有做co-issue。
4D的話普遍來說就是70%上下,所以那個+1D自然是有其必要。
但是話說資源 ...
原帖由 来不及思考 于 2006-11-17 16:55 发表
R600可以有类似R520-->R580一样的三倍能量增强
而G80的shader设计时钟目标是接近Northwood P4的极限
看来双方都未完成热身
原帖由 来不及思考 于 2006-11-18 14:29 发表
G80的shader array,时钟设计目标是northwood P4
如果R600不等同的增加辅助资源而只添加ALU到256,很难想象能与之对抗
原帖由 fineday 于 2006-11-18 21:13 发表
:p 256US?
对了,CF不是能到256way么?怎么Quad SLi这么久了,连个4way的都没影子?
原帖由 samsung 于 2006-11-19 00:53 发表
Northwood ??? 3GHz 750MHz X4 ??????w00t)
原帖由 epu2000 于 2006-11-19 02:23 发表
:blink: 那是说G80只要换换工艺就能提升至少1倍的效能?
原帖由 来不及思考 于 2006-11-18 14:29 发表
G80的shader array,时钟设计目标是northwood P4
如果R600不等同的增加辅助资源而只添加ALU到256,很难想象能与之对抗
原帖由 killpmp 于 2006-11-19 08:35 发表
变换工艺后,不用增加Stream Processor的数量,只要让它频率翻一倍,就等于又多了128个Steam Processor
当然其它东西也得跟上去,比如显存总带宽得增加上去
原帖由 来不及思考 于 2006-11-19 13:20 发表
意思是说,NV设计Stream Processor Array的设计思路是完全错误的,那个2.X GHz的设计指标完全是空中楼阁,以后的工艺也不可能达到,NV又完全造就了一个废物
是么
原帖由 ghrs2010 于 2006-11-19 13:37 发表
我对于G80的评价一向正面,然而实话实说,我并不认为这一架构在当前的工艺水平下具有绝对的统治力
原帖由 fineday 于 2006-11-19 13:40 发表
:p 您就直说ATi永远比NV牛不就得了?
原帖由 来不及思考 于 2006-11-19 13:42 发表
如果考虑到R600本身的设计,可以认为从工艺进步中所受到的益处,肯定不如G80那么多
实际上,ATI根本就是情报战的失败者,等下我开贴来讨论一个类似的有趣话题
原帖由 ghrs2010 于 2006-11-19 13:46 发表
R600能够生存到架构频率极限的那一天吗?
还是说G80可以频繁调整制程?
原帖由 来不及思考 于 2006-11-19 13:52 发表
G80保持原来的那些外星人工艺,制程用90NM就可以达到70%以上的频率指标
原帖由 来不及思考 于 2006-11-19 13:55 发表
频率够高的话,应该还是需要那个玩意
原帖由 killpmp 于 2006-11-19 13:50 发表
问题是现在需要更先进制程的偏偏是AMD图形部
如果R600用90nm来做会如何??根本就不可想象!
G80如果用同样的80nm就可以做到SP频率翻倍——当然这不是我说的,我什么都不知道:unsure:
G80是少量基础资源很 ...
原帖由 来不及思考 于 2006-11-19 13:52 发表
G80保持原来的那些外星人工艺,制程用90NM就可以达到70%以上的频率指标
原帖由 来不及思考 于 2006-11-19 13:52 发表
G80保持原来的那些外星人工艺,制程用90NM就可以达到70%以上的频率指标
原帖由 来不及思考 于 2006-11-19 14:17 发表
有什么问题? w00t)
如果NV不惜代价的话? w00t)
原帖由 来不及思考 于 2006-11-19 14:17 发表
有什么问题? w00t)
如果NV不惜代价的话? w00t)
原帖由 samsung 于 2006-11-19 14:24 发表
花錢請IBM代工w00t)
原帖由 来不及思考 于 2006-11-19 14:11 发表
后一句话可以收回去
"白银天堂",虽然是比较俗的名字,但后续一系列计划都已经展开了,NV都有参与,甚至是POWER6的后续小白
多的不用我说了吧
原帖由 来不及思考 于 2006-11-19 14:11 发表
后一句话可以收回去
"白银天堂",虽然是比较俗的名字,但后续一系列计划都已经展开了,NV都有参与,甚至是POWER6的后续小白
多的不用我说了吧
原帖由 来不及思考 于 2006-11-19 14:12 发表
貌似R5XX时代没有见你这么说过 :p
原帖由 linwu1 于 2006-11-19 14:36 发表
R600只有16个ROP,是不是说它的高分抗锯齿能力会不如G80?
欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |