R600对G80_大家来研究下

loovey · 发表于 2007-4-23 22:44

在底层单元的设计上，NV公司的G80系列应对措施是选择了基于1D标量运算的Scalar ALU来替代传统的Vector ALU。虽然1D的标量单元在利用率上不会出现矢量单元的闲置，但要达到4D SIMD运算单元的运算能力，运算单元的数量和频率都需要提升。也就是说，如果同频的Shader单元，4个1D和1个4D才能基本形成均势。

可以简单的计算一下R600和G80的运算能力，R600具备64个4D+1D的SIMD单元，如果它运行在750MHz下，那么它的理论吞吐能力为：750MHz*64个*（（1+2）*4）FLlops=576Flops/s，而目前的G80DE MIME架构的频率为1450MHz，那么它的理论吞吐能力为：1350MHz*128个*（（1+2）*1）=518.4Flops/s。

从目前的CUDA上的信息来看，G80的Scaler做MUL+MAD运算还不完美，如此看来G80的理论运算能力还要打点折扣，那么即使R600的Co-Issue失效，面对G80，R600在Shader的运算能力上仍旧具有相当大的优势。64*4的架构面对128*1的架构，在目前的显卡应用中显得更加务实，这就是R600坚持继续使用较为传统的矢量运算单元(G80为标量)的原因。

在晶体管的使用上，G80的架构看起来就没那么务实，4个1D的ALU不要要使用4个独立的发射端口，控制和辅助资源也同时需要4份，这比R600的1个4D+1D的矢量运算单元开销高出不少。换言之，同样性能下，R600所需要的晶体管更少，或者说使用同样多的晶体管，在Shader Power上R600会更为强大！

Edison · 发表于 2007-4-23 22:48

现在和R300时代有很大不同了，那个时候我们还可以从寄存器数量约束、shader形态来评论架构的优劣，但是现在掺入了branching这个飘忽不定的因素，事情变得复杂多了，唯一的办法就是跑大量的测试来证明。

只看该作者 · 发表于 2007-4-23 23:03

提示: 作者被禁止或删除内容自动屏蔽

Edison · 发表于 2007-4-23 23:05

R600到底长啥样现在各位都不可能很清楚吧？例如TMU、ROP、shader比率调整能力、分支效率等等。

只看该作者 · 发表于 2007-4-23 23:06

提示: 作者被禁止或删除内容自动屏蔽

Edison · 发表于 2007-4-23 23:09

对架构的衡量有很多标准，例如：实际性能/理论性能，性能/芯片面积，性能/功耗等等。

lillxu · 发表于 2007-4-23 23:12

还有性能/价格:lol: :lol: :lol:

Edison · 发表于 2007-4-23 23:16

原帖由 lillxu 于 2007-4-23 23:12 发表
还有性能/价格:lol: :lol: :lol:

这其实是性能/芯片面积的变体了。

keith9 · 发表于 2007-4-24 00:19

原帖由 来不及思考 于 2007-4-23 23:03 发表

这个问题只有外星人能回答你

未来游戏的趋势肯定是面向高市场占有率的产品优化的。市场=一切。

只看该作者 · 发表于 2007-4-24 00:21

提示: 作者被禁止或删除内容自动屏蔽

harleylg · 发表于 2007-4-24 01:47

原帖由 贵族蓝翼 于 2007-4-24 00:21 发表
初期阶段不看好G8X和MIMD。

和我相反……

帐号		自动登录	找回密码
密码			注册

来不及思考该用户已被删除	3^# 发表于 2007-4-23 23:03 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	5^# 发表于 2007-4-23 23:06 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

贵族蓝翼该用户已被删除	10^# 发表于 2007-4-24 00:21 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
贵族蓝翼该用户已被删除
	回复支持反对使用道具举报显身卡

R600对G80_大家来研究下

浏览过的版块