POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 1773|回复: 12
打印 上一主题 下一主题

R600对G80_大家来研究下

[复制链接]
跳转到指定楼层
1#
发表于 2007-4-23 22:44 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
在底层单元的设计上,NV公司的G80系列应对措施是选择了基于1D标量运算的Scalar ALU来替代传统的Vector ALU。虽然1D的标量单元在利用率上不会出现矢量单元的闲置,但要达到4D SIMD运算单元的运算能力,运算单元的数量和频率都需要提升。也就是说,如果同频的Shader单元,4个1D和1个4D才能基本形成均势。

可以简单的计算一下R600和G80的运算能力,R600具备64个4D+1D的SIMD单元,如果它运行在750MHz下,那么它的理论吞吐能力为:750MHz*64个*((1+2)*4)FLlops=576Flops/s,而目前的G80DE  MIME架构的频率为1450MHz,那么它的理论吞吐能力为:1350MHz*128个*((1+2)*1)=518.4Flops/s。

从目前的CUDA上的信息来看,G80的Scaler做MUL+MAD运算还不完美,如此看来G80的理论运算能力还要打点折扣,那么即使R600的Co-Issue失效,面对G80,R600在Shader的运算能力上仍旧具有相当大的优势。64*4的架构面对128*1的架构,在目前的显卡应用中显得更加务实,这就是R600坚持继续使用较为传统的矢量运算单元(G80为标量)的原因。

在晶体管的使用上,G80的架构看起来就没那么务实,4个1D的ALU不要要使用4个独立的发射端口,控制和辅助资源也同时需要4份,这比R600的1个4D+1D的矢量运算单元开销高出不少。换言之,同样性能下,R600所需要的晶体管更少,或者说使用同样多的晶体管,在Shader Power上R600会更为强大!
11#
发表于 2007-4-24 01:47 | 只看该作者
原帖由 贵族蓝翼 于 2007-4-24 00:21 发表
初期阶段不看好G8X和MIMD。


和我相反……
回复 支持 反对

使用道具 举报

贵族蓝翼 该用户已被删除
10#
发表于 2007-4-24 00:21 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

9#
发表于 2007-4-24 00:19 | 只看该作者
原帖由 来不及思考 于 2007-4-23 23:03 发表


这个问题只有外星人能回答你


未来游戏的趋势肯定是面向高市场占有率的产品优化的。市场=一切。
回复 支持 反对

使用道具 举报

8#
发表于 2007-4-23 23:16 | 只看该作者
原帖由 lillxu 于 2007-4-23 23:12 发表
还有性能/价格:lol: :lol: :lol:

这其实是性能/芯片面积的变体了。
回复 支持 反对

使用道具 举报

7#
发表于 2007-4-23 23:12 | 只看该作者
还有性能/价格:lol: :lol: :lol:
回复 支持 反对

使用道具 举报

6#
发表于 2007-4-23 23:09 | 只看该作者
对架构的衡量有很多标准,例如:实际性能/理论性能,性能/芯片面积,性能/功耗等等。
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
5#
发表于 2007-4-23 23:06 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

4#
发表于 2007-4-23 23:05 | 只看该作者
R600到底长啥样现在各位都不可能很清楚吧?例如TMU、ROP、shader比率调整能力、分支效率等等。
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
3#
发表于 2007-4-23 23:03 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

2#
发表于 2007-4-23 22:48 | 只看该作者
现在和R300时代有很大不同了,那个时候我们还可以从寄存器数量约束、shader形态来评论架构的优劣,但是现在掺入了branching这个飘忽不定的因素,事情变得复杂多了,唯一的办法就是跑大量的测试来证明。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-6 20:02

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表