POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: RacingPHT
打印 上一主题 下一主题

R600的shader利用率公开了

[复制链接]
21#
发表于 2009-5-8 17:28 | 只看该作者
R600是不是退市了?
回复 支持 反对

使用道具 举报

22#
发表于 2009-5-8 18:03 | 只看该作者
线程调度资源双方差距不大。这个Eji也分析过了。
R600同时运行的线程数量最多为13056个,芯片寄存器达到1MB。
而G80的最大线程数位12288。
差距大的应该是TA, TF以及ROP。
RacingPHT 发表于 2008-8-15 08:54 PM

想请问RacingPHT大,最大差距不是在shader中,可不可以作为英伟达的1D结构其实是4Dsimd封装的佐证呢?(由于不是硬件实现1D所以效率差距并不大),谢谢~
回复 支持 反对

使用道具 举报

23#
发表于 2009-5-11 14:17 | 只看该作者
想请问RacingPHT大,最大差距不是在shader中,可不可以作为英伟达的1D结构其实是4Dsimd封装的佐证呢?(由于不是硬件实现1D所以效率差距并不大),谢谢~
complexmind 发表于 2009-5-8 18:03


個人意見,全硬體實作的1D scalar array只會讓overhead比現在的4D SIMD更大。
有人說GT300可能會走向4D SIMD x4,大家就走著瞧吧。
回复 支持 反对

使用道具 举报

24#
发表于 2009-5-11 20:50 | 只看该作者
本帖最后由 ic.expert 于 2009-5-11 20:52 编辑

“全硬體實作的1D scalar array只會讓overhead比現在的4D SIMD更大”Overhead指什么?
“4D SIMD x4”为什么乘四?
这写都怎么解释?

其实如果真的要改ALU的话,不是说改就改的,ALU如果改动,整个Arch都得改。Register Bit Length,Thread Scheduler,Data-Transfer Mechanism of ShaderUnit-to-MemoryInterface BUS ,Cache Mechanism等等。所以这个改起来很麻烦,如果没有绝对性能上的提升,一般没有人愿意去改动。Architect   也会考虑自己的乌纱,如果改了以后发现不匹配未来的游戏或是通用计算或是功耗,就是个败笔。譬如NV30。那那哥们的乌纱就别要了
回复 支持 反对

使用道具 举报

25#
发表于 2009-5-13 20:01 | 只看该作者
支持楼主,顶上去 哈哈。。。。
回复 支持 反对

使用道具 举报

26#
发表于 2009-7-7 00:57 | 只看该作者
個人意見,全硬體實作的1D scalar array只會讓overhead比現在的4D SIMD更大。
有人說GT300可能會走向4D SIMD x4,大家就走著瞧吧。
Eji 发表于 2009-5-11 14:17


MIMD目前看来还是行不通, 只不过在G80这代穿越了一回
回复 支持 反对

使用道具 举报

27#
发表于 2009-7-7 00:58 | 只看该作者
线程调度资源双方差距不大。这个Eji也分析过了。
R600同时运行的线程数量最多为13056个,芯片寄存器达到1MB。
而G80的最大线程数位12288。
差距大的应该是TA, TF以及ROP。
RacingPHT 发表于 2008-8-15 20:54


从实际游戏BENCHMARK来看,差距大的应该还是RENDER BACK单元,FSAA能力差距不小
回复 支持 反对

使用道具 举报

28#
发表于 2009-7-9 21:57 | 只看该作者
利用率挺不错的 看样子R600这个构架到头了 A也该换换东西了
回复 支持 反对

使用道具 举报

29#
发表于 2009-10-26 13:59 | 只看该作者
架构有问题
回复 支持 反对

使用道具 举报

30#
发表于 2009-10-26 14:45 | 只看该作者
利用率挺不错的 看样子R600这个构架到头了 A也该换换东西了
sus1227 发表于 2009-7-9 21:57

看来,您的预言错了

因为58xx发布了……
回复 支持 反对

使用道具 举报

31#
发表于 2009-10-26 14:52 | 只看该作者
游戏机和电脑部能一起比的好吧
回复 支持 反对

使用道具 举报

32#
发表于 2009-10-27 20:57 | 只看该作者
学习一下,虽然基本看不懂
回复 支持 反对

使用道具 举报

33#
发表于 2009-11-2 19:51 | 只看该作者
不知道R700的利用率如何???
回复 支持 反对

使用道具 举报

34#
发表于 2009-11-2 23:21 | 只看该作者
要了解利用率,就得抓下当前画面的 shader,然后灌到 shader 分析器里过一遍,不过目前好像没有第三方工具能抓下 dx10 游戏的 shader?
回复 支持 反对

使用道具 举报

35#
发表于 2009-11-3 10:27 | 只看该作者
本帖最后由 mindfury 于 2009-11-3 10:28 编辑



Overall, HD4870 is 145% of the speed of GTX280.

"ALU Cycles" is calculated as the theoretical fillrate divided by achieved fillrate and then multiplied by 10, since HD4870 has a 10:1 ALU:fragment ratio.

This is a set of 519 shaders across 10 games. I've drawn up a number of rules to identify results that are suspect, and therefore rejected, from the set of 4949 total game shaders. A lot of the rules are based on intra-family performance scaling, e.g. HD4870 against HD4850 or HD3870. I've been both too lenient in some cases and too strict in others, which is why the longest shader is only 103 cycles (1170MP/s on HD4870 and 802MP/s on GTX280). I'll prolly spend more time on the rules at some point, particularly as I suspect there are plenty of long shaders that shouldn't be excluded (e.g. some Oblivion shaders appear to be pretty long, e.g. 253MP/s on GTX280 which runs at 625MP/s on HD4870).

http://forum.beyond3d.com/showth ... lu+cycle&page=2
回复 支持 反对

使用道具 举报

36#
发表于 2009-11-3 16:35 | 只看该作者
进来学习吓高深的东西
回复 支持 反对

使用道具 举报

37#
发表于 2009-11-4 13:51 | 只看该作者
进来学习了       很有帮助
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
38#
 楼主| 发表于 2009-11-6 00:17 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

39#
发表于 2009-11-7 00:06 | 只看该作者
利用率都那么高为什么还不如G80
回复 支持 反对

使用道具 举报

40#
发表于 2009-11-7 05:01 | 只看该作者
本帖最后由 mindfury 于 2009-11-7 05:05 编辑
从G94的性能看, 如果是玩游戏, 纯粹的数学运算性能并不是那么重要.
RacingPHT 发表于 2009-11-6 00:17

现在游戏的大方向还是向侧重shader运算方向发展,在farcry和Prey里9600gt性能有8800gt的九成,到了显卡危机和STALKER里9600gt性能就只有8800gt的八成了。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-9 08:25

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表