R600的shader利用率公开了

amitcrab · 发表于 2009-5-8 17:28

R600是不是退市了？

complexmind · 发表于 2009-5-8 18:03

线程调度资源双方差距不大。这个Eji也分析过了。
R600同时运行的线程数量最多为13056个，芯片寄存器达到1MB。
而G80的最大线程数位12288。
差距大的应该是TA, TF以及ROP。
RacingPHT 发表于 2008-8-15 08:54 PM

想请问RacingPHT大，最大差距不是在shader中，可不可以作为英伟达的1D结构其实是4Dsimd封装的佐证呢？（由于不是硬件实现1D所以效率差距并不大），谢谢~

Eji · 发表于 2009-5-11 14:17

想请问RacingPHT大，最大差距不是在shader中，可不可以作为英伟达的1D结构其实是4Dsimd封装的佐证呢？（由于不是硬件实现1D所以效率差距并不大），谢谢~
complexmind 发表于 2009-5-8 18:03

個人意見，全硬體實作的1D scalar array只會讓overhead比現在的4D SIMD更大。
有人說GT300可能會走向4D SIMD x4，大家就走著瞧吧。

ic.expert · 发表于 2009-5-11 20:50

本帖最后由 ic.expert 于 2009-5-11 20:52 编辑

“全硬體實作的1D scalar array只會讓overhead比現在的4D SIMD更大”Overhead指什么？
“4D SIMD x4”为什么乘四？
这写都怎么解释？

其实如果真的要改ALU的话，不是说改就改的，ALU如果改动，整个Arch都得改。Register Bit Length，Thread Scheduler，Data-Transfer Mechanism of ShaderUnit-to-MemoryInterface BUS ，Cache Mechanism等等。所以这个改起来很麻烦，如果没有绝对性能上的提升，一般没有人愿意去改动。Architect 也会考虑自己的乌纱，如果改了以后发现不匹配未来的游戏或是通用计算或是功耗，就是个败笔。譬如NV30。那那哥们的乌纱就别要了

chnhxy2008 · 发表于 2009-5-13 20:01

支持楼主，顶上去哈哈。。。。

niwei · 发表于 2009-7-7 00:57

個人意見，全硬體實作的1D scalar array只會讓overhead比現在的4D SIMD更大。
有人說GT300可能會走向4D SIMD x4，大家就走著瞧吧。
Eji 发表于 2009-5-11 14:17

MIMD目前看来还是行不通，只不过在G80这代穿越了一回

niwei · 发表于 2009-7-7 00:58

线程调度资源双方差距不大。这个Eji也分析过了。
R600同时运行的线程数量最多为13056个，芯片寄存器达到1MB。
而G80的最大线程数位12288。
差距大的应该是TA, TF以及ROP。
RacingPHT 发表于 2008-8-15 20:54

从实际游戏BENCHMARK来看，差距大的应该还是RENDER BACK单元，FSAA能力差距不小

sus1227 · 发表于 2009-7-9 21:57

利用率挺不错的看样子R600这个构架到头了 A也该换换东西了

whitegret · 发表于 2009-10-26 13:59

架构有问题

yamhill · 发表于 2009-10-26 14:45

利用率挺不错的看样子R600这个构架到头了 A也该换换东西了
sus1227 发表于 2009-7-9 21:57

看来，您的预言错了

因为58xx发布了……

flashget · 发表于 2009-10-26 14:52

游戏机和电脑部能一起比的好吧

bepop · 发表于 2009-10-27 20:57

学习一下，虽然基本看不懂

ic.expert · 发表于 2009-11-2 19:51

不知道R700的利用率如何？？？

Edison · 发表于 2009-11-2 23:21

要了解利用率，就得抓下当前画面的 shader，然后灌到 shader 分析器里过一遍，不过目前好像没有第三方工具能抓下 dx10 游戏的 shader？

mindfury · 发表于 2009-11-3 10:27

本帖最后由 mindfury 于 2009-11-3 10:28 编辑

Overall, HD4870 is 145% of the speed of GTX280.

"ALU Cycles" is calculated as the theoretical fillrate divided by achieved fillrate and then multiplied by 10, since HD4870 has a 10:1 ALU:fragment ratio.

This is a set of 519 shaders across 10 games. I've drawn up a number of rules to identify results that are suspect, and therefore rejected, from the set of 4949 total game shaders. A lot of the rules are based on intra-family performance scaling, e.g. HD4870 against HD4850 or HD3870. I've been both too lenient in some cases and too strict in others, which is why the longest shader is only 103 cycles (1170MP/s on HD4870 and 802MP/s on GTX280). I'll prolly spend more time on the rules at some point, particularly as I suspect there are plenty of long shaders that shouldn't be excluded (e.g. some Oblivion shaders appear to be pretty long, e.g. 253MP/s on GTX280 which runs at 625MP/s on HD4870).

http://forum.beyond3d.com/showth ... lu+cycle&page=2

patrick47 · 发表于 2009-11-3 16:35

进来学习吓高深的东西

a6413663 · 发表于 2009-11-4 13:51

进来学习了很有帮助

只看该作者 · 发表于 2009-11-6 00:17

提示: 作者被禁止或删除内容自动屏蔽

boboo3600 · 发表于 2009-11-7 00:06

利用率都那么高为什么还不如G80

mindfury · 发表于 2009-11-7 05:01

本帖最后由 mindfury 于 2009-11-7 05:05 编辑

从G94的性能看, 如果是玩游戏, 纯粹的数学运算性能并不是那么重要.
RacingPHT 发表于 2009-11-6 00:17

现在游戏的大方向还是向侧重shader运算方向发展，在farcry和Prey里9600gt性能有8800gt的九成，到了显卡危机和STALKER里9600gt性能就只有8800gt的八成了。

帐号		自动登录	找回密码
密码			注册

RacingPHT 该用户已被删除	38^# 楼主\| 发表于 2009-11-6 00:17 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡

R600的shader利用率公开了

浏览过的版块