POPPUR爱换

标题: R600的shader利用率公开了 [打印本页]

作者: RacingPHT    时间: 2008-8-15 11:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: shu0202    时间: 2008-8-15 11:27
这只是shader利用效率,Crysis的运算效率为76%还是很不错的,但是实际上还有更多限制因素,整体效率要差很多。
作者: akcadia    时间: 2008-8-15 11:37
原帖由 水银 于 2008-8-15 11:31 发表
CAPCOM还不如只接把XB360上的shader抓来给R600用呢

R600不如XB360的唯一解释就是故意劣化。。。。。。NV the way


AFAN的想法都很奇怪的。
游戏机的优化度能和PC比么?
谁不知道游戏机的游戏都是针对机子做最大优化的。
你居然反过来说
作者: richardlynn    时间: 2008-8-15 16:49
bioshock:4.22!难怪4870在这款游戏上都能虐gtx280了{titter:]
作者: CC9K    时间: 2008-8-15 18:06
利用率都那么高为什么还不如G80?
作者: 只为你存在    时间: 2008-8-15 18:09
原帖由 CC9K 于 2008-8-15 18:06 发表
利用率都那么高为什么还不如G80?


如果用这个数值来算的话G80几乎每款游戏都可以看做是5,G80的硬件设计比R600优秀得多。
作者: 只为你存在    时间: 2008-8-15 18:37
原帖由 ClearText@X2 于 2008-8-15 18:27 发表
可惜的是GTX 280被4870x2虐的不行.{shocked:]{shocked:]{titter:]{titter:]


架构再厉害也拼不过重武器,不过我喜欢A卡,这就是我为什么选择4870而不选择GTX280的原因。
作者: eDRAM    时间: 2008-8-15 18:45
capcom这类日本游戏厂商对shader应该还很陌生吧!主要是接触的时间不如欧美游戏开发商长:charles:
作者: yangzhuo    时间: 2008-8-15 19:07
原帖由 CC9K 于 2008-8-15 18:06 发表
利用率都那么高为什么还不如G80?

所以这只能说明一个问题,R600的问题不是shader架构的问题,是render backend的问题
作者: msmme    时间: 2008-8-15 19:17
R600当年的差是ATI的驱动发挥不了硬件的效能罢了。。。。。。。。

AMD是不会再犯这种问题了。。。{closedeyes:]
作者: headshot    时间: 2008-8-15 19:19
原帖由 msmme 于 2008-8-15 19:17 发表
R600当年的差是ATI的驱动跟不上罢了。。。。。。。。AMD是不会再犯这种问题了。。。{closedeyes:]


驱动?R600现在就不差了么?{titter:]
作者: msmme    时间: 2008-8-15 19:22
原帖由 headshot 于 2008-8-15 19:19 发表


驱动?R600现在就不差了么?{titter:]



新游戏里。。。新驱动的1950GT轻松甩7950GT早成公认的事实。。。


当1950GT换上半年前老旧驱动时,7950GT才有重生的快感。。。{wink:]
作者: 只为你存在    时间: 2008-8-15 19:28
原帖由 msmme 于 2008-8-15 19:22 发表



新游戏里。。。新驱动的1950GT轻松甩7950GT早成公认的事实。。。


当1950GT换上半年前老旧驱动时,7950GT才有重生的快感。。。{wink:]


那是建立在R5XX比G7X优秀的基础之上
作者: AFXIF    时间: 2008-8-15 19:29
这个至少说明了,同频的5D跟2.5倍频的1D到底哪个更厉害。
据说,它们的晶体管消耗差不多。
当然R600指望用64挑战128显然是不行的。
作者: 内个    时间: 2008-8-15 20:05
原帖由 CC9K 于 2008-8-15 18:06 发表
利用率都那么高为什么还不如G80?


{titter:]G8X系列SP频率高太多
作者: CC9K    时间: 2008-8-15 20:20
原帖由 只为你存在 于 2008-8-15 18:09 发表


如果用这个数值来算的话G80几乎每款游戏都可以看做是5,G80的硬件设计比R600优秀得多。


就算5也还是比R600低不少
作者: RacingPHT    时间: 2008-8-15 20:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: 跳海自殺的鱼    时间: 2008-8-15 20:40
理论和实际有误差,关键是R670频率上不去,哎,还有线程处理器啊。。。。。囧啊。。。就1个。。。。。
作者: RacingPHT    时间: 2008-8-15 20:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: avin550    时间: 2008-8-15 22:34
提示: 作者被禁止或删除 内容自动屏蔽
作者: amitcrab    时间: 2009-5-8 17:28
R600是不是退市了?
作者: complexmind    时间: 2009-5-8 18:03
线程调度资源双方差距不大。这个Eji也分析过了。
R600同时运行的线程数量最多为13056个,芯片寄存器达到1MB。
而G80的最大线程数位12288。
差距大的应该是TA, TF以及ROP。
RacingPHT 发表于 2008-8-15 08:54 PM

想请问RacingPHT大,最大差距不是在shader中,可不可以作为英伟达的1D结构其实是4Dsimd封装的佐证呢?(由于不是硬件实现1D所以效率差距并不大),谢谢~
作者: Eji    时间: 2009-5-11 14:17
想请问RacingPHT大,最大差距不是在shader中,可不可以作为英伟达的1D结构其实是4Dsimd封装的佐证呢?(由于不是硬件实现1D所以效率差距并不大),谢谢~
complexmind 发表于 2009-5-8 18:03


個人意見,全硬體實作的1D scalar array只會讓overhead比現在的4D SIMD更大。
有人說GT300可能會走向4D SIMD x4,大家就走著瞧吧。
作者: ic.expert    时间: 2009-5-11 20:50
本帖最后由 ic.expert 于 2009-5-11 20:52 编辑

“全硬體實作的1D scalar array只會讓overhead比現在的4D SIMD更大”Overhead指什么?
“4D SIMD x4”为什么乘四?
这写都怎么解释?

其实如果真的要改ALU的话,不是说改就改的,ALU如果改动,整个Arch都得改。Register Bit Length,Thread Scheduler,Data-Transfer Mechanism of ShaderUnit-to-MemoryInterface BUS ,Cache Mechanism等等。所以这个改起来很麻烦,如果没有绝对性能上的提升,一般没有人愿意去改动。Architect   也会考虑自己的乌纱,如果改了以后发现不匹配未来的游戏或是通用计算或是功耗,就是个败笔。譬如NV30。那那哥们的乌纱就别要了
作者: chnhxy2008    时间: 2009-5-13 20:01
支持楼主,顶上去 哈哈。。。。
作者: niwei    时间: 2009-7-7 00:57
個人意見,全硬體實作的1D scalar array只會讓overhead比現在的4D SIMD更大。
有人說GT300可能會走向4D SIMD x4,大家就走著瞧吧。
Eji 发表于 2009-5-11 14:17


MIMD目前看来还是行不通, 只不过在G80这代穿越了一回
作者: niwei    时间: 2009-7-7 00:58
线程调度资源双方差距不大。这个Eji也分析过了。
R600同时运行的线程数量最多为13056个,芯片寄存器达到1MB。
而G80的最大线程数位12288。
差距大的应该是TA, TF以及ROP。
RacingPHT 发表于 2008-8-15 20:54


从实际游戏BENCHMARK来看,差距大的应该还是RENDER BACK单元,FSAA能力差距不小
作者: sus1227    时间: 2009-7-9 21:57
利用率挺不错的 看样子R600这个构架到头了 A也该换换东西了
作者: whitegret    时间: 2009-10-26 13:59
架构有问题
作者: yamhill    时间: 2009-10-26 14:45
利用率挺不错的 看样子R600这个构架到头了 A也该换换东西了
sus1227 发表于 2009-7-9 21:57

看来,您的预言错了

因为58xx发布了……
作者: flashget    时间: 2009-10-26 14:52
游戏机和电脑部能一起比的好吧
作者: bepop    时间: 2009-10-27 20:57
学习一下,虽然基本看不懂
作者: ic.expert    时间: 2009-11-2 19:51
不知道R700的利用率如何???
作者: Edison    时间: 2009-11-2 23:21
要了解利用率,就得抓下当前画面的 shader,然后灌到 shader 分析器里过一遍,不过目前好像没有第三方工具能抓下 dx10 游戏的 shader?
作者: mindfury    时间: 2009-11-3 10:27
本帖最后由 mindfury 于 2009-11-3 10:28 编辑



Overall, HD4870 is 145% of the speed of GTX280.

"ALU Cycles" is calculated as the theoretical fillrate divided by achieved fillrate and then multiplied by 10, since HD4870 has a 10:1 ALU:fragment ratio.

This is a set of 519 shaders across 10 games. I've drawn up a number of rules to identify results that are suspect, and therefore rejected, from the set of 4949 total game shaders. A lot of the rules are based on intra-family performance scaling, e.g. HD4870 against HD4850 or HD3870. I've been both too lenient in some cases and too strict in others, which is why the longest shader is only 103 cycles (1170MP/s on HD4870 and 802MP/s on GTX280). I'll prolly spend more time on the rules at some point, particularly as I suspect there are plenty of long shaders that shouldn't be excluded (e.g. some Oblivion shaders appear to be pretty long, e.g. 253MP/s on GTX280 which runs at 625MP/s on HD4870).

http://forum.beyond3d.com/showth ... lu+cycle&page=2
作者: patrick47    时间: 2009-11-3 16:35
进来学习吓高深的东西
作者: a6413663    时间: 2009-11-4 13:51
进来学习了       很有帮助
作者: RacingPHT    时间: 2009-11-6 00:17
提示: 作者被禁止或删除 内容自动屏蔽
作者: boboo3600    时间: 2009-11-7 00:06
利用率都那么高为什么还不如G80
作者: mindfury    时间: 2009-11-7 05:01
本帖最后由 mindfury 于 2009-11-7 05:05 编辑
从G94的性能看, 如果是玩游戏, 纯粹的数学运算性能并不是那么重要.
RacingPHT 发表于 2009-11-6 00:17

现在游戏的大方向还是向侧重shader运算方向发展,在farcry和Prey里9600gt性能有8800gt的九成,到了显卡危机和STALKER里9600gt性能就只有8800gt的八成了。
作者: Eji    时间: 2009-11-9 04:02
GT300(該叫GF100了)最後重整shader unit規模,減少register file這點看起來蠻棒的....
單一SM的warp數量有增有減沒錯,但是贅肉刪一刪之後還是讓他們塞進了full-speed DP,然後還有cache hierarchy。
話說很有趣的是,現在GF100的register file和shared memory/L2 cache的總和各自比較起來,幾乎剛好1:1....
Register file = 32bit x 524288 = 2MB
shared memory + L1 cache + L2 cache = 1024KB + 768KB
可以看得出來NVIDIA想求面面俱到啊....XD
(當然32core的Larrabee就有8MB了)
作者: star123    时间: 2009-11-29 13:56
shader的利用率再高,可是shader的性能低还是没用的.
作者: 大碗喝酒    时间: 2009-12-17 09:06
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4