POPPUR爱换

标题: 全球第一个第三方D3D10 shader级别性能测试 [打印本页]

作者: Edison    时间: 2007-7-18 22:29
标题: 全球第一个第三方D3D10 shader级别性能测试
Rightmark 3D 2.0,源代码公开,公开、公平的测试软件。

驱动程序:CATALYST 8.3891 / ForceWare 158.45

原文:http://www.ixbt.com/video3/rightmark2.shtml
作者: Edison    时间: 2007-7-18 22:30
测试包下载:http://www.ixbt.com/video/itogi-video/ini/rmdx10.rar


测试项目截图:
作者: zl841226    时间: 2007-7-18 22:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: phk    时间: 2007-7-18 22:42
可怜的HD 2900XT和废柴没分别
作者: 89度热水    时间: 2007-7-18 22:43
R600的5D SMID很多时候只能跑当1D跑么
作者: 九泉苍月    时间: 2007-7-18 22:46
:funk: 这代核心真的废了
作者: zjlgn    时间: 2007-7-18 22:47
下不了啊。。。。
作者: 来不及思考    时间: 2007-7-18 22:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2007-7-18 22:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: feel囝    时间: 2007-7-18 22:50
X2xxx太恐怖了
作者: 贵族蓝翼    时间: 2007-7-18 22:52
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-7-18 22:52
stream out是涉及到很多因素的吧,是Output Merger来做的话,R600未必有什么优势可言。
作者: 来不及思考    时间: 2007-7-18 22:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: feel囝    时间: 2007-7-18 22:57
还有,想问问大大们,在ps4.0 fire中?Nv和Ati的相差距离也史无前例了吧?到底是什么原因造成Ati的卡在该项的效率极其低下?
作者: Edison    时间: 2007-7-18 23:02
在粒子类性能测试中,R600似乎就是偏弱,ETQW打开柔和粒子后R6XX的性能受到的影响似乎会颇大。
作者: 轨迹    时间: 2007-7-18 23:03
:huh: :huh: :huh: 这次真的是残废了
作者: 来不及思考    时间: 2007-7-18 23:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: AlcatrazX    时间: 2007-7-18 23:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: feel囝    时间: 2007-7-18 23:12
唉,无解了!火星人都哭了
作者: ikinari    时间: 2007-7-18 23:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: zhang8542    时间: 2007-7-18 23:19
原帖由 ikinari 于 2007-7-18 23:14 发表
FX附体了………………


ATI真实青出于蓝啊...............
作者: fineday    时间: 2007-7-18 23:20
:unsure: 我看到50倍变成了平手……
作者: Edison    时间: 2007-7-18 23:21
原帖由 fineday 于 2007-7-18 23:20 发表
:unsure: 我看到50倍变成了平手……

其实可以看到另一个接近50x的结果,不过领先对象对调了。
作者: xxy0    时间: 2007-7-18 23:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: phk    时间: 2007-7-18 23:33
C2D @ 3.5GHz + 8800GTX @ 660/1066MHz,1600x1200 /w 8XMSAA 效果高high













DX10跑得动才是老板,DX10跑不动只能看看
作者: aibo    时间: 2007-7-18 23:35
看这个结果

说r600是nv30II还抬举了他:wacko:
作者: fineday    时间: 2007-7-18 23:39
原帖由 Edison 于 2007-7-18 23:21 发表

其实可以看到另一个接近50x的结果,不过领先对象对调了。

天雨粟,鬼夜哭啊
作者: 明镜止水    时间: 2007-7-18 23:43
居然出现了50X的差距。。。:wacko:
作者: peter.pan    时间: 2007-7-19 00:05
AMD要好好干下去,不要让显卡天价
作者: 宁静在心    时间: 2007-7-19 00:16
P叔也爱好摄影么?
作者: killpmp    时间: 2007-7-19 00:28
比NV3x还NV3x,真的没话说了:wacko:
作者: cool_exorcist    时间: 2007-7-19 00:31
日,指望驱动翻身?看来是没戏了
作者: 来不及思考    时间: 2007-7-19 00:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: killpmp    时间: 2007-7-19 00:47
原帖由 来不及思考 于 2007-7-19 00:45 发表
down来大致看了下,那个PS4.0子项目里面全是if else while之类的东西,难怪R600要挂.... :blink:

那样5D Shader只能当1D来用,真可怜:lol:

NV就是聪明,知道NV4x/G7x架构的分支性能很弱,于是G80就大幅提升分支能力,把Shader干脆都搞成1D,效率怎么搞都是100%,哎

[ 本帖最后由 killpmp 于 2007-7-19 00:49 编辑 ]
作者: 来不及思考    时间: 2007-7-19 00:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2007-7-19 00:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: pharaohs1024    时间: 2007-7-19 00:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-7-19 01:02
如果单纯考虑分支性能的话,R6XX还是比G8x好的。

不过一个架构的关键在于平衡,而这个平衡是要能满足当前和未来一段时间游戏需求的。
作者: feel囝    时间: 2007-7-19 01:03
r600的分支预测机构难道都预测错误?!
作者: feel囝    时间: 2007-7-19 01:05
那么E大和思考说的不就矛盾了么?
作者: Edison    时间: 2007-7-19 01:06
GPU是不存在动态分支预测能力,至少可见的一段时间内都是这样。

但是可以在访问内存动作发生的时候,把另一个等待最长时间的线程调进空闲的shader里跑来提高利用率。
作者: feel囝    时间: 2007-7-19 01:10
对于乱序的架构来说,没有分支预测其效率不会降低吗?
作者: 来不及思考    时间: 2007-7-19 01:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2007-7-19 01:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2007-7-19 01:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: pharaohs1024    时间: 2007-7-19 01:20
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2007-7-19 01:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: pharaohs1024    时间: 2007-7-19 01:27
提示: 作者被禁止或删除 内容自动屏蔽
作者: feel囝    时间: 2007-7-19 01:27
那么,却......?
作者: 来不及思考    时间: 2007-7-19 01:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: damijordan    时间: 2007-7-19 01:54
反正入了R600了~~~成绩还是很汗的~:wacko:
作者: eye2eye    时间: 2007-7-19 09:23
对于声卡来说,这个成绩已经很史无前例了。:unsure:
作者: acqwer    时间: 2007-7-19 09:34
R600是流处理器不是VPU。
作者: zhuu    时间: 2007-7-19 09:36
好样的,ATI,其实不错了
作者: temp0088    时间: 2007-7-19 09:41
ATI的成绩怎么那么差啊?
作者: phk    时间: 2007-7-19 09:52
某些测试中HD 2900XT被GF 8600GTS干掉了
作者: 287381906    时间: 2007-7-19 10:04
原帖由 phk 于 2007-7-19 09:52 发表
某些测试中HD 2900XT被GF 8600GTS干掉了

PHK又来踩A了:wacko: 本来就不济,你还这么落力踩,PHK你也太残忍了(_(
作者: phk    时间: 2007-7-19 10:22
原帖由 287381906 于 2007-7-19 10:04 发表

PHK又来踩A了:wacko: 本来就不济,你还这么落力踩,PHK你也太残忍了(_(


我是替那些2900XT用家深感悲哀啊
作者: akcadia    时间: 2007-7-19 11:04
原帖由 phk 于 2007-7-19 09:52 发表
某些测试中HD 2900XT被GF 8600GTS干掉了



w00t) w00t) w00t)
我刚想说8800GTS本来就大幅度领先``
可是一看到8600GTS````
作者: phk    时间: 2007-7-19 11:06
原帖由 phk 于 2007-7-18 23:33 发表
C2D @ 3.5GHz + 8800GTX @ 660/1066MHz,1600x1200 /w 8XMSAA 效果高high

http://bbs.expreview.com/attachments/month_0707/20070718_67e44d1108 ...







某Q连作弊都忘了更改这些选项,凄凉啊

[ 本帖最后由 phk 于 2007-7-19 11:09 编辑 ]
作者: 明镜止水    时间: 2007-7-19 11:24
呵呵,见怪不怪咯。:p
作者: phk    时间: 2007-7-19 11:27
原帖由 arony 于 2007-7-19 11:23 发表
:lol:
枪不是一次两次了
见怪不怪了


最好让某Q拿640x480 0AA来我的1600x1200 8XAA比,一定是他赢的,自欺欺人蛮凄凉啊
作者: 蒙大拿    时间: 2007-7-19 12:36
我个人偏好使用N卡,但是真心希望A卡好,因为A卡好了我才能够用到更好的N卡
作者: akcadia    时间: 2007-7-19 12:48
原帖由 蒙大拿 于 2007-7-19 12:36 发表
我个人偏好使用N卡,但是真心希望A卡好,因为A卡好了我才能够用到更好的N卡


很快就有INTEL杀入
ATI根本就无关痛痒~
作者: phk    时间: 2007-7-19 14:03
原帖由 蒙大拿 于 2007-7-19 12:36 发表
我个人偏好使用N卡,但是真心希望A卡好,因为A卡好了我才能够用到更好的N卡


做人怎可以双重标准的,矛盾啊:blink:
作者: feel囝    时间: 2007-7-19 14:19
现在时兴:一切皆是幻像!所以P叔,你所看到的同样可能是幻觉!呵呵
作者: lacri    时间: 2007-7-19 16:42
原帖由 phk 于 2007-7-19 11:06 发表


http://we.pcinlife.com/attachment.php?aid=766888&noupdate=yes¬humb=yes

http://we.pcinlife.com/attachment.php?aid=766889&noupdate=yes¬humb=yes


某Q连作弊都忘了更改这些选项,凄凉啊 ...


呵呵,在山那边看到了,太搞笑了某小编。
作者: fineday    时间: 2007-7-19 17:15
:p 转移话题是某人一向的手段啦,见怪不怪了。
面对别人对自己的质疑要么东拉西扯,要么转而区攻击对方,看都看腻了。q
作者: phk    时间: 2007-7-19 17:19
原帖由 fineday 于 2007-7-19 17:15 发表
:p 转移话题是某人一向的手段啦,见怪不怪了。
面对别人对自己的质疑要么东拉西扯,要么转而区攻击对方,看都看腻了。q


某Q作弊也欠学问,被揭穿了丑态,恼丑成怒啊
作者: Yorkchen    时间: 2007-7-19 17:21
PS4.0和VS4.0的效能差了一大段,驱动问题?:huh:
处理单元分配方案不同,不会引起150%以上差距吧,不好说啊,不好说:ph34r:
作者: Yorkchen    时间: 2007-7-19 17:24
又晃了眼,牵涉到高分辨率后X2900分数直线下降,带宽占优,容量接近,频率没区别,ATI干了什么?:crying:
作者: phk    时间: 2007-7-19 17:24
原帖由 Yorkchen 于 2007-7-19 17:21 发表
PS4.0和VS4.0的效能差了一大段,驱动问题?:huh:
处理单元分配方案不同,不会引起150%以上差距吧,不好说啊,不好说:ph34r:


当初选择G80没选错吧:lol:
作者: bfg9000    时间: 2007-7-19 18:23
一面倒啊:funk:

以后形容某些卡就用R600第二好了:lol:
作者: lvmeng007    时间: 2007-7-19 19:55
喜欢A卡,可它好几代了总让人失望啊。其实大家不希望高端卡A强或者N强,感觉这是没什么意义的,用顶级卡的人恐怕也只是那么几个少数米人罢了。我只在乎800-1000块,谁的卡更强些。
作者: 我系高手!    时间: 2007-7-19 21:52
可怜的ati弄个这样子的东西出来,还是等intel尽快来救众多fans吧:wacko:
作者: Yorkchen    时间: 2007-7-19 22:41
原帖由 phk 于 2007-7-19 17:24 发表


当初选择G80没选错吧:lol:

G80丢掉了,用回R520了,原因嘛,主要是太热太大太重....
作者: killpmp    时间: 2007-7-19 23:04
原帖由 Yorkchen 于 2007-7-19 22:41 发表

G80丢掉了,用回R520了,原因嘛,主要是太热太大太重....

R520一样太热太大太重——相对G70而言
作者: zzhang    时间: 2007-7-19 23:06
G80真是值呀。:lol:
作者: phk    时间: 2007-7-19 23:08
原帖由 Yorkchen 于 2007-7-19 22:41 发表

G80丢掉了,用回R520了,原因嘛,主要是太热太大太重....


R520连G70都不如w00t)
作者: kof2003    时间: 2007-7-19 23:12
N卡有N3*低潮后就有68系列的反击,A卡目前有什么资料没有 ?能否进行一次较大的反击呢?
作者: kingofbf2    时间: 2007-7-20 10:16
提示: 作者被禁止或删除 内容自动屏蔽
作者: lacri    时间: 2007-7-20 10:48
原帖由 kingofbf2 于 2007-7-20 10:16 发表
你说可能吗?? 86GTS比x2900xt强? w00t) w00t)  nvidia给了钱....


没什么不可能的,就像9600在某些方面干掉5900一样,千万别把R600想的太NB就行。前几天游戏WIC的测试中,在某个分辨率,8600GTS照样太阳了2900XT。
作者: 来不及思考    时间: 2007-7-20 10:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: 我系高手!    时间: 2007-7-20 11:19
而且这个测试用的fw版本还不是最新的,汗一把啊
作者: RacingPHT    时间: 2007-7-20 11:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2007-7-20 11:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-7-20 13:10
XXXXx ‎(13:09):
it's not final version. When we will do release, we will put sources codes.

目前只有HLSL .fx的。
作者: shiver76    时间: 2007-7-20 13:59
各位老大, 我怎么跑不了这个测试?

Vista下出错误提示, 根本进不去

XP下进得去, 但是点测试无效

[attach]767289[/attach]
作者: Ricepig    时间: 2007-7-20 20:02
原帖由 来不及思考 于 2007-7-19 01:30 发表
"那么"得去问ATI了,我不知道 :charles:

float3,float4,一堆一堆的,居然也赢不了

这种东西在分支里吃亏更加大
因为如果NV的分支预测出错,清空缓存重读是float的话,ATI就是float4
作者: 来不及思考    时间: 2007-7-20 21:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: flymop    时间: 2007-7-20 21:19
FT啊
这哪是FX附体
这明明不是当年的S3么
作者: Ricepig    时间: 2007-7-20 22:10
原帖由 来不及思考 于 2007-7-20 21:08 发表


GPU没有分支预测

上面的代码在ATI上同样很吃亏,其一是5D没用全,而NVidia可以全速跑
第二是跳转时的Cache不命中的代价,ATI大大高于Nvidia
作者: 来不及思考    时间: 2007-7-20 22:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-7-20 22:35
原帖由 来不及思考 于 2007-7-20 22:14 发表


我不知道你说的cache miss是什么意思,再说一遍,GPU没有分支预测

科普一下,所谓分支预测,是指预测当前执行代码的下一条或者下几条代码,并与当前代码交叠执行,一旦预测失败,浪费的是处理器执行时间。
而Cache不命中是另一种情况,当前内存相对Cache比较慢速,并且总线位宽超过指令位宽,因此处理器倾向于每次不光取当前指令到Cache,而是把前后若干条指令都取到Cache。一旦Cache不命中(if这种分支造成),处理器需要再一次从内部存储器里读取一块指令(而不是一条指令),这时也浪费处理器时间,但是主要是多次内部存储器读取中的延迟和读取时间。
处理器和内部存储器在CPU框架下是CPU和内存,在GPU下是GPU和显存,over

[ 本帖最后由 Ricepig 于 2007-7-20 22:40 编辑 ]
作者: 来不及思考    时间: 2007-7-20 22:50
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-7-20 23:07
原帖由 来不及思考 于 2007-7-20 22:50 发表
GPU没有分支预测

大哥,你确认你搞清楚了?

这种话GOOGLE上可以搜一箩筐出来


这些话是我自己打出来的啊,从google上搜出来多没意思啊

你没搞清楚吧,我再把我上面那段话总结一下

它分作两个部分,第一部分是叙述在有分支预测的时候,分支预测失败对性能的影响,第二部分是叙述的是Cache不命中对性能的影响,和分支预测没有关系。

GPU没有分支预测,但是不会没有指令cache。你想想cache的作用就知道了。还不知道的话,好好看看计算机体系,赫赫
作者: killpmp    时间: 2007-7-20 23:35
原帖由 Ricepig 于 2007-7-20 22:35 发表

科普一下,所谓分支预测,是指预测当前执行代码的下一条或者下几条代码,并与当前代码交叠执行,一旦预测失败,浪费的是处理器执行时间。
而Cache不命中是另一种情况,当前内存相对Cache比较慢速,并且总线位 ...

对不起,你概念性错误
你所谓的“分支预测”在R6xx体系中是驱动程序管的事情,跟GPU根本无关。GPU没有你所谓的“分支预测”。驱动程序负责需要执行的指令的编排问题,然后交给GPU去做

你所谓的“Cache不命中”才是分支预测,但R6xx GPU是不具备分支预测功能的,毕竟它不是CPU

[ 本帖最后由 killpmp 于 2007-7-20 23:36 编辑 ]
作者: 来不及思考    时间: 2007-7-20 23:50
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-7-20 23:55
原帖由 killpmp 于 2007-7-20 23:35 发表

对不起,你概念性错误we.pcinlife.com6^2kBJ9?$@ E
你所谓的“分支预测”在R6xx体系中是驱动程序管的事情,跟GPU根本无关。GPU没有你所谓的“分支预测”。驱动程序负责需要执行的指令的编排问题,然后交给GPU去做
^1S:T8|?]`@V_}
你所谓的“Cache不命中”才是分支预测,但R6xx GPU是不具备分支预测功能的,毕竟它不是CPU.f$pkU8Z8c!F'P


指令的重编排叫做乱序执行。分支预测是找到当前程序点下面语句最常用的分支,无论此分支条件满足都预先执行,由于是和当前指令几乎并行执行的,因此损耗比较小。驱动所做的优化应该和编译器优化类似,将最常用的分支提前,或对分支合并。
Cache不命中和分支预测没有任何关系,硬盘也有Cache不命中的问题。Cache只是一个更快的存储器,处理器将程序经常访问的内存数据和指令暂存在Cache中以加快访问速度,Cache命中率低下会造成反效果。
如果还是不明白,我再说清楚一点,看这段代码(假如有变量i是经过前面程序计算的值):
j *=j
if(i>0)
k++;
else
k--;
分支预测的过程是,CPU预测i>0的分支最常被执行,因此在执行j*=j时,k++会被几乎同时执行。然而如果i<=0时,分支预测失败,流水线请空,重新计算k--。当然,我从版主那知道GPU没有分支预测。
什么是指令Cache不命中?拿CPU做比喻吧,现代CPU都是32位,但是指令长度没有32位,另外,内存比较慢(相对CPU来说)。不可能每执行一条语句再问内存取一条语句,这个时候CPU从内存从取一块语句到Cache中,这里不存在预测,直接是当前语句后面连续的内存地址。但是分支造成这块语句不一定被执行,这时候又需要取另一块语句块了,这个过程就是指令Cache不命中。
我想我说得比较清楚了吧,而且这样不是Google抄来的吧?
作者: 来不及思考    时间: 2007-7-20 23:55
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4