POPPUR爱换

标题: 全球第一个第三方D3D10 shader级别性能测试 [打印本页]

作者: Edison 时间: 2007-7-18 22:29
标题: 全球第一个第三方D3D10 shader级别性能测试
Rightmark 3D 2.0，源代码公开，公开、公平的测试软件。

驱动程序：CATALYST 8.3891 / ForceWare 158.45

原文：http://www.ixbt.com/video3/rightmark2.shtml

作者: Edison 时间: 2007-7-18 22:30
测试包下载：http://www.ixbt.com/video/itogi-video/ini/rmdx10.rar

测试项目截图：

作者: zl841226 时间: 2007-7-18 22:42
提示: 作者被禁止或删除内容自动屏蔽

作者: phk 时间: 2007-7-18 22:42
可怜的HD 2900XT和废柴没分别

作者: 89度热水 时间: 2007-7-18 22:43
R600的5D SMID很多时候只能跑当1D跑么

作者: 九泉苍月 时间: 2007-7-18 22:46
:funk: 这代核心真的废了

作者: zjlgn 时间: 2007-7-18 22:47
下不了啊。。。。

作者: 来不及思考 时间: 2007-7-18 22:48
提示: 作者被禁止或删除内容自动屏蔽

作者: 来不及思考 时间: 2007-7-18 22:49
提示: 作者被禁止或删除内容自动屏蔽

作者: feel囝 时间: 2007-7-18 22:50
X2xxx太恐怖了

作者: 贵族蓝翼 时间: 2007-7-18 22:52
提示: 作者被禁止或删除内容自动屏蔽

作者: Edison 时间: 2007-7-18 22:52
stream out是涉及到很多因素的吧，是Output Merger来做的话，R600未必有什么优势可言。

作者: 来不及思考 时间: 2007-7-18 22:55
提示: 作者被禁止或删除内容自动屏蔽

作者: feel囝 时间: 2007-7-18 22:57
还有，想问问大大们，在ps4.0 fire中？Nv和Ati的相差距离也史无前例了吧？到底是什么原因造成Ati的卡在该项的效率极其低下？

作者: Edison 时间: 2007-7-18 23:02
在粒子类性能测试中，R600似乎就是偏弱，ETQW打开柔和粒子后R6XX的性能受到的影响似乎会颇大。

作者: 轨迹 时间: 2007-7-18 23:03
:huh: :huh: :huh: 这次真的是残废了

作者: 来不及思考 时间: 2007-7-18 23:04
提示: 作者被禁止或删除内容自动屏蔽

作者: AlcatrazX 时间: 2007-7-18 23:08
提示: 作者被禁止或删除内容自动屏蔽

作者: feel囝 时间: 2007-7-18 23:12
唉，无解了！火星人都哭了

作者: ikinari 时间: 2007-7-18 23:14
提示: 作者被禁止或删除内容自动屏蔽

作者: zhang8542 时间: 2007-7-18 23:19

原帖由 ikinari 于 2007-7-18 23:14 发表
FX附体了………………

ATI真实青出于蓝啊...............

作者: fineday 时间: 2007-7-18 23:20
:unsure: 我看到50倍变成了平手……

作者: Edison 时间: 2007-7-18 23:21

原帖由 fineday 于 2007-7-18 23:20 发表
:unsure: 我看到50倍变成了平手……

其实可以看到另一个接近50x的结果，不过领先对象对调了。

作者: xxy0 时间: 2007-7-18 23:30
提示: 作者被禁止或删除内容自动屏蔽

作者: phk 时间: 2007-7-18 23:33
C2D @ 3.5GHz + 8800GTX @ 660/1066MHz，1600x1200 /w 8XMSAA 效果高high

DX10跑得动才是老板，

DX10跑不动只能看看

作者: aibo 时间: 2007-7-18 23:35
看这个结果

说r600是nv30II还抬举了他:wacko:

作者: fineday 时间: 2007-7-18 23:39

原帖由 Edison 于 2007-7-18 23:21 发表

其实可以看到另一个接近50x的结果，不过领先对象对调了。

天雨粟，鬼夜哭啊

作者: 明镜止水 时间: 2007-7-18 23:43
居然出现了50X的差距。。。:wacko:

作者: peter.pan 时间: 2007-7-19 00:05
AMD要好好干下去，不要让显卡天价

作者: 宁静在心 时间: 2007-7-19 00:16
P叔也爱好摄影么？

作者: killpmp 时间: 2007-7-19 00:28
比NV3x还NV3x，真的没话说了:wacko:

作者: cool_exorcist 时间: 2007-7-19 00:31
日，指望驱动翻身？看来是没戏了

作者: 来不及思考 时间: 2007-7-19 00:45
提示: 作者被禁止或删除内容自动屏蔽

作者: killpmp 时间: 2007-7-19 00:47

原帖由 来不及思考 于 2007-7-19 00:45 发表
down来大致看了下，那个PS4.0子项目里面全是if else while之类的东西，难怪R600要挂.... :blink:

那样5D Shader只能当1D来用，真可怜:lol:

NV就是聪明，知道NV4x/G7x架构的分支性能很弱，于是G80就大幅提升分支能力，把Shader干脆都搞成1D，效率怎么搞都是100%，哎

[ 本帖最后由 killpmp 于 2007-7-19 00:49 编辑 ]

作者: 来不及思考 时间: 2007-7-19 00:48
提示: 作者被禁止或删除内容自动屏蔽

作者: 来不及思考 时间: 2007-7-19 00:51
提示: 作者被禁止或删除内容自动屏蔽

作者: pharaohs1024 时间: 2007-7-19 00:59
提示: 作者被禁止或删除内容自动屏蔽

作者: Edison 时间: 2007-7-19 01:02
如果单纯考虑分支性能的话，R6XX还是比G8x好的。

不过一个架构的关键在于平衡，而这个平衡是要能满足当前和未来一段时间游戏需求的。

作者: feel囝 时间: 2007-7-19 01:03
r600的分支预测机构难道都预测错误？！

作者: feel囝 时间: 2007-7-19 01:05
那么E大和思考说的不就矛盾了么？

作者: Edison 时间: 2007-7-19 01:06
GPU是不存在动态分支预测能力，至少可见的一段时间内都是这样。

但是可以在访问内存动作发生的时候，把另一个等待最长时间的线程调进空闲的shader里跑来提高利用率。

作者: feel囝 时间: 2007-7-19 01:10
对于乱序的架构来说，没有分支预测其效率不会降低吗？

作者: 来不及思考 时间: 2007-7-19 01:11
提示: 作者被禁止或删除内容自动屏蔽

作者: 来不及思考 时间: 2007-7-19 01:14
提示: 作者被禁止或删除内容自动屏蔽

作者: pharaohs1024 时间: 2007-7-19 01:20
提示: 作者被禁止或删除内容自动屏蔽

作者: 来不及思考 时间: 2007-7-19 01:21
提示: 作者被禁止或删除内容自动屏蔽

作者: pharaohs1024 时间: 2007-7-19 01:27
提示: 作者被禁止或删除内容自动屏蔽

作者: feel囝 时间: 2007-7-19 01:27
那么，却......?

作者: 来不及思考 时间: 2007-7-19 01:30
提示: 作者被禁止或删除内容自动屏蔽

作者: damijordan 时间: 2007-7-19 01:54
反正入了R600了~~~成绩还是很汗的~:wacko:

作者: eye2eye 时间: 2007-7-19 09:23
对于声卡来说，这个成绩已经很史无前例了。:unsure:

作者: acqwer 时间: 2007-7-19 09:34
R600是流处理器不是VPU。

作者: zhuu 时间: 2007-7-19 09:36
好样的，ATI，其实不错了

作者: temp0088 时间: 2007-7-19 09:41
ATI的成绩怎么那么差啊？

作者: phk 时间: 2007-7-19 09:52
某些测试中HD 2900XT被GF 8600GTS干掉了

作者: 287381906 时间: 2007-7-19 10:04

原帖由 phk 于 2007-7-19 09:52 发表
某些测试中HD 2900XT被GF 8600GTS干掉了

PHK又来踩A了:wacko: 本来就不济，你还这么落力踩，PHK你也太残忍了(_(

作者: phk 时间: 2007-7-19 10:22

原帖由 287381906 于 2007-7-19 10:04 发表

PHK又来踩A了:wacko: 本来就不济，你还这么落力踩，PHK你也太残忍了(_(

我是替那些2900XT用家深感悲哀啊

作者: akcadia 时间: 2007-7-19 11:04

原帖由 phk 于 2007-7-19 09:52 发表
某些测试中HD 2900XT被GF 8600GTS干掉了

w00t) w00t) w00t)
我刚想说8800GTS本来就大幅度领先``
可是一看到8600GTS````

作者: phk 时间: 2007-7-19 11:06

原帖由 phk 于 2007-7-18 23:33 发表
C2D @ 3.5GHz + 8800GTX @ 660/1066MHz，1600x1200 /w 8XMSAA 效果高high

http://bbs.expreview.com/attachments/month_0707/20070718_67e44d1108 ...

某Q连作弊都忘了更改这些选项，凄凉啊

[ 本帖最后由 phk 于 2007-7-19 11:09 编辑 ]

作者: 明镜止水 时间: 2007-7-19 11:24
呵呵，见怪不怪咯。:p

作者: phk 时间: 2007-7-19 11:27

原帖由 arony 于 2007-7-19 11:23 发表
:lol:
枪不是一次两次了
见怪不怪了

最好让某Q拿640x480 0AA来我的1600x1200 8XAA比，一定是他赢的，自欺欺人蛮凄凉啊

作者: 蒙大拿 时间: 2007-7-19 12:36
我个人偏好使用N卡,但是真心希望A卡好,因为A卡好了我才能够用到更好的N卡

作者: akcadia 时间: 2007-7-19 12:48

原帖由 蒙大拿 于 2007-7-19 12:36 发表
我个人偏好使用N卡,但是真心希望A卡好,因为A卡好了我才能够用到更好的N卡

很快就有INTEL杀入
ATI根本就无关痛痒~

作者: phk 时间: 2007-7-19 14:03

原帖由 蒙大拿 于 2007-7-19 12:36 发表
我个人偏好使用N卡,但是真心希望A卡好,因为A卡好了我才能够用到更好的N卡

做人怎可以双重标准的，矛盾啊:blink:

作者: feel囝 时间: 2007-7-19 14:19
现在时兴：一切皆是幻像！所以P叔，你所看到的同样可能是幻觉！呵呵

作者: lacri 时间: 2007-7-19 16:42

原帖由 phk 于 2007-7-19 11:06 发表

http://we.pcinlife.com/attachment.php?aid=766888&noupdate=yes¬humb=yes

http://we.pcinlife.com/attachment.php?aid=766889&noupdate=yes¬humb=yes

某Q连作弊都忘了更改这些选项，凄凉啊 ...

呵呵，在山那边看到了，太搞笑了某小编。

作者: fineday 时间: 2007-7-19 17:15
:p 转移话题是某人一向的手段啦，见怪不怪了。
面对别人对自己的质疑要么东拉西扯，要么转而区攻击对方，看都看腻了。q

作者: phk 时间: 2007-7-19 17:19

原帖由 fineday 于 2007-7-19 17:15 发表
:p 转移话题是某人一向的手段啦，见怪不怪了。
面对别人对自己的质疑要么东拉西扯，要么转而区攻击对方，看都看腻了。q

某Q作弊也欠学问，被揭穿了丑态，恼丑成怒啊

作者: Yorkchen 时间: 2007-7-19 17:21
PS4.0和VS4.0的效能差了一大段,驱动问题?:huh:
处理单元分配方案不同,不会引起150%以上差距吧,不好说啊,不好说:ph34r:

作者: Yorkchen 时间: 2007-7-19 17:24
又晃了眼,牵涉到高分辨率后X2900分数直线下降,带宽占优,容量接近,频率没区别,ATI干了什么?:crying:

作者: phk 时间: 2007-7-19 17:24

原帖由 Yorkchen 于 2007-7-19 17:21 发表
PS4.0和VS4.0的效能差了一大段,驱动问题?:huh:
处理单元分配方案不同,不会引起150%以上差距吧,不好说啊,不好说:ph34r:

当初选择G80没选错吧:lol:

作者: bfg9000 时间: 2007-7-19 18:23
一面倒啊:funk:

以后形容某些卡就用R600第二好了:lol:

作者: lvmeng007 时间: 2007-7-19 19:55
喜欢A卡，可它好几代了总让人失望啊。其实大家不希望高端卡A强或者N强，感觉这是没什么意义的，用顶级卡的人恐怕也只是那么几个少数米人罢了。我只在乎800-1000块，谁的卡更强些。

作者: 我系高手！ 时间: 2007-7-19 21:52
可怜的ati弄个这样子的东西出来，还是等intel尽快来救众多fans吧:wacko:

作者: Yorkchen 时间: 2007-7-19 22:41

原帖由 phk 于 2007-7-19 17:24 发表

当初选择G80没选错吧:lol:

G80丢掉了,用回R520了,原因嘛,主要是太热太大太重....

作者: killpmp 时间: 2007-7-19 23:04

原帖由 Yorkchen 于 2007-7-19 22:41 发表

G80丢掉了,用回R520了,原因嘛,主要是太热太大太重....

R520一样太热太大太重——相对G70而言

作者: zzhang 时间: 2007-7-19 23:06
G80真是值呀。:lol:

作者: phk 时间: 2007-7-19 23:08

原帖由 Yorkchen 于 2007-7-19 22:41 发表

G80丢掉了,用回R520了,原因嘛,主要是太热太大太重....

R520连G70都不如w00t)

作者: kof2003 时间: 2007-7-19 23:12
N卡有N3*低潮后就有68系列的反击，A卡目前有什么资料没有？能否进行一次较大的反击呢？

作者: kingofbf2 时间: 2007-7-20 10:16
提示: 作者被禁止或删除内容自动屏蔽

作者: lacri 时间: 2007-7-20 10:48

原帖由 kingofbf2 于 2007-7-20 10:16 发表
你说可能吗？？ 86GTS比x2900xt强？ w00t) w00t) nvidia给了钱....

没什么不可能的，就像9600在某些方面干掉5900一样，千万别把R600想的太NB就行。前几天游戏WIC的测试中，在某个分辨率，8600GTS照样太阳了2900XT。

作者: 来不及思考 时间: 2007-7-20 10:51
提示: 作者被禁止或删除内容自动屏蔽

作者: 我系高手！ 时间: 2007-7-20 11:19
而且这个测试用的fw版本还不是最新的，汗一把啊

作者: RacingPHT 时间: 2007-7-20 11:25
提示: 作者被禁止或删除内容自动屏蔽

作者: 来不及思考 时间: 2007-7-20 11:36
提示: 作者被禁止或删除内容自动屏蔽

作者: Edison 时间: 2007-7-20 13:10
XXXXx ‎(13:09):
it's not final version. When we will do release, we will put sources codes.

目前只有HLSL .fx的。

作者: shiver76 时间: 2007-7-20 13:59
各位老大, 我怎么跑不了这个测试?

Vista下出错误提示, 根本进不去

XP下进得去, 但是点测试无效

[attach]767289[/attach]

作者: Ricepig 时间: 2007-7-20 20:02

原帖由 来不及思考 于 2007-7-19 01:30 发表
"那么"得去问ATI了，我不知道 :charles:

float3，float4，一堆一堆的，居然也赢不了

这种东西在分支里吃亏更加大
因为如果NV的分支预测出错，清空缓存重读是float的话，ATI就是float4

作者: 来不及思考 时间: 2007-7-20 21:08
提示: 作者被禁止或删除内容自动屏蔽

作者: flymop 时间: 2007-7-20 21:19
FT啊
这哪是FX附体
这明明不是当年的S3么

作者: Ricepig 时间: 2007-7-20 22:10

原帖由 来不及思考 于 2007-7-20 21:08 发表

GPU没有分支预测

上面的代码在ATI上同样很吃亏，其一是5D没用全，而NVidia可以全速跑
第二是跳转时的Cache不命中的代价，ATI大大高于Nvidia

作者: 来不及思考 时间: 2007-7-20 22:14
提示: 作者被禁止或删除内容自动屏蔽

作者: Ricepig 时间: 2007-7-20 22:35

原帖由 来不及思考 于 2007-7-20 22:14 发表

我不知道你说的cache miss是什么意思，再说一遍，GPU没有分支预测

科普一下，所谓分支预测，是指预测当前执行代码的下一条或者下几条代码，并与当前代码交叠执行，一旦预测失败，浪费的是处理器执行时间。
而Cache不命中是另一种情况，当前内存相对Cache比较慢速，并且总线位宽超过指令位宽，因此处理器倾向于每次不光取当前指令到Cache,而是把前后若干条指令都取到Cache。一旦Cache不命中（if这种分支造成），处理器需要再一次从内部存储器里读取一块指令（而不是一条指令），这时也浪费处理器时间，但是主要是多次内部存储器读取中的延迟和读取时间。
处理器和内部存储器在CPU框架下是CPU和内存，在GPU下是GPU和显存，over

[ 本帖最后由 Ricepig 于 2007-7-20 22:40 编辑 ]

作者: 来不及思考 时间: 2007-7-20 22:50
提示: 作者被禁止或删除内容自动屏蔽

作者: Ricepig 时间: 2007-7-20 23:07

原帖由 来不及思考 于 2007-7-20 22:50 发表
GPU没有分支预测

大哥，你确认你搞清楚了？

这种话GOOGLE上可以搜一箩筐出来

这些话是我自己打出来的啊，从google上搜出来多没意思啊

你没搞清楚吧，我再把我上面那段话总结一下

它分作两个部分，第一部分是叙述在有分支预测的时候，分支预测失败对性能的影响，第二部分是叙述的是Cache不命中对性能的影响，和分支预测没有关系。

GPU没有分支预测，但是不会没有指令cache。你想想cache的作用就知道了。还不知道的话，好好看看计算机体系，赫赫

作者: killpmp 时间: 2007-7-20 23:35

原帖由 Ricepig 于 2007-7-20 22:35 发表

科普一下，所谓分支预测，是指预测当前执行代码的下一条或者下几条代码，并与当前代码交叠执行，一旦预测失败，浪费的是处理器执行时间。
而Cache不命中是另一种情况，当前内存相对Cache比较慢速，并且总线位 ...

对不起，你概念性错误
你所谓的“分支预测”在R6xx体系中是驱动程序管的事情，跟GPU根本无关。GPU没有你所谓的“分支预测”。驱动程序负责需要执行的指令的编排问题，然后交给GPU去做

你所谓的“Cache不命中”才是分支预测，但R6xx GPU是不具备分支预测功能的，毕竟它不是CPU

[ 本帖最后由 killpmp 于 2007-7-20 23:36 编辑 ]

作者: 来不及思考 时间: 2007-7-20 23:50
提示: 作者被禁止或删除内容自动屏蔽

作者: Ricepig 时间: 2007-7-20 23:55

原帖由 killpmp 于 2007-7-20 23:35 发表

对不起，你概念性错误we.pcinlife.com6^2kBJ9?$@ E
你所谓的“分支预测”在R6xx体系中是驱动程序管的事情，跟GPU根本无关。GPU没有你所谓的“分支预测”。驱动程序负责需要执行的指令的编排问题，然后交给GPU去做
^1S:T8|?]`@V_}
你所谓的“Cache不命中”才是分支预测，但R6xx GPU是不具备分支预测功能的，毕竟它不是CPU.f$pkU8Z8c!F'P

指令的重编排叫做乱序执行。分支预测是找到当前程序点下面语句最常用的分支，无论此分支条件满足都预先执行，由于是和当前指令几乎并行执行的，因此损耗比较小。驱动所做的优化应该和编译器优化类似，将最常用的分支提前，或对分支合并。
Cache不命中和分支预测没有任何关系，硬盘也有Cache不命中的问题。Cache只是一个更快的存储器，处理器将程序经常访问的内存数据和指令暂存在Cache中以加快访问速度，Cache命中率低下会造成反效果。
如果还是不明白，我再说清楚一点，看这段代码（假如有变量i是经过前面程序计算的值）：
j *=j
if(i>0)
k++;
else
k--;
分支预测的过程是，CPU预测i>0的分支最常被执行，因此在执行j*=j时,k++会被几乎同时执行。然而如果i<=0时，分支预测失败，流水线请空，重新计算k--。当然，我从版主那知道GPU没有分支预测。
什么是指令Cache不命中？拿CPU做比喻吧，现代CPU都是32位，但是指令长度没有32位，另外，内存比较慢（相对CPU来说）。不可能每执行一条语句再问内存取一条语句，这个时候CPU从内存从取一块语句到Cache中，这里不存在预测，直接是当前语句后面连续的内存地址。但是分支造成这块语句不一定被执行，这时候又需要取另一块语句块了，这个过程就是指令Cache不命中。
我想我说得比较清楚了吧，而且这样不是Google抄来的吧？

作者: 来不及思考 时间: 2007-7-20 23:55
提示: 作者被禁止或删除内容自动屏蔽

欢迎光临 POPPUR爱换 (https://we.poppur.com/)