全球第一个第三方D3D10 shader级别性能测试

kingofbf2 · 发表于 2007-7-20 10:16

提示: 作者被禁止或删除内容自动屏蔽

lacri · 发表于 2007-7-20 10:48

原帖由 kingofbf2 于 2007-7-20 10:16 发表
你说可能吗？？ 86GTS比x2900xt强？ w00t) w00t) nvidia给了钱....

没什么不可能的，就像9600在某些方面干掉5900一样，千万别把R600想的太NB就行。前几天游戏WIC的测试中，在某个分辨率，8600GTS照样太阳了2900XT。

只看该作者 · 发表于 2007-7-20 10:51

提示: 作者被禁止或删除内容自动屏蔽

我系高手！ · 发表于 2007-7-20 11:19

而且这个测试用的fw版本还不是最新的，汗一把啊

只看该作者 · 发表于 2007-7-20 11:25

提示: 作者被禁止或删除内容自动屏蔽

只看该作者 · 发表于 2007-7-20 11:36

提示: 作者被禁止或删除内容自动屏蔽

Edison · 发表于 2007-7-20 13:10

XXXXx ‎(13:09):
it's not final version. When we will do release, we will put sources codes.

目前只有HLSL .fx的。

shiver76 · 发表于 2007-7-20 13:59

各位老大, 我怎么跑不了这个测试?

Vista下出错误提示, 根本进不去

XP下进得去, 但是点测试无效

Ricepig · 发表于 2007-7-20 20:02

原帖由 来不及思考 于 2007-7-19 01:30 发表
"那么"得去问ATI了，我不知道 :charles:

float3，float4，一堆一堆的，居然也赢不了

这种东西在分支里吃亏更加大
因为如果NV的分支预测出错，清空缓存重读是float的话，ATI就是float4

只看该作者 · 发表于 2007-7-20 21:08

提示: 作者被禁止或删除内容自动屏蔽

flymop · 发表于 2007-7-20 21:19

FT啊
这哪是FX附体
这明明不是当年的S3么

Ricepig · 发表于 2007-7-20 22:10

原帖由 来不及思考 于 2007-7-20 21:08 发表

GPU没有分支预测

上面的代码在ATI上同样很吃亏，其一是5D没用全，而NVidia可以全速跑
第二是跳转时的Cache不命中的代价，ATI大大高于Nvidia

只看该作者 · 发表于 2007-7-20 22:14

提示: 作者被禁止或删除内容自动屏蔽

Ricepig · 发表于 2007-7-20 22:35

原帖由 来不及思考 于 2007-7-20 22:14 发表

我不知道你说的cache miss是什么意思，再说一遍，GPU没有分支预测

科普一下，所谓分支预测，是指预测当前执行代码的下一条或者下几条代码，并与当前代码交叠执行，一旦预测失败，浪费的是处理器执行时间。
而Cache不命中是另一种情况，当前内存相对Cache比较慢速，并且总线位宽超过指令位宽，因此处理器倾向于每次不光取当前指令到Cache,而是把前后若干条指令都取到Cache。一旦Cache不命中（if这种分支造成），处理器需要再一次从内部存储器里读取一块指令（而不是一条指令），这时也浪费处理器时间，但是主要是多次内部存储器读取中的延迟和读取时间。
处理器和内部存储器在CPU框架下是CPU和内存，在GPU下是GPU和显存，over

[ 本帖最后由 Ricepig 于 2007-7-20 22:40 编辑 ]

只看该作者 · 发表于 2007-7-20 22:50

提示: 作者被禁止或删除内容自动屏蔽

Ricepig · 发表于 2007-7-20 23:07

原帖由 来不及思考 于 2007-7-20 22:50 发表
GPU没有分支预测

大哥，你确认你搞清楚了？

这种话GOOGLE上可以搜一箩筐出来

这些话是我自己打出来的啊，从google上搜出来多没意思啊

你没搞清楚吧，我再把我上面那段话总结一下

它分作两个部分，第一部分是叙述在有分支预测的时候，分支预测失败对性能的影响，第二部分是叙述的是Cache不命中对性能的影响，和分支预测没有关系。

GPU没有分支预测，但是不会没有指令cache。你想想cache的作用就知道了。还不知道的话，好好看看计算机体系，赫赫

killpmp · 发表于 2007-7-20 23:35

原帖由 Ricepig 于 2007-7-20 22:35 发表

科普一下，所谓分支预测，是指预测当前执行代码的下一条或者下几条代码，并与当前代码交叠执行，一旦预测失败，浪费的是处理器执行时间。
而Cache不命中是另一种情况，当前内存相对Cache比较慢速，并且总线位 ...

对不起，你概念性错误
你所谓的“分支预测”在R6xx体系中是驱动程序管的事情，跟GPU根本无关。GPU没有你所谓的“分支预测”。驱动程序负责需要执行的指令的编排问题，然后交给GPU去做

你所谓的“Cache不命中”才是分支预测，但R6xx GPU是不具备分支预测功能的，毕竟它不是CPU

[ 本帖最后由 killpmp 于 2007-7-20 23:36 编辑 ]

只看该作者 · 发表于 2007-7-20 23:50

提示: 作者被禁止或删除内容自动屏蔽

Ricepig · 发表于 2007-7-20 23:55

原帖由 killpmp 于 2007-7-20 23:35 发表

对不起，你概念性错误we.pcinlife.com6^2kBJ9?$@ E
你所谓的“分支预测”在R6xx体系中是驱动程序管的事情，跟GPU根本无关。GPU没有你所谓的“分支预测”。驱动程序负责需要执行的指令的编排问题，然后交给GPU去做
^1S:T8|?]`@V_}
你所谓的“Cache不命中”才是分支预测，但R6xx GPU是不具备分支预测功能的，毕竟它不是CPU.f$pkU8Z8c!F'P

指令的重编排叫做乱序执行。分支预测是找到当前程序点下面语句最常用的分支，无论此分支条件满足都预先执行，由于是和当前指令几乎并行执行的，因此损耗比较小。驱动所做的优化应该和编译器优化类似，将最常用的分支提前，或对分支合并。
Cache不命中和分支预测没有任何关系，硬盘也有Cache不命中的问题。Cache只是一个更快的存储器，处理器将程序经常访问的内存数据和指令暂存在Cache中以加快访问速度，Cache命中率低下会造成反效果。
如果还是不明白，我再说清楚一点，看这段代码（假如有变量i是经过前面程序计算的值）：
j *=j
if(i>0)
k++;
else
k--;
分支预测的过程是，CPU预测i>0的分支最常被执行，因此在执行j*=j时,k++会被几乎同时执行。然而如果i<=0时，分支预测失败，流水线请空，重新计算k--。当然，我从版主那知道GPU没有分支预测。
什么是指令Cache不命中？拿CPU做比喻吧，现代CPU都是32位，但是指令长度没有32位，另外，内存比较慢（相对CPU来说）。不可能每执行一条语句再问内存取一条语句，这个时候CPU从内存从取一块语句到Cache中，这里不存在预测，直接是当前语句后面连续的内存地址。但是分支造成这块语句不一定被执行，这时候又需要取另一块语句块了，这个过程就是指令Cache不命中。
我想我说得比较清楚了吧，而且这样不是Google抄来的吧？

只看该作者 · 发表于 2007-7-20 23:55

提示: 作者被禁止或删除内容自动屏蔽

帐号		自动登录	找回密码
密码			注册

kingofbf2 kingofbf2 当前离线积分 2 IP卡狗仔卡头像被屏蔽	81^# 发表于 2007-7-20 10:16 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
kingofbf2 kingofbf2 当前离线积分 2 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	83^# 发表于 2007-7-20 10:51 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

RacingPHT 该用户已被删除	85^# 发表于 2007-7-20 11:25 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	86^# 发表于 2007-7-20 11:36 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	90^# 发表于 2007-7-20 21:08 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	93^# 发表于 2007-7-20 22:14 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	95^# 发表于 2007-7-20 22:50 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	98^# 发表于 2007-7-20 23:50 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	100^# 发表于 2007-7-20 23:55 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

全球第一个第三方D3D10 shader级别性能测试

本帖子中包含更多资源