POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Edison
打印 上一主题 下一主题

全球第一个第三方D3D10 shader级别性能测试

[复制链接]
头像被屏蔽
81#
发表于 2007-7-20 10:16 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

82#
发表于 2007-7-20 10:48 | 只看该作者
原帖由 kingofbf2 于 2007-7-20 10:16 发表
你说可能吗?? 86GTS比x2900xt强? w00t) w00t)  nvidia给了钱....


没什么不可能的,就像9600在某些方面干掉5900一样,千万别把R600想的太NB就行。前几天游戏WIC的测试中,在某个分辨率,8600GTS照样太阳了2900XT。
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
83#
发表于 2007-7-20 10:51 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

84#
发表于 2007-7-20 11:19 | 只看该作者
而且这个测试用的fw版本还不是最新的,汗一把啊
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
85#
发表于 2007-7-20 11:25 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
86#
发表于 2007-7-20 11:36 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

87#
 楼主| 发表于 2007-7-20 13:10 | 只看该作者
XXXXx ‎(13:09):
it's not final version. When we will do release, we will put sources codes.

目前只有HLSL .fx的。
回复 支持 反对

使用道具 举报

88#
发表于 2007-7-20 13:59 | 只看该作者
各位老大, 我怎么跑不了这个测试?

Vista下出错误提示, 根本进不去

XP下进得去, 但是点测试无效

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

89#
发表于 2007-7-20 20:02 | 只看该作者
原帖由 来不及思考 于 2007-7-19 01:30 发表
"那么"得去问ATI了,我不知道 :charles:

float3,float4,一堆一堆的,居然也赢不了

这种东西在分支里吃亏更加大
因为如果NV的分支预测出错,清空缓存重读是float的话,ATI就是float4
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
90#
发表于 2007-7-20 21:08 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

91#
发表于 2007-7-20 21:19 | 只看该作者
FT啊
这哪是FX附体
这明明不是当年的S3么
回复 支持 反对

使用道具 举报

92#
发表于 2007-7-20 22:10 | 只看该作者
原帖由 来不及思考 于 2007-7-20 21:08 发表


GPU没有分支预测

上面的代码在ATI上同样很吃亏,其一是5D没用全,而NVidia可以全速跑
第二是跳转时的Cache不命中的代价,ATI大大高于Nvidia
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
93#
发表于 2007-7-20 22:14 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

94#
发表于 2007-7-20 22:35 | 只看该作者
原帖由 来不及思考 于 2007-7-20 22:14 发表


我不知道你说的cache miss是什么意思,再说一遍,GPU没有分支预测

科普一下,所谓分支预测,是指预测当前执行代码的下一条或者下几条代码,并与当前代码交叠执行,一旦预测失败,浪费的是处理器执行时间。
而Cache不命中是另一种情况,当前内存相对Cache比较慢速,并且总线位宽超过指令位宽,因此处理器倾向于每次不光取当前指令到Cache,而是把前后若干条指令都取到Cache。一旦Cache不命中(if这种分支造成),处理器需要再一次从内部存储器里读取一块指令(而不是一条指令),这时也浪费处理器时间,但是主要是多次内部存储器读取中的延迟和读取时间。
处理器和内部存储器在CPU框架下是CPU和内存,在GPU下是GPU和显存,over

[ 本帖最后由 Ricepig 于 2007-7-20 22:40 编辑 ]
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
95#
发表于 2007-7-20 22:50 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

96#
发表于 2007-7-20 23:07 | 只看该作者
原帖由 来不及思考 于 2007-7-20 22:50 发表
GPU没有分支预测

大哥,你确认你搞清楚了?

这种话GOOGLE上可以搜一箩筐出来


这些话是我自己打出来的啊,从google上搜出来多没意思啊

你没搞清楚吧,我再把我上面那段话总结一下

它分作两个部分,第一部分是叙述在有分支预测的时候,分支预测失败对性能的影响,第二部分是叙述的是Cache不命中对性能的影响,和分支预测没有关系。

GPU没有分支预测,但是不会没有指令cache。你想想cache的作用就知道了。还不知道的话,好好看看计算机体系,赫赫
回复 支持 反对

使用道具 举报

97#
发表于 2007-7-20 23:35 | 只看该作者
原帖由 Ricepig 于 2007-7-20 22:35 发表

科普一下,所谓分支预测,是指预测当前执行代码的下一条或者下几条代码,并与当前代码交叠执行,一旦预测失败,浪费的是处理器执行时间。
而Cache不命中是另一种情况,当前内存相对Cache比较慢速,并且总线位 ...

对不起,你概念性错误
你所谓的“分支预测”在R6xx体系中是驱动程序管的事情,跟GPU根本无关。GPU没有你所谓的“分支预测”。驱动程序负责需要执行的指令的编排问题,然后交给GPU去做

你所谓的“Cache不命中”才是分支预测,但R6xx GPU是不具备分支预测功能的,毕竟它不是CPU

[ 本帖最后由 killpmp 于 2007-7-20 23:36 编辑 ]
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
98#
发表于 2007-7-20 23:50 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

99#
发表于 2007-7-20 23:55 | 只看该作者
原帖由 killpmp 于 2007-7-20 23:35 发表

对不起,你概念性错误we.pcinlife.com6^2kBJ9?$@ E
你所谓的“分支预测”在R6xx体系中是驱动程序管的事情,跟GPU根本无关。GPU没有你所谓的“分支预测”。驱动程序负责需要执行的指令的编排问题,然后交给GPU去做
^1S:T8|?]`@V_}
你所谓的“Cache不命中”才是分支预测,但R6xx GPU是不具备分支预测功能的,毕竟它不是CPU.f$pkU8Z8c!F'P


指令的重编排叫做乱序执行。分支预测是找到当前程序点下面语句最常用的分支,无论此分支条件满足都预先执行,由于是和当前指令几乎并行执行的,因此损耗比较小。驱动所做的优化应该和编译器优化类似,将最常用的分支提前,或对分支合并。
Cache不命中和分支预测没有任何关系,硬盘也有Cache不命中的问题。Cache只是一个更快的存储器,处理器将程序经常访问的内存数据和指令暂存在Cache中以加快访问速度,Cache命中率低下会造成反效果。
如果还是不明白,我再说清楚一点,看这段代码(假如有变量i是经过前面程序计算的值):
j *=j
if(i>0)
k++;
else
k--;
分支预测的过程是,CPU预测i>0的分支最常被执行,因此在执行j*=j时,k++会被几乎同时执行。然而如果i<=0时,分支预测失败,流水线请空,重新计算k--。当然,我从版主那知道GPU没有分支预测。
什么是指令Cache不命中?拿CPU做比喻吧,现代CPU都是32位,但是指令长度没有32位,另外,内存比较慢(相对CPU来说)。不可能每执行一条语句再问内存取一条语句,这个时候CPU从内存从取一块语句到Cache中,这里不存在预测,直接是当前语句后面连续的内存地址。但是分支造成这块语句不一定被执行,这时候又需要取另一块语句块了,这个过程就是指令Cache不命中。
我想我说得比较清楚了吧,而且这样不是Google抄来的吧?
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
100#
发表于 2007-7-20 23:55 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2026-1-11 21:46

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表