POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 2570|回复: 15
打印 上一主题 下一主题

去年的疑惑,今年终于揭开!PS单元 Branch 性能测试

[复制链接]
跳转到指定楼层
1#
发表于 2006-12-7 17:50 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Pixel Shader 3.0 Branch Test v0.2

NV42: GeForce 6800GS
Tile Size: 128x128, FPS: 306
Tile Size: 64x64, FPS: 272
Tile Size: 48x48, FPS: 231
Tile Size: 32x32, FPS: 218
Tile Size: 24x24, FPS: 204
Tile Size: 16x16, FPS: 202
Tile Size: 8x8, FPS: 202
Tile Size: Dither(1x1), FPS: 198

RV570: Radeon X1950PRO
Tile Size: 128x128, FPS: 739
Tile Size: 64x64, FPS: 729
Tile Size: 48x48, FPS: 707
Tile Size: 32x32, FPS: 722
Tile Size: 24x24, FPS: 668
Tile Size: 16x16, FPS: 705
Tile Size: 8x8, FPS: 632
Tile Size: Dither(1x1), FPS: 407


啥也不说了,去年在这里的人都知道有这个故事了,ATI 得卡当时不能运行这个测试程序,结果是因为 PS/VS 必须都用 3.0 才能运

行,而 NV 得驱动 VS 1.1 也可以和 PS 3.0 配合。直接导致了 R5 系列的分支性能不能测试

现在终于有了结果!

外行看热闹,内行看门道

这个测试是利用 Pixel Shader 得分支指令来执行总计 3 个分支 (if... else if.... else....) 通过测试不同的块大小来看架构

对分支的容忍能力 RV570 仔 8x8 - 1x1 才出现明显性能下降,说明在处理 64 Pixel 得时候还没有达到分支能力的极限

谁有 G80 我给你们发下载地址,测测看吧,看看 G80 得分支能力怎么样


Pixel Shader source code listing:

ps_3_0

dcl_2d s0
dcl_2d s1
dcl_2d s2
dcl_2d s3
dcl_2d s4
dcl_texcoord0 v0.xy

def c2, 0.2, 0.6, 0, 0
def c5, 1, 0, -1, 0.6
def c6, 2, 3, 4, 0
def c7, -0.5, -0.5, 0, 0.2

def c9, -0.01, 0.01, 0, 0
def c10, -0.01, -0.01, 0, 0
def c11, 0.01, -0.01, 0, 0
def c12, 0.01, 0.01, 0, 0

; Fetch branch source mask data (r1)
texldl  r1, v0.xy, s0

; Calculate light dir (r3)
mov     r2, c5.yyxy
add     r2, r2, c0.xyzz
nrm     r3, r2

if_gt   r1.r, c2.y
; True part
    ; Fetch surface color
    texldl  r5, v0.xy, s1
    ; Fetch normal
    mov     r2, c6.y
    mul     r2, r2, v0.xy
    texldl  r6, r2.xy, s2   
    ; Do dot product lighting calculation
    add     r6, r6, c7
    nrm     r2, r6
    dp3     r3.x, r3, r2   
    ; Blend final color
    mul     r5, r5, r3.xxx
else
if_lt  r1.r, c2.x
; True part 2
    ; Fetch surface color
    ; 5 point blur filter
    texldl  r5, v0.xy, s3
    mov     r0, c9
    add     r0, r0, v0.xy
    texldl  r6, r0.xy, s3
    add     r5, r5, r6
    mov     r0, c10
    add     r0, r0, v0.xy
    texldl  r6, r0.xy, s3
    add     r5, r5, r6
    mov     r0, c11
    add     r0, r0, v0.xy
    texldl  r6, r0.xy, s3
    add     r5, r5, r6
    mov     r0, c12
    add     r0, r0, v0.xy
    texldl  r6, r0.xy, s3
    add     r5, r5, r6
    mul     r5, r5, c7.w
    ; Fetch normal
    mov     r2, c6.y
    mul     r2, r2, v0.xy
    texldl  r6, r2.xy, s4
    ; Do dot product lighting calculation
    add     r6, r6, c7
    nrm     r2, r6
    dp3     r3.x, r3, r2
    ; Blend final color
    mul     r5, r5, r3.xxx
else
; False part
    ; Fetch surface color
    texldl  r5, v0.xy, s3
    ; Blend final color
    add     r5, r5, c7.wwww
endif
endif

mov     oC0, r5
2#
发表于 2006-12-7 19:18 | 只看该作者
G80用得着预测分支?落伍……
回复 支持 反对

使用道具 举报

3#
发表于 2006-12-7 19:20 | 只看该作者
原帖由 P2MMAO 于 2006-12-7 17:53 发表
早有结果了,G80分支预测能力比R520慢很多:lol:

孙阿Q又出丑啦

原来显卡也需要分支预测的:lol: :lol:
回复 支持 反对

使用道具 举报

4#
发表于 2006-12-7 19:26 | 只看该作者
GPU没有预测```
回复 支持 反对

使用道具 举报

5#
发表于 2006-12-7 19:28 | 只看该作者
预测分支很落伍吗?。。。。。。
回复 支持 反对

使用道具 举报

头像被屏蔽
6#
发表于 2006-12-7 19:44 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

pharaohs1024 该用户已被删除
7#
发表于 2006-12-7 19:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

8#
 楼主| 发表于 2006-12-7 19:51 | 只看该作者
我精心策划的 Branch penalty testing 怎么就给人拐成分支预测了,咳,懂技术的都走了,只剩下会起哄的了,算了,算我发错地方了
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
9#
发表于 2006-12-7 19:55 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

10#
发表于 2006-12-7 20:04 | 只看该作者
晕了一堆数字。。。
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
11#
发表于 2006-12-7 22:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

12#
发表于 2006-12-8 09:30 | 只看该作者
9x.xx的驱动对G80的调度器使用存在bug,100驱动修正了这个问题。
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2006-12-8 09:42 | 只看该作者
新版本测试程序,连同全部源代码,今天下午放上供大家测试研究学习用:)

100 驱动。。。 名字好。。。。
回复 支持 反对

使用道具 举报

14#
 楼主| 发表于 2006-12-8 09:48 | 只看该作者
RV530 我手头没有样本,等程序公布让有的朋友帮忙测一个吧
回复 支持 反对

使用道具 举报

15#
发表于 2006-12-8 09:49 | 只看该作者
原帖由 Elwin 于 2006-12-8 09:44 发表
既然是去年的问题就应该拿68GS对拼RV530~:p

按性能下降百分比来算,68gs被轰至渣
回复 支持 反对

使用道具 举报

16#
发表于 2006-12-8 16:02 | 只看该作者
原帖由 HECATE 于 2006-12-7 18:07 发表
这个是simd测试   关g80什么事。。。。。。。

=.= :wacko:
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-7 03:36

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表