POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 5332|回复: 20
打印 上一主题 下一主题

8800GT的单纹理填充率只有5200Mt/s左右,作何解?

[复制链接]
跳转到指定楼层
1#
发表于 2007-12-5 16:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
是什么限制了性能发挥呢?这个值怎么从理论上求得,高人指点啊:loveliness:



[ 本帖最后由 rongronglulu 于 2007-12-5 16:51 编辑 ]
2#
 楼主| 发表于 2007-12-5 16:32 | 只看该作者
貌似这个数值对nv的G8x体系来说就是频率乘以rop数量除以二,这是什么原理呢:a) 但对于R600这又不是这样:a)
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2007-12-5 17:27 | 只看该作者
期待高手解答阿:unsure:
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
4#
发表于 2007-12-5 17:44 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

5#
发表于 2007-12-5 18:52 | 只看该作者
bandwidth?
那也就是说带宽影响纹理填充率?
回复 支持 反对

使用道具 举报

6#
发表于 2007-12-5 18:58 | 只看该作者
像素吞吐率。
回复 支持 反对

使用道具 举报

7#
发表于 2007-12-5 22:18 | 只看该作者
带宽x频率/8~~~ms~~~囧~~~不清楚~~
回复 支持 反对

使用道具 举报

8#
 楼主| 发表于 2007-12-5 22:18 | 只看该作者
原帖由 来不及思考 于 2007-12-5 17:44 发表
bandwidth

显存带宽吗?貌似我算来算去都对不上这个测试数据啊。能给个详细的算法吗:a)
回复 支持 反对

使用道具 举报

9#
发表于 2007-12-5 22:21 | 只看该作者
原帖由 rongronglulu 于 2007-12-5 22:18 发表

显存带宽吗?貌似我算来算去都对不上这个测试数据啊。能给个详细的算法吗:a)



256*1800/8=57600~~囧?~~

[ 本帖最后由 cxasuka 于 2007-12-5 22:23 编辑 ]
回复 支持 反对

使用道具 举报

10#
 楼主| 发表于 2007-12-5 22:22 | 只看该作者
原帖由 Edison 于 2007-12-5 18:58 发表
像素吞吐率。

吞吐率和填充率又有什么区别呢:wacko:
回复 支持 反对

使用道具 举报

11#
 楼主| 发表于 2007-12-6 13:44 | 只看该作者
原帖由 cxasuka 于 2007-12-5 22:21 发表



256*1800/8=57600~~囧?~~

不对啊,你这个算法变成显存带宽了:funk:
回复 支持 反对

使用道具 举报

12#
发表于 2007-12-6 13:59 | 只看该作者
原帖由 rongronglulu 于 2007-12-6 13:44 发表

不对啊,你这个算法变成显存带宽了:funk:


=。=~~~果然錯了啊~~~~
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2007-12-6 16:25 | 只看该作者
高手们是不是都太忙了没空上网啊:a)
回复 支持 反对

使用道具 举报

14#
发表于 2007-12-6 16:50 | 只看该作者
8800gt pixel throughput= 16ROP*600MHz = 9.6Gpixels/s
9.6Gpixel * 32bit /8bit/pixel = 38.4GB/s

3DMARK06的fill rate测试是带alpha blending的,因此fill rate所需的带宽会再高一倍,即76.8GB/s

8800GT的带宽是1800MT/s*256bit/8bit=57.6GB/s

理论需求/峰值带宽=0.75x,撑死了,G92在3dmark06能达到的填充速率也只能是7.2Gpixle/s,由于带宽利用率本身不可能达到100%,因此测试出来的也就是自幼5.2Gpixels/s。
回复 支持 反对

使用道具 举报

15#
 楼主| 发表于 2007-12-6 17:51 | 只看该作者
原帖由 Edison 于 2007-12-6 16:50 发表
8800gt pixel throughput= 16ROP*600MHz = 9.6Gpixels/s
9.6Gpixel * 32bit /8bit/pixel = 38.4GB/s

3DMARK06的fill rate测试是带alpha blending的,因此fill rate所需的带宽会再高一倍,即76.8GB/s

8800GT的 ...

我把8800gt的核心频率调节到324.这样按你的算法pixel throughput= 16ROP*324MHz = 5.2Gpixels/s

算上alpha blending,需要的带宽就是5.2Gpixels/s*32bit /8bit/pixel *2=41.6GB/s。

然后我用3dmark06分别测试了显存频率为1000和2000时的fill rate single。但是得到的结果几乎是一样的,都是2.6Gpixels/s左右,也就是峰值的一半。

显存为1000时带宽为32GB/s,如果这时候时带宽不够,那你如何解释显存为2000,带宽为64GB/s的时候,测得的结果没有任何增加?这个如何解释???按你的说法至少应该有一点点增加吧。

我感到最奇怪的就是,貌似G8x和G92系列的fill rate single怎么测都是频率x rops 的一般左右,这是为什么??
回复 支持 反对

使用道具 举报

16#
 楼主| 发表于 2007-12-6 17:58 | 只看该作者
ShaderModel 3.0 特性测试

GeForce
8800GTX
GeForce
7900GTX
Fill Rate Single texturing
MTexels/s)
6979.7017313.395
Fill Rate Multi texturing
(MTexels/s)
17924.03915467.960
Pixel Shader169.732fps103.428fps
Vertex Shader Simple
(MVertices/s)
215.998192.909
Vertex Shader Complex
(MVertices/s)
107.22059.702
Shader Particles(SM3.0)127.747fps21.520fps
Shader Noise(SM3.0)48.650fps20.686fps

还有怎么解释这里的7900GTX能够达到7313.395Mtexels/s?按cho的算法这个需要带宽7313.395*32/8*2=58.5GB/s

但是这里测试用的79GTX显存频率只有1600MHZ,那么带宽只有1600*256/8=51.2GB/s

测出来的结果的所需带宽都超过实际的带宽了,如何解释:w00t):

并且,88GTX的理论峰值填充率和带宽都大于79GTX的情况下,在这个测试中Fill Rate Single怎么还输了???:w00t):
回复 支持 反对

使用道具 举报

17#
 楼主| 发表于 2007-12-6 19:38 | 只看该作者
顶上天:a) :a)
回复 支持 反对

使用道具 举报

18#
 楼主| 发表于 2007-12-7 11:05 | 只看该作者
中午顶一下:a)
回复 支持 反对

使用道具 举报

19#
 楼主| 发表于 2007-12-7 14:05 | 只看该作者
这个问题我自己来回答。经过我最近查的很多资料,表明由于3dmark的单纹理填充率测试用了alpha blendd,单纹理填充率不但受限于显存带宽,还受限于blend unit。对于G7x,16个ROP就是有16个blend units,这时候瓶颈在于显存带宽;对于G80、G92,blend unit相对于ROP是半速运行的,或者按B3D的说法是一对ROP公用一个blend unit,造成此时瓶颈在于blend unit的数量。这就是为什么G80G92测试中单纹理填充率都是ROPs x 频率(显存带宽足够用了)。

另外,貌似nv只在G70,G71时代才在最高端的卡上用过one blend unit per ROP。其他做到这点的都是中低端卡,比如6800GS(8 blend units and 8 ROPs)。

另外想不通,R600只用了16个TMU,这对它512bit的带宽简直是种亵渎。怪不得rv670改成256bit了,足够用了。
回复 支持 反对

使用道具 举报

20#
发表于 2007-12-7 14:58 | 只看该作者
不明白单纹理填充为什么受限于Blend unit.Cho还是详细解释吧
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-7-26 13:27

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表