POPPUR爱换

标题: 一个flops的数字疑惑,请教~ [打印本页]

作者: liuweifeng    时间: 2008-6-4 17:12
标题: 一个flops的数字疑惑,请教~
最近看了看GT200和老R600的参数,对他们的flops计算方法产生了疑惑,请教:

1、GT200宣称的1296 MHz240个SP,算上co-issue,那么flops不就是:
240*1296*(2MADD+1MUL)=911.25Gflops,那么一些资料中的933Gflops是从哪来的呢?还有参数里的140.8G带宽也对不上显存频率的~


2、R600的ppt里写的是其5D ALU都可以执行MADD操作;可网上的一些资料写道其中只有4D可以MADD,1D只能MUL,那么究竟哪个是实际情况呢?


3、GT200和G80宣称的co-issue有实际意义么?
如果有,那是不是意味着SP里的同一个周期可以对不同的数据进行运算,否则,对同一个数据同时进行MADD和MUL的意义何在呢?


请各位大大解释,先行谢过!
作者: Edison    时间: 2008-6-4 17:16
1、你怎么算出911那么神奇的^0^

240*1296*3FLOP=933.120GLFOPS。

2、R6XX的shader都可以实现5*MAD=10FLOP

3、意义不是很大。
作者: liuweifeng    时间: 2008-6-4 17:23
Edison手可真快,先谢啦:)
我是用1024去除的..所以得到911,原来用1000去除才能得到933啊,那么为什么用1000而不是1024呢?难道是行业标准?

问题3续:
那么SP里的同一个周期到底可不可以对不同的数据进行运算呢?

再谢!
作者: Edison    时间: 2008-6-4 19:04
衡量性能指标的时候,我看到的都是直接用1000来做区间的。


不明白你问的意思。R600的shader是5-way superscalar。
作者: liuweifeng    时间: 2008-6-4 19:39
可能是我没说明白,我的问题3的意思是:

G80不是宣称co-issue么,那么SP里的同一个周期到底可不可以对不同的数据进行运算呢?也就是说:

在一个时钟周期里是不是只能做:
madd r1.x r2.x r1.x 和 mul r1.x r2.x r1.x (注意数据相同)
还是可以做:
madd r1.x r2.x r1.x 和 mul r3.x r4.x r3.x (注意数据不同)

不知这回说没说明白:)
作者: cellwing    时间: 2008-6-4 19:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2008-6-5 11:46
如果不相依的话是可以实现,但是问题是g80的co-issue效果微乎其微。
作者: 心酸的事    时间: 2008-6-17 16:28
菜鸟路过···跟帖学习
作者: lang_269    时间: 2008-6-17 17:07
观贴不语,闷头捡米




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4