本帖最后由 lik 于 2012-5-23 03:21 编辑
蕊珠 发表于 2012-5-22 12:22 ![]()
这是我自己的算法,你可以不把这个看成浮点运算,看做实际游戏运算能力更好,用官方的数据无法预测性能 ...
那我建议你换个名字, 比如等效性能. 但是问题其实不是那么简单. 你的数字本质上就是比cuda core的数量, 而忽略了架构变化带来的效率的提高. 你觉得你的数字能代表实际游戏运算能力吗? 你的数字在gf110和gk104之间的比例, 能对应实际游戏的性能差别吗? 我觉得差得很多. 这里的原因很多, 比如SMX和fermi SM的core 利用率在某些游戏里面可能差很多, 在你的公式里面只考虑了core数量, 没有考虑利用率. 再比如core数量或者浮点运算也不是决定游戏性能的唯一因素. 一般的游戏都是有些帧是shader limited, 有些帧是memory limited. 遇到memory limited的时候用BW来评估性能差别. 要预测性能是很复杂的事, 不是一个简单公式可以搞定的.如果非要用一个简单公式来近似, 至少要考虑BW的影响. 还有texture. Texture-limited的情况还是很多的. 其他的rop, culling, clipping, rasterization等等也许可以看成二阶的.
|