|
sse指令的提升指的是数据运算宽度,以前64bit浮点或者80bit浮点运算,现在用sse的128bit浮点寄存器可以1次做2个,以前一个周期可以做一个add或mul,现在一个周期做add/mul两个运算.从这个角度看快了好几倍不止.但是cpu前端并没有变化,数据从内存加载到l2,l1的延迟不变,存取数据的宽度不变,向浮点寄存器加载计算所需的数据的带宽和延迟也没有改变,所以最终结果根本到不了2倍或4倍.
而且游戏的fps跟很多东西相关,不是只有物理一个项目的,提高物理对游戏有20%的提升我都不信.物理运算吞吐量提升个20%还差不多吧.比如粒子效果,用sse指令也许可以少几个pass,速度提高4倍8倍的,但是最后还不是要靠显卡来渲染输出?cpu到显卡的传输带宽,显卡的渲染能力又没有提高10倍8倍. |
|