|
darkstorm 发表于 2012-3-20 01:15 ![]()
如果你用的OCL benchmark那么一个Block线程数量只有64
这样的block是不能占满新一点架构的,会导致发射的指 ...
以目前的状况来看,Fermi被塞的很好很满,单双精度带宽对齐的非常好。到HD7000这一边,无论Tahiti、Pitcairn还是Cape Verde的单双精度都无法对齐,但问题出在DP这边过低。而GK104……
所以我会对当下的状况感到抓狂嘛。
擅自动别人写的软件不好,所以我还是等NV的新OCL支持吧。 |
|