如果是20个VLIW的确比较悲剧, 那样OpenCL程序大家都可以不要做了 wavefront不是2的幂次方,很难做优化 ... darkstorm 发表于 2010-9-17 09:12
GPUCapsviewer 无法看出 wavefront size,不过 NVIDIA 的卡可以看出 warp size。 Edison 发表于 2010-9-17 10:48
就是说讨论的前提是错的咯 xiaxin222a 发表于 2010-9-17 10:54
我估计你看到的 20,是指 compute units,这个实际上就是 SIMD engine 数量。 Edison 发表于 2010-9-17 11:03