|
coollab 发表于 2013-9-23 13:26 ![]()
我也是这样想的。。。。
算了 还是说说我的理解
amd这边cu每周期送出一个wavefront给一个simd 一个simd需要四个周期跑完一个wavefront
一共四个simd 正合适
如果在单独的添加dp alu的simd 那么数量就会大于4 所以毫无意义
nvidia这边每周期我没记错的话是抓出两个warp 而warp与wavefront不同 可以带两个指令
所以每周期kepler最多可以发射出4条指令 所以有冗余的单元也不是什么奇怪的事 |
|