|
原帖由 ZJRS 于 2007-2-21 14:49 发表
还有是不是PC的多数显卡在处理mad r0,r0,r1,v0 rsq r2.w,r3.w时,是否是用2个周期来完成,而C1可以一个周期来完成?
对于3D+1D的运算单元,上述指令需要2周期来执行。
对于4D+1D的运算单元,上述指令需要1周期来执行。
对于RSX是24x(4D+4D),所以上述指令对于一条完整的RSX的PS流水线,在没有纹理贴图操作时,可以一周期完成,也就是RSX一周期可以执行24次上述指令。但往后倒推到NV40,由于rsq会block掉另一个SU,所以需要两周期。
对于C1,因为它是48x(4D+1D)所以上述指令对于一个C1的shader pipeline来说可以1周期完成。也就是C1可以一周期执行48次上述指令。
对于X1900,因为它是48x(3D+1D),所以上述指令需要两周期完成,不过如果把第一个指令从mad换成add,则该指令可由mini alu执行,所以上述指令依然可以一周期完成。 |
|