|
哦,大概明白了。
我感觉和gf100主要的区别是1:16个simd打包成一组,每组分配一个64kBYTE的向量寄存器外加4kBYTE的标量寄存器(这个ms fermi的sm里是一组32k 32bit的无差别的寄存器)寄存器大小差不多但是一个是8bit一个32bit,不知道有什么影响。
2另外shared memory和l1是固定不可变的,和fermi中不太一样。
3线程数量也不太一样,fermi貌似在gt200以后精简了线程调度。
4gcn里比sm里多了一个scaler unit。不知道他的simd里有没有整数单元,而fermi的cuda core里都有alu,整数运算量上两者不知道是否有差距,另外开普勒不是要增加整数运算性能么,这样的话整数性能不知道和开普勒能不能战在同一起跑线上。
本人是学机械的,对于如此具体的差别甚是不精,求e大明示 |
|