|
flop 不是指令数,而是指浮点运算数。
例如一条 FMADD 指令,可以看成是 a=a+b*c,这里有两个运算符,因此这条指令算是 2 flops。
GT200 的 SP 可以实现 dual-issue,在特定情况下可以实现单周期执行 1 条 FMADD 指令和一条 MUL 指令,MUL 是乘法指令即 a=a*b,这算一个运算符。MADD 加上 MUL,就是 3 flops。
G80 的 dual-issue 能力实际上只有 2 flops+0.25 flops 的水平,因为 SFU 是按照 4 SP : 1 SFU 的方式配置。
GT200 的双精度运算能力是基于 MAD 指令峰值 1/8,大约是 80GFLOPS。
目前 CPU 的双精度运算能力绝大部分是单精度的 1/2。 |
|