|
RSX 的 Pixel shader 是 500MHz,24 个 Pixel Shader ,每个 Pixel Shader 内有 两个 Vec4 MAD,每个 Pixel Shader 可以每个周期完成 16FLOP , RSX 的 Pixel Shader 理论可编程浮点性能是 192 GLOPS。
RSX 采用 Vertex / Pixel 分离的架构,Vertex Shader 部分是 8 个 (Vec4 MAD + Scalar MAD) 的架构,假设 RSX 没有采用 G7x 的异频模式,那么 Vertex Shader 的频率就是 500MHz,理论浮点性能是 40 GFLOPS。
不过厂商有时候出于宣传的目的,还会把 GPU 中的非可编程部分的浮点单元也拿来作统计,这样就能凑出非常高的 GLOPS,以 texture filtering 为例:
Bilinear interpolation 的 算式包含了 4 mul, 3 add、 2 sub,这样就是 9 个 ops 了,每个 texel 包含有 4 个 component, 9 op x4 component = 36 ops。
G7x 的 TMU 可以(不记得清楚了)每两个周期完成一个 FP16 4D 纹理的 Bilinear interpolation,24 个 TMU 就能做到 216 GLOPS。
如果 G7x 的 TMU 可以做到每两个完成一个 FP16 4D 纹理的 16X aniotropic filtering,那就可以"变成" 1728 GLOPS
这个还没计算每个 ROP 跑 belnding 时候的 12ops。
anyway,在一般的情况下,我们应该看 pixel shader 的浮点性能,因为这是比较容易对比的。 |
|