频率方面A2版本就基本能确定下来,我列出的数据基于比较理想的状态,实际上没这么高,甚至某些数值比不上RV870。A3版本目标就是提升良率。
Fermi的双精度计算追求从管线利用到内存带宽利用对游戏运算都是有负面影响的。G80那样的单位运算效能不会再出现了。
shu0202 发表于 2009-12-3 09:57
Fermi管线中有专门负责双精度运算的DP向量单元,运行目前的游戏它不能被充分利用;未来光线追踪游戏也许会采用双精度算法,全速运转的DP单元会占用几乎所有数据资源,管线中另外的普通运算单元又会闲置。
ECC机制遍布于缓存和内存控制当中,当然要占用带宽而导致实际带宽降低……
Fermi管线中有专门负责双精度运算的DP向量单元,运行目前的游戏它不能被充分利用;未来光线追踪游戏也许会采用双精度算法,全速运转的DP单元会占用几乎所有数据资源,管线中另外的普通运算单元又会闲置。
ECC机制遍布于缓存和内存控制当中,当然要占用带宽而导致实际带宽降低……
shu0202 发表于 2009-12-3 10:08
我觉得L2 cache对于加速shader指令的处理/装载速度会有帮助,但对图形性能不一定有大的帮助,图形性能基本都在像素处理上;处理所有像素之前,shader指令只装载一次就好了,接下来就是等待像素处理。请E大指教。
gz_easy 发表于 2009-12-3 14:03
但是对于一般的3D game之类的app都不是为multi-threading优化或开发的,数据代码里仍然存在相当高的耦合度,即使专门为多线程GPU写的app, DX可能在里面要做很多支持,multi-threading主要用于计算应用的比较多吧, 但对于3D game之类的app,由于本身的耦合性,用途可能不太大。
gz_easy 发表于 2009-12-3 16:40
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |