|
原帖由 fineday 于 2006-11-24 12:44 发表
直接针对R600和G80来说,R600可以用很小的代价提升性能,方法和R520->R580一样,爆增ALU。R600可以做到很方便的把ALU数目x3而不用花太多的晶体管,只是如果threading单元跟不上,ALU可能会闲置导致效率下降, ...
我们来看一下C1,16 shader per bank,然而thread/branch方面的表现并没有怎样不济;如果R600做到128US的话,也不过8 US per bank罢了
反过来说,R580的表现如何?他的thread能力尚且不如128US的R6XX(更何况4D单元对于thread的压力本来就要小于1D单元,强求两者的thread资源对等没有必要) |
|