POPPUR爱换

标题: 预计“常青”到“南岛”的变化，可信可不信 [打印本页]

作者: shu0202 时间: 2010-8-29 11:44
标题: 预计“常青”到“南岛”的变化，可信可不信
   高端RV870由两组运算模块组成，每800sp一组。中端RV840为一组运算模块。RV970则是六组运算模块，每320sp一组，总共1920sp单元；RV940是四组运算模块，总共1280sp。TS单元和每组运算模块绑定，这样同频率下RV940的TS性能为RV870的两倍，RV970为3倍。
   南岛为4D微架构，这样RV970总发射端为480，多出RV870 50%，相应带宽需求也高出很多，但是RV970仍然采用256bitGDDR5；RV940总发射端和RV870持平，同样采用256bitGDDR5，实际上，我们应该把RV940看作是和RV870同级别的产品。
   RV970和RV940运算单元比例为3：2；GTX470和GTX460的比例是4：3。高端和中端性能差距过大的情况正在得到扭转。

作者: cool_exorcist 时间: 2010-8-29 11:47
你老的话好像重来没靠谱过。

作者: iamw2d 时间: 2010-8-29 11:58
我一个月前就这么说过了

作者: deadmeat 时间: 2010-8-29 12:05
提示: 作者被禁止或删除内容自动屏蔽

作者: iamw2d 时间: 2010-8-29 12:06
另外有一点光把tesselator加在每组运算单元上是不行的
多边型生成率上不去也没用我的意见就是 ni是个多核每个核的规模更小至于vliw变不变没太大关系

作者: xxxyyy 时间: 2010-8-29 12:09
提示: 作者被禁止或删除内容自动屏蔽

作者: AlcatrazX 时间: 2010-8-29 12:42
提示: 作者被禁止或删除内容自动屏蔽

作者: 095707 时间: 2010-8-29 13:07
提示: 作者被禁止或删除内容自动屏蔽

作者: 1101 时间: 2010-8-29 13:32
楼主的精神可嘉。。。。。
偶素说扮砖家的精神哦

作者: WG_Baby 时间: 2010-8-29 14:01
模塊化6組之前可是我一個人的預測呀

作者: LockheedMartin 时间: 2010-8-29 14:27
提示: 作者被禁止或删除内容自动屏蔽

作者: los_parrot 时间: 2010-8-29 14:47
本帖最后由 los_parrot 于 2010-8-29 14:49 编辑

首先,现在这个阶段还在用南岛就是个错误.因为所有消息来源都指出南岛只是忽悠,rv9xx的代号是北岛,北岛原定在32nm的节点投产,因为tsmc取消32nm,改成了继续使用40nm.

10.8驱动里NI字样还不足的话,那么产品代号:antilles,cayman,bart,turk,caicos全部都是岛屿的名字而且全部都在北半球.
==
NI:stream core=4Xstream processors(4D SP)
EG:stream core=5Xstream processors(5D SP)

每个SIMD engine=16 Stream Core(SC)

每组SIMD array=10 simd engine

5870=2XSIMD Array,20SIMD engine,320SC,5D,1600SP
5850每simd engine砍了1个SC,其它不变,288SC,1440SP
5830每simd engine砍了2个SC,ROP屏蔽1半,其它不变,240SC,1200SP

BART=2X SIMD ARRAY,20SIMD engine,320stream core(SC),4D,1280stream processors(SP).
cayman=3XSIMD ARRAY,1920SP

如果BART照你说的用4组阵列的话,前端将是rv870的2倍,缓存也是两倍,核心面积恐怕要比rv870大至少60%,因为5D=>4D去掉的ALU所占面积是很少的.

amd改5D为4D唯一合理的解释就是当初5D多的一个ALU占地面积不多,虽然利用率不高但是总能提高一点性能.但是SP从320增加到1600以后,低利用率的那个1D单元数量也积少成多到了320个,相当于3870的规模.这个时候就有砍掉的必要了.

作者: WG_Baby 时间: 2010-8-29 14:52
Barts如果是1280SP，6830這個型號就沒有出現的機會了，問題是不管什麽良品率，6830都非出不可

作者: shu0202 时间: 2010-8-29 15:04
本帖最后由 shu0202 于 2010-8-29 15:07 编辑

没有那么夸张……管线部分砍掉1D能节省运算单元10—15%的晶体管，对BART来说相当于将近1亿晶体管可以用到前端和其他地方，实际算下来HD6700会比RV870小20%左右；CAYMAN所谓的3TPS没法实现，芯片上根本无法布局……

作者: sfeng0 时间: 2010-8-29 15:13
喜欢看lz的
头像

作者: asd1508 时间: 2010-8-29 15:46
估计是9700-9800那样的变化，半代

作者: los_parrot 时间: 2010-8-29 16:00

没有那么夸张……管线部分砍掉1D能节省运算单元10—15%的晶体管，对BART来说相当于将近1亿晶体管可以用到前 ...
shu0202 发表于 2010-8-29 15:04

运算单元既不是晶体管的大头也不是芯片面积的大头.可以省晶体管,省不了多少面积.

自己去看EG的构架,缓存和寄存器都挂在什么上面.这个部位规模X2,芯片只有往大了跑,绝对不会变小.

6simd array都可以布局了3simd array反而不可以?你有没有想过数据在6个simd array间传输,耗电比2simd array会高多少倍?L1的crossbar,L2的crossbar,MC的crossbar全部指数级提升复杂度.

3Xsimd array都是乐观的看法了,实际上simd engine扩张到24个SC也有可能.照样实现1920sp.

作者: Windyson 时间: 2010-8-29 17:10
连RV940面积都大于RV870面积,功耗发热杯具,更不用说RV970了

作者: shu0202 时间: 2010-8-29 22:40