POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 4566|回复: 28
打印 上一主题 下一主题

预计“常青”到“南岛”的变化,可信可不信

[复制链接]
跳转到指定楼层
#
发表于 2010-8-29 11:44 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
      高端RV870由两组运算模块组成,每800sp一组。中端RV840为一组运算模块。RV970则是六组运算模块,每320sp一组,总共1920sp单元;RV940是四组运算模块,总共1280sp。TS单元和每组运算模块绑定,这样同频率下RV940的TS性能为RV870的两倍,RV970为3倍。
      南岛为4D微架构,这样RV970总发射端为480,多出RV870 50%,相应带宽需求也高出很多,但是RV970仍然采用256bitGDDR5;RV940总发射端和RV870持平,同样采用256bitGDDR5,实际上,我们应该把RV940看作是和RV870同级别的产品。
      RV970和RV940运算单元比例为3:2;GTX470和GTX460的比例是4:3。高端和中端性能差距过大的情况正在得到扭转。
28#
 楼主| 发表于 2010-11-23 14:02 | 只看该作者
PaulWong 发表于 2010-11-23 00:24
楼主的精神可嘉。。。。。1 F" Y6 O  L' c: v3 |- t
偶素说扮砖家的精神哦

在您这位老砖家面前我怎敢称大…………
回复 支持 反对

使用道具 举报

27#
发表于 2010-11-23 00:33 | 只看该作者
shu0202 发表于 2010-8-29 11:44
高端RV870由两组运算模块组成,每800sp一组。中端RV840为一组运算模块。RV970则是六组运算模块,每32 ...

现在看来还是一大半预测内容还是比较靠谱的
回复 支持 反对

使用道具 举报

26#
发表于 2010-11-23 00:24 | 只看该作者
楼主的精神可嘉。。。。。1 F" Y6 O  L' c: v3 |- t
偶素说扮砖家的精神哦
回复 支持 反对

使用道具 举报

25#
发表于 2010-11-22 22:58 | 只看该作者
shu0202 发表于 2010-8-29 11:44
高端RV870由两组运算模块组成,每800sp一组。中端RV840为一组运算模块。RV970则是六组运算模块,每32 ...

红衣美眉的料果然是真的

帮顶另外+1~
回复 支持 反对

使用道具 举报

24#
 楼主| 发表于 2010-11-22 21:41 | 只看该作者
cool_exorcist 发表于 2010-8-29 11:47
你老的话好像重来没靠谱过。

猜对了一半,还算可以把……
回复 支持 反对

使用道具 举报

23#
发表于 2010-8-30 15:31 | 只看该作者
楼主头像mm不错

虽然分析的不是很靠谱,但比某满嘴跑火车的18君来说,好很多了
回复 支持 反对

使用道具 举报

22#
发表于 2010-8-30 11:06 | 只看该作者
我看成“常州”到“南京”了
回复 支持 反对

使用道具 举报

21#
发表于 2010-8-30 10:41 | 只看该作者
如果说TS性能提升相对容易,那么CS性能提升可就不是一蹴而就的。
回复 支持 反对

使用道具 举报

20#
发表于 2010-8-30 10:41 | 只看该作者
老眼昏花,竟然看成“青岛”和“南京”了。
回复 支持 反对

使用道具 举报

19#
 楼主| 发表于 2010-8-30 10:33 | 只看该作者
Cayman是方方正正的核心,不是GF104那样长方形的……
回复 支持 反对

使用道具 举报

18#
 楼主| 发表于 2010-8-29 22:40 | 只看该作者
运算单元既不是晶体管的大头也不是芯片面积的大头.可以省晶体管,省不了多少面积.

自己去看EG的构架, ...
los_parrot 发表于 2010-8-29 16:00

你想得太复杂了……布局问题和架构问题是两回事
回复 支持 反对

使用道具 举报

17#
发表于 2010-8-29 17:10 | 只看该作者
连RV940面积都大于RV870面积,功耗发热杯具,更不用说RV970了
回复 支持 反对

使用道具 举报

16#
发表于 2010-8-29 16:00 | 只看该作者
没有那么夸张……管线部分砍掉1D能节省运算单元10—15%的晶体管,对BART来说相当于将近1亿晶体管可以用到前 ...
shu0202 发表于 2010-8-29 15:04


运算单元既不是晶体管的大头也不是芯片面积的大头.可以省晶体管,省不了多少面积.

自己去看EG的构架,缓存和寄存器都挂在什么上面.这个部位规模X2,芯片只有往大了跑,绝对不会变小.

6simd array都可以布局了3simd array反而不可以?你有没有想过数据在6个simd array间传输,耗电比2simd array会高多少倍?L1的crossbar,L2的crossbar,MC的crossbar全部指数级提升复杂度.

3Xsimd array都是乐观的看法了,实际上simd engine扩张到24个SC也有可能.照样实现1920sp.
回复 支持 反对

使用道具 举报

15#
发表于 2010-8-29 15:46 | 只看该作者
估计是9700-9800那样的变化,半代
回复 支持 反对

使用道具 举报

14#
发表于 2010-8-29 15:13 | 只看该作者
喜欢看lz的
头像
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2010-8-29 15:04 | 只看该作者
本帖最后由 shu0202 于 2010-8-29 15:07 编辑

没有那么夸张……管线部分砍掉1D能节省运算单元10—15%的晶体管,对BART来说相当于将近1亿晶体管可以用到前端和其他地方,实际算下来HD6700会比RV870小20%左右;CAYMAN所谓的3TPS没法实现,芯片上根本无法布局……
回复 支持 反对

使用道具 举报

12#
发表于 2010-8-29 14:52 | 只看该作者
Barts如果是1280SP,6830這個型號就沒有出現的機會了,問題是不管什麽良品率,6830都非出不可
回复 支持 反对

使用道具 举报

11#
发表于 2010-8-29 14:47 | 只看该作者
本帖最后由 los_parrot 于 2010-8-29 14:49 编辑

首先,现在这个阶段还在用南岛就是个错误.因为所有消息来源都指出南岛只是忽悠,rv9xx的代号是北岛,北岛原定在32nm的节点投产,因为tsmc取消32nm,改成了继续使用40nm.

10.8驱动里NI字样还不足的话,那么产品代号:antilles,cayman,bart,turk,caicos全部都是岛屿的名字而且全部都在北半球.
==
NI:stream core=4Xstream processors(4D SP)
EG:stream core=5Xstream processors(5D SP)

每个SIMD engine=16 Stream Core(SC)

每组SIMD array=10 simd engine

5870=2XSIMD Array,20SIMD engine,320SC,5D,1600SP
5850每simd engine砍了1个SC,其它不变,288SC,1440SP
5830每simd engine砍了2个SC,ROP屏蔽1半,其它不变,240SC,1200SP

BART=2X SIMD ARRAY,20SIMD engine,320stream core(SC),4D,1280stream processors(SP).
cayman=3XSIMD ARRAY,1920SP

如果BART照你说的用4组阵列的话,前端将是rv870的2倍,缓存也是两倍,核心面积恐怕要比rv870大至少60%,因为5D=>4D去掉的ALU所占面积是很少的.

amd改5D为4D唯一合理的解释就是当初5D多的一个ALU占地面积不多,虽然利用率不高但是总能提高一点性能.但是SP从320增加到1600以后,低利用率的那个1D单元数量也积少成多到了320个,相当于3870的规模.这个时候就有砍掉的必要了.
回复 支持 反对

使用道具 举报

头像被屏蔽
10#
发表于 2010-8-29 14:27 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

9#
发表于 2010-8-29 14:01 | 只看该作者
模塊化6組之前可是我一個人的預測呀
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-12 04:18

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表