POPPUR爱换

标题: 290X规格: 512BIT+2816SP ??????? [打印本页]

作者: gtx5    时间: 2013-9-22 20:44
标题: 290X规格: 512BIT+2816SP ???????
[attach]2374869[/attach]

512BIT没跑了就是不知道是不是2816SP

作者: westlee    时间: 2013-9-22 20:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: coollab    时间: 2013-9-22 21:12
lzhpro2 发表于 2013-9-22 21:06
多了816SP,三分之一MC,面积才提升10%,AMD是掌握了什么UFO科技吗?
牺牲显存速度扩大显存位宽,结果一分 ...

我下午也百思不得其解

不过有消息说AMD放弃了使用高速度的GDDR5 MC,转而用了低速度、大位宽,衡量后认为这样更为合理。这种比较差的MC面积比较小。

不过流处理器如此之多,才增加了10%,太不可思议了。
作者: boltblade    时间: 2013-9-22 21:14
coollab 发表于 2013-9-22 21:12
我下午也百思不得其解

不过有消息说AMD放弃了使用高速度的GDDR5 MC,转而用了低速度、大位宽,衡量后认 ...

跟双精度有没有关系?这次290X会不会也阉割了双精度。
作者: fengpc    时间: 2013-9-22 21:30
512bit GDDR5频率跑高了功耗很吓人的啊,不一定是因为用了低频MC,看发布时候怎么说吧
作者: coollab    时间: 2013-9-22 21:39
boltblade 发表于 2013-9-22 21:14
跟双精度有没有关系?这次290X会不会也阉割了双精度。

我觉得有,毕竟算双精度的那一坨体积还是不小的。
作者: westlee    时间: 2013-9-22 21:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: a9988a    时间: 2013-9-22 22:10
lzhpro2 发表于 2013-9-22 21:06
多了816SP,三分之一MC,面积才提升10%,AMD是掌握了什么UFO科技吗?
牺牲显存速度扩大显存位宽,结果一分 ...

7870x2

8個字符了
作者: iamw2d    时间: 2013-9-22 22:12
coollab 发表于 2013-9-22 21:39
我觉得有,毕竟算双精度的那一坨体积还是不小的。

据我所知gcn似乎并没有像kepler有专用的dp alu
作者: 结果    时间: 2013-9-22 22:13
两家都是布勃卡所以没啥可奇怪的
作者: coollab    时间: 2013-9-22 22:18
iamw2d 发表于 2013-9-22 22:12
据我所知gcn似乎并没有像kepler有专用的dp alu

那么GCN是怎样进行双精度计算的呢?
作者: iamw2d    时间: 2013-9-22 22:22
coollab 发表于 2013-9-22 22:18
那么GCN是怎样进行双精度计算的呢?

sp的alu拼接而成
这点可以从之前tahiti和pitcairn的dieshot上看出来 alu部分并没有明显的增加什么
而nv的也有dieshot sp的alu上方增加了很大一块dp alu
等会儿时间多的话我给你找图
作者: iamw2d    时间: 2013-9-22 22:38
coollab 发表于 2013-9-22 22:18
那么GCN是怎样进行双精度计算的呢?

[attach]2375040[/attach]
借用rskip的图 对比下最上方的区域就明白了

作者: coollab    时间: 2013-9-23 10:13
iamw2d 发表于 2013-9-22 22:38
借用rskip的图 对比下最上方的区域就明白了

有个问题是,既然AMD的SP拼接可以有效的计算DP,为什么NV还专门弄一个大的不得了的DP单元?
作者: Windyson    时间: 2013-9-23 11:24
对于7970:SP x1.375,MC x1.333,面积不到x1.1

对于7870:SP x2.2,MC x2,面积x1.98,这个可信度高些
作者: yukika    时间: 2013-9-23 12:16
iamw2d 发表于 2013-9-22 22:38
借用rskip的图 对比下最上方的区域就明白了

官方Die-shot随便看看就行了.......
比如Tegra 3那个,Cayman那个

如果这样Pitcairn完全可以在专业市场上开放DP
作者: yukika    时间: 2013-9-23 12:43
coollab 发表于 2013-9-23 10:13
有个问题是,既然AMD的SP拼接可以有效的计算DP,为什么NV还专门弄一个大的不得了的DP单元?

为什么会理解成DP单元无法用来计算SP....."专门"
作者: coollab    时间: 2013-9-23 12:50
yukika 发表于 2013-9-23 12:43
[sweatingbullets>为什么会理解成DP单元无法用来计算SP....."专门"

。。。。。
表达有误。。。
作者: 66666    时间: 2013-9-23 12:56
westlee 发表于 2013-9-22 21:58
双精度去掉的话,还做啥专业卡产品线。

做纯计算卡不行,一般的专业图显卡还是可以的
作者: asdfjkl    时间: 2013-9-23 13:06
本帖最后由 asdfjkl 于 2013-9-23 13:07 编辑
coollab 发表于 2013-9-23 10:13
有个问题是,既然AMD的SP拼接可以有效的计算DP,为什么NV还专门弄一个大的不得了的DP单元?

GK110, 双精度: 单精度计算峰值 = 1: 3; GF110,双精度: 单精度计算峰值 = 1: 2;
Tahiti,双精度: 单精度计算峰值 = 1: 4;


这就是差距。

作者: rSKip    时间: 2013-9-23 13:18
coollab 发表于 2013-9-23 10:13
有个问题是,既然AMD的SP拼接可以有效的计算DP,为什么NV还专门弄一个大的不得了的DP单元?

顺序双发射和顺序单发射的区别吧。
作者: coollab    时间: 2013-9-23 13:26
lzhpro2 发表于 2013-9-23 13:19
有个疑问啊,如果是拼接计算双精度,那么7800的双精度跟7900完全不成比例啊,面积也比不成比例啊。如果只 ...

我也是这样想的。。。。
作者: iamw2d    时间: 2013-9-23 13:34
本帖最后由 iamw2d 于 2013-9-23 13:36 编辑
coollab 发表于 2013-9-23 10:13
有个问题是,既然AMD的SP拼接可以有效的计算DP,为什么NV还专门弄一个大的不得了的DP单元?


楼上rskip本尊在
我感觉他会更明白些

作者: iamw2d    时间: 2013-9-23 13:52
coollab 发表于 2013-9-23 13:26
我也是这样想的。。。。

算了 还是说说我的理解
amd这边cu每周期送出一个wavefront给一个simd 一个simd需要四个周期跑完一个wavefront
一共四个simd 正合适
如果在单独的添加dp alu的simd 那么数量就会大于4  所以毫无意义

nvidia这边每周期我没记错的话是抓出两个warp 而warp与wavefront不同 可以带两个指令
所以每周期kepler最多可以发射出4条指令 所以有冗余的单元也不是什么奇怪的事




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4