POPPUR爱换

标题: 290X规格: 512BIT+2816SP ??????? [打印本页]

作者: gtx5 时间: 2013-9-22 20:44
标题: 290X规格: 512BIT+2816SP ???????
[attach]2374869[/attach]

512BIT没跑了就是不知道是不是2816SP

作者: westlee 时间: 2013-9-22 20:49
提示: 作者被禁止或删除内容自动屏蔽

作者: coollab 时间: 2013-9-22 21:12

lzhpro2 发表于 2013-9-22 21:06
多了816SP，三分之一MC，面积才提升10%，AMD是掌握了什么UFO科技吗？
牺牲显存速度扩大显存位宽，结果一分 ...

我下午也百思不得其解

不过有消息说AMD放弃了使用高速度的GDDR5 MC，转而用了低速度、大位宽，衡量后认为这样更为合理。这种比较差的MC面积比较小。

不过流处理器如此之多，才增加了10%，太不可思议了。

作者: boltblade 时间: 2013-9-22 21:14

coollab 发表于 2013-9-22 21:12
我下午也百思不得其解

不过有消息说AMD放弃了使用高速度的GDDR5 MC，转而用了低速度、大位宽，衡量后认 ...

跟双精度有没有关系？这次290X会不会也阉割了双精度。

作者: fengpc 时间: 2013-9-22 21:30
512bit GDDR5频率跑高了功耗很吓人的啊，不一定是因为用了低频MC，看发布时候怎么说吧

作者: coollab 时间: 2013-9-22 21:39

boltblade 发表于 2013-9-22 21:14
跟双精度有没有关系？这次290X会不会也阉割了双精度。

我觉得有，毕竟算双精度的那一坨体积还是不小的。

作者: westlee 时间: 2013-9-22 21:58
提示: 作者被禁止或删除内容自动屏蔽

作者: a9988a 时间: 2013-9-22 22:10

lzhpro2 发表于 2013-9-22 21:06
多了816SP，三分之一MC，面积才提升10%，AMD是掌握了什么UFO科技吗？
牺牲显存速度扩大显存位宽，结果一分 ...

7870x2

8個字符了

作者: iamw2d 时间: 2013-9-22 22:12

coollab 发表于 2013-9-22 21:39
我觉得有，毕竟算双精度的那一坨体积还是不小的。

据我所知gcn似乎并没有像kepler有专用的dp alu

作者: 结果 时间: 2013-9-22 22:13
两家都是布勃卡所以没啥可奇怪的

作者: coollab 时间: 2013-9-22 22:18

iamw2d 发表于 2013-9-22 22:12
据我所知gcn似乎并没有像kepler有专用的dp alu

那么GCN是怎样进行双精度计算的呢？

作者: iamw2d 时间: 2013-9-22 22:22

coollab 发表于 2013-9-22 22:18
那么GCN是怎样进行双精度计算的呢？

sp的alu拼接而成
这点可以从之前tahiti和pitcairn的dieshot上看出来 alu部分并没有明显的增加什么
而nv的也有dieshot sp的alu上方增加了很大一块dp alu
等会儿时间多的话我给你找图

作者: iamw2d 时间: 2013-9-22 22:38

coollab 发表于 2013-9-22 22:18
那么GCN是怎样进行双精度计算的呢？

[attach]2375040[/attach]
借用rskip的图对比下最上方的区域就明白了

作者: coollab 时间: 2013-9-23 10:13

iamw2d 发表于 2013-9-22 22:38
借用rskip的图对比下最上方的区域就明白了

有个问题是，既然AMD的SP拼接可以有效的计算DP，为什么NV还专门弄一个大的不得了的DP单元？

作者: Windyson 时间: 2013-9-23 11:24
对于7970：SP x1.375，MC x1.333，面积不到x1.1

对于7870：SP x2.2，MC x2，面积x1.98，这个可信度高些

作者: yukika 时间: 2013-9-23 12:16

iamw2d 发表于 2013-9-22 22:38
借用rskip的图对比下最上方的区域就明白了

官方Die-shot随便看看就行了.......
比如Tegra 3那个，Cayman那个

如果这样Pitcairn完全可以在专业市场上开放DP

作者: yukika 时间: 2013-9-23 12:43

coollab 发表于 2013-9-23 10:13
有个问题是，既然AMD的SP拼接可以有效的计算DP，为什么NV还专门弄一个大的不得了的DP单元？

为什么会理解成DP单元无法用来计算SP....."专门"

作者: coollab 时间: 2013-9-23 12:50

yukika 发表于 2013-9-23 12:43
[sweatingbullets>为什么会理解成DP单元无法用来计算SP....."专门"

。。。。。
表达有误。。。

作者: 66666 时间: 2013-9-23 12:56

westlee 发表于 2013-9-22 21:58
双精度去掉的话，还做啥专业卡产品线。

做纯计算卡不行，一般的专业图显卡还是可以的

作者: asdfjkl 时间: 2013-9-23 13:06
本帖最后由 asdfjkl 于 2013-9-23 13:07 编辑

coollab 发表于 2013-9-23 10:13
有个问题是，既然AMD的SP拼接可以有效的计算DP，为什么NV还专门弄一个大的不得了的DP单元？

GK110, 双精度：单精度计算峰值 = 1： 3； GF110，双精度：单精度计算峰值 = 1： 2；
Tahiti，双精度：单精度计算峰值 = 1： 4；

这就是差距。

作者: rSKip 时间: 2013-9-23 13:18

coollab 发表于 2013-9-23 10:13
有个问题是，既然AMD的SP拼接可以有效的计算DP，为什么NV还专门弄一个大的不得了的DP单元？

顺序双发射和顺序单发射的区别吧。

作者: coollab 时间: 2013-9-23 13:26

lzhpro2 发表于 2013-9-23 13:19
有个疑问啊，如果是拼接计算双精度，那么7800的双精度跟7900完全不成比例啊，面积也比不成比例啊。如果只 ...

我也是这样想的。。。。

作者: iamw2d 时间: 2013-9-23 13:34
本帖最后由 iamw2d 于 2013-9-23 13:36 编辑

coollab 发表于 2013-9-23 10:13
有个问题是，既然AMD的SP拼接可以有效的计算DP，为什么NV还专门弄一个大的不得了的DP单元？

楼上rskip本尊在
我感觉他会更明白些

作者: iamw2d 时间: 2013-9-23 13:52

coollab 发表于 2013-9-23 13:26
我也是这样想的。。。。

算了还是说说我的理解
amd这边cu每周期送出一个wavefront给一个simd 一个simd需要四个周期跑完一个wavefront
一共四个simd 正合适
如果在单独的添加dp alu的simd 那么数量就会大于4 所以毫无意义

nvidia这边每周期我没记错的话是抓出两个warp 而warp与wavefront不同可以带两个指令
所以每周期kepler最多可以发射出4条指令所以有冗余的单元也不是什么奇怪的事

欢迎光临 POPPUR爱换 (https://we.poppur.com/)