POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: airr27
打印 上一主题 下一主题

渣渣的GTX 960功耗测试、基本上市售的单卡都在180W左右!

[复制链接]
61#
发表于 2015-2-6 16:56 | 只看该作者
伪娘死光光!! 发表于 2015-2-6 15:13
乃觉得完整的GM200里能看到游戏卡吗

有觉得很有可能只存在信仰卡。

没有。        
回复 支持 反对

使用道具 举报

62#
发表于 2015-2-6 17:03 | 只看该作者
G70 发表于 2015-2-6 16:41
2.5D的堆叠封装,那个大硅基片还要负责做DRAM颗粒和GPU数据交互中的桥,延迟能低就有鬼了。

延迟是指和谁比?

我的意思是相比GDDR5则肯定更低,首先是频率低了那么多,而且4颗显存可以在硅基片上对称放置,不仅距离近了,还不用逼得要像之前GDDR5在PCB上搞蛇形走线(把延迟短的拉长以补偿)。
回复 支持 反对

使用道具 举报

63#
发表于 2015-2-6 17:04 | 只看该作者
fengpc 发表于 2015-2-6 16:45
以后半导体工艺、封装技术和PCB技术发展了,还是会向HBM和wide IO这种方向走的

但短时间内民用市场并不适宜。
回复 支持 反对

使用道具 举报

G70 该用户已被删除
64#
发表于 2015-2-6 17:05 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

65#
发表于 2015-2-6 17:11 | 只看该作者
本帖最后由 Xenomorph 于 2015-2-6 17:12 编辑
G70 发表于 2015-2-6 17:05
MC有多少级?

需要多少级呢?那个“级”指什么?
回复 支持 反对

使用道具 举报

G70 该用户已被删除
66#
发表于 2015-2-6 17:18 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

67#
发表于 2015-2-6 17:51 | 只看该作者
G70 发表于 2015-2-6 17:18
你有没有想象过传统GPU怎么塞4096bit MC 进片?

又不用兼容4096bit的GDDR5,只做Wide IO而已,HBM的内存一片单通道就1024了。GDDR5的IO能跑那么高频,pipeline很长,而且每个bit都是带DLL和SerDes的,能不复杂就怪了。
为什么R9 290X的MC能省空间啊,不就是设计频率低了就可以用短流水线来节省空间嘛
回复 支持 反对

使用道具 举报

68#
发表于 2015-2-7 21:47 | 只看该作者
G70 发表于 2015-2-6 17:18
你有没有想象过传统GPU怎么塞4096bit MC 进片?

同样位宽,HBM用的MC设计可以简化好多。
回复 支持 反对

使用道具 举报

69#
发表于 2015-2-8 11:21 | 只看该作者
Xenomorph 发表于 2015-2-6 17:03
延迟是指和谁比?

我的意思是相比GDDR5则肯定更低,首先是频率低了那么多,而且4颗显存可以在硅基片上 ...

美女,感觉你就技术方面。。。。

1.先说GDDR5和HBM显存功耗:
以前功耗大概225W的显卡,3-4G的GDDR5显存的功耗大概在60W。AMD从GDDR5改为HBM,显存的功耗应该小于60W,但能改善多少呢??? 总归这一部分不能发电吧。
另外显存功耗和显存容量关系很紧密。

2.再谈显存压缩:

显存压缩是个好技术,它可以缓解显存容量压力和带宽压力,但注意这里是“缓解”。 不可能能把1G显存当1.5G或者2G用的,否则那就是玄学, 扯淡了。。。
而且从现在GPU MC的效率而言,NV架构研发带来的带宽效率,容量效率都比对手好。

3.说说延迟:
一般情况下, 延迟的单位一般是多少个时钟周期,这种从架构的角度很容易给出具体值得大小。
再乘以具体的的周期,可以得到:多少ns的延迟了。
HBM:  它的频率低,时钟周期肯定是大于GDDR5的;但优势是可以高位款:1024bit.
因此在你没有掌握相关数据的情况下,很难判断说的延迟高低。
再者,GPU对延迟不敏感, 他是一种高计算吞吐量的模块, 架构做得好,延迟可以很好的掩藏起来。
简单的例子,就是你打开你家的水龙头,里面马上就有水了,对吗?  但是从水厂的出口到你家的龙头,这个路程非常长;但你感觉不大。
CPU,对带宽(吞吐量不敏感),但对于延迟及其敏感,直接关乎性能。

说下970, 首先驱动需要在显存中划分一部分的空间保留状态和存储变量的,大概200-300M; 0.5G减去这一部分只剩下了200-300M的空间。为了这200-300M空间的性能损失,多少AMD的粉丝为970的用户鸣不平呀。。。
而且NV的架构team正在和驱动team一种提供解决方案,有啥捉急的?
HBM,据我所知当前显存供应厂商的信息,今年只能量产4GB的。 倘若旗舰只能4GB,怎么应付4K Games? AMD一句:显存压缩技术!  他们都满足了, 他们都满足了, 他们都满足了。。。

回复 支持 反对

使用道具 举报

70#
发表于 2015-2-8 12:18 | 只看该作者
希望能和平讨论!
回复 支持 反对

使用道具 举报

71#
发表于 2015-2-8 12:40 | 只看该作者
本来我觉得HBM可能会是AMD的救命稻草

结果HBM目前量产只能做到单卡4G

这不是坑货我肯定不信
回复 支持 反对

使用道具 举报

72#
发表于 2015-2-8 18:07 | 只看该作者
Xenomorph 发表于 2015-2-6 17:03
延迟是指和谁比?

我的意思是相比GDDR5则肯定更低,首先是频率低了那么多,而且4颗显存可以在硅基片上 ...

GDDR5有DLL理论上是可以不做走线等长的,但是为了能在低频待机时候关闭DLL省电,现在的板子还是做了走线matching
回复 支持 反对

使用道具 举报

73#
发表于 2015-2-8 19:05 | 只看该作者
asdfjkl 发表于 2015-2-8 11:21
美女,感觉你就技术方面。。。。

1.先说GDDR5和HBM显存功耗:

显存功耗有这么大么?
回复 支持 反对

使用道具 举报

74#
发表于 2015-2-11 16:06 | 只看该作者
asdfjkl 发表于 2015-2-8 11:21
美女,感觉你就技术方面。。。。

1.先说GDDR5和HBM显存功耗:

我本来就是纯外行,而且越来越不能投过多时间在这里了……乱说的意义就是让猫猫你指点指点,自己学习一下,谢谢啦……

1、假设有24颗等效7GHz的512M/32bit GDDR5显存,每颗运行耗电大概2.5W,那差不多要到60W了;按照HBM宣传的最优情况,结合较少的总容量,那只有你1/3的耗电很正常吧?假设人家仅用20W,这不就有40W可以给核心拱频率了。

2、你能不能给出“N架构研发带来的带宽效率容量效率都比对手好”的一些定性、定量对比?

3、恩,看来这个在实测数据出来前还是别下结论好了……另外我不太能理解这个比喻的含义,因为水厂是用水塔维持恒定水压到每户每个阀门的,正常情况下水管内一直有水,所以我开水龙头才“感觉不到延迟”,但你不能说水管网路“架构很先进”吧?

4、不能理解怎么确定这200~300M一定在那有问题的500M内?另外这次GTX970最大的问题是硬件上屏蔽了1组ROP和对应的L2 Cache,在已经造成性能影响的情况下,官方反而拒绝承认。也许驱动可以提升性能,但屏蔽了东西你得承认。
回复 支持 反对

使用道具 举报

75#
发表于 2015-2-11 16:11 | 只看该作者
fengpc 发表于 2015-2-8 18:07
GDDR5有DLL理论上是可以不做走线等长的,但是为了能在低频待机时候关闭DLL省电,现在的板子还是做了走线m ...

恩恩。

现在的HBM能实现2048bit/4096M吗?怎么印象中量产的单颗最低1024bit……
回复 支持 反对

使用道具 举报

76#
发表于 2015-2-11 20:29 | 只看该作者
Xenomorph 发表于 2015-2-11 16:06
我本来就是纯外行,而且越来越不能投过多时间在这里了……乱说的意义就是让猫猫你指点指点,自己学习一下 ...

DDR的功耗分为DRAM core和IO功耗两部分,DDR3和GDDR5相比core的频率和功耗相差不大,GDDR5的高速data IO频率翻倍功耗很大。384bit GDDR5,用12颗时候每颗工作在32bit模式,用双面24颗显存时候每颗都工作在16bit模式,功耗差别不是很大。24颗GDDR5组384bit功耗不超过40W。

市场部的人标错了,这问题被发现了之后就承认并改正了。很多不明真相的网友认为只有224bit 3.5G显存能用,这个才是官方没有承认的,而且最新版的驱动也有针对970的优化。
回复 支持 反对

使用道具 举报

G70 该用户已被删除
77#
发表于 2015-2-11 22:02 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

78#
发表于 2015-2-13 13:44 | 只看该作者
fengpc 发表于 2015-2-11 20:29
DDR的功耗分为DRAM core和IO功耗两部分,DDR3和GDDR5相比core的频率和功耗相差不大,GDDR5的高速data IO频 ...

看来显存部分耗电终究不是大户。

“市场部的人标错了,这问题被发现了之后就承认并改正了。”?好像是某位搞技术的工程师出来澄清1次而已,但市场部的人还是死撑到底。

实际上,我比较好奇为什么Tahiti的32ROP/384bit没有问题,而GM204这么弄一下就受到影响?
回复 支持 反对

使用道具 举报

G70 该用户已被删除
79#
发表于 2015-2-26 18:14 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-11-23 17:40

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表