POPPUR爱换

标题: 虽说hawaii带宽不是瓶颈，提升意义不大，不过amd都用了6Gbps的显存还要降，这就不对啦 [打印本页]

作者: 拜占廷查士丁尼 时间: 2014-7-31 23:10
标题: 虽说hawaii带宽不是瓶颈，提升意义不大，不过amd都用了6Gbps的显存还要降，这就不对啦

r9 290/290x 显存频率公版等效5000mzh，换算在每个显存都是5Gbps水平
[attach]2630132[/attach]
但是很神奇是配的却是6Gbps的显存，如果按显存标配速率应该要6000mzh的

280x 270x也用6Gbps显存，都基本用足了显存的标配传输速率
260x需要高频，直接用7Gbps的了

上一代7870跟现在290/290x一个显存频率，都是5000，就老实用5Gbps显存了

hawaii卡明明用的是6Gbps的显存，还要降到等效5Gbps水平，这是闹哪样？
既然不想高频，索性就想以前7870一样用5Gbps的呗，还能降低成本

我今天是搞懂了我那种逗比290圣骑士为什么核心体质那么垃圾，加压到满都只能超到1100，但是尔必达的显存竟然可以随便拉满···原来是本身就是降频着啊

作者: king198909 时间: 2014-8-1 07:44
估计是提高所谓的性价比，让玩家还能超一下频。

作者: supermonster 时间: 2014-8-1 12:23
再上去功耗就爆标了，而且性能提升也不大。

作者: 拜占廷查士丁尼 时间: 2014-8-1 15:56

supermonster 发表于 2014-8-1 12:23
再上去功耗就爆标了，而且性能提升也不大。

显存相比于核心功耗很小吧

作者: 碎玻璃冒充钻石 时间: 2014-8-1 16:33
我怎么没看到多少人买显卡回来超？
你们都喜欢拉到爆吗？

作者: 拜占廷查士丁尼 时间: 2014-8-1 16:49

碎玻璃冒充钻石发表于 2014-8-1 16:33
我怎么没看到多少人买显卡回来超？
你们都喜欢拉到爆吗？

显卡买来肯定要玩玩啦，至少得知道极限吧

跑分才拉到满，平时默频用，最多小超

作者: 拜占廷查士丁尼 时间: 2014-8-1 16:50

king198909 发表于 2014-8-1 07:44
估计是提高所谓的性价比，让玩家还能超一下频。

不过一般人还是更在乎核心超频吧

作者: 碎玻璃冒充钻石 时间: 2014-8-1 17:17

拜占廷查士丁尼发表于 2014-8-1 16:49
[mellow>显卡买来肯定要玩玩啦，至少得知道极限吧
[lol>跑分才拉到满，平时默频用，最多小超

这个都爱干，但是长期估计不会这样。
知道了体制不超，可惜~

作者: jhg1159 时间: 2014-8-1 21:53
512bit的位宽已保证不再需更高的带宽了.保证更好的显存时序和显存超频幅度做为卖点更好点.

作者: asdfjkl 时间: 2014-8-1 23:42
本帖最后由 asdfjkl 于 2014-8-1 23:43 编辑

你们都是主观的猜测~~~

Hawaii用的显存的接口控制器和之前的Tahiti用的完全不一样，Hawaii用的这种显存的接口控制器(专业名字叫）fbio，可以工作的最高频率低：只能5.5GHz作用（就算搭配高速显存也超不上去，我说的是平均水平），但特点是面积小；之前Tahiti和现在在卖的7790用的是另外一种，高速的fbio,可以工作在6GHz以上，但单位bit的面积大。

Hawaii的512bit的fbio占用的面积比NV的GK110 384bit fbio占用的面积还小。面积小意味着成本低，或者说同样的整体面积下fbio节省的面积可以也能用在计算核心上，性能就上去了。

fbio实际上是个数模混合的逻辑，这个AMD还是有点功底。

作者: fengpc 时间: 2014-8-2 12:39
现在的工艺比两三年前进步了，还哪有5Gbps的颗粒，颗粒6Gbps起跳，7Gbps颗粒的电压也从以前的1.65V/1.6V降到了1.55V了。
另外你一般用户能从5G超频到6G甚至7G玩游戏跑分不出错死机，不代表数据传输不出错，显存数据严重出错才会导致花屏但也不会死机的。厂家做产品，要保证制程是快或者慢的GPU在高低温下长期运行不能出任何数据错误并且保留一定百分比的频率余量。做产品不是一般玩家想得那么简单。

作者: Xenomorph 时间: 2014-8-2 14:18

asdfjkl 发表于 2014-8-1 23:42
你们都是主观的猜测~~~

Hawaii用的显存的接口控制器和之前的Tahiti用的完全不一样，Hawaii用的这种显存的 ...

那我能不能请教下为什么当初Fermi全家会出现无论颗粒体质如何都无法轻易上到4GHz以上的情况。

关键是也不见得Fermi系列用的MC有多节省面积或晶体管。

作者: 拜占廷查士丁尼 时间: 2014-8-2 14:30

fengpc 发表于 2014-8-2 12:39
现在的工艺比两三年前进步了，还哪有5Gbps的颗粒，颗粒6Gbps起跳，7Gbps颗粒的电压也从以前的1.65V/1.6V降到 ...

7870时代不远吧，那就是5Gbps的，尔必达官网现在还有卖

作者: 拜占廷查士丁尼 时间: 2014-8-2 14:31

asdfjkl 发表于 2014-8-1 23:42
你们都是主观的猜测~~~

Hawaii用的显存的接口控制器和之前的Tahiti用的完全不一样，Hawaii用的这种显存的 ...

这样啊，哪正好错开了，260x 280x轻松高频，290x 270x频低点

作者: fengpc 时间: 2014-8-2 15:15

拜占廷查士丁尼发表于 2014-8-2 14:30
7870时代不远吧，那就是5Gbps的，尔必达官网现在还有卖

这不就是两三年前的卡咯，两年前上市的卡，至少是两年半以前就开始做了的。官网有得卖，不代表你能批量拿到货。笔记本还有用5Gbps的，但是是1.35V低压版的了。

作者: asdfjkl 时间: 2014-8-2 23:00
本帖最后由 asdfjkl 于 2014-8-2 23:04 编辑

Xenomorph 发表于 2014-8-2 14:18
那我能不能请教下为什么当初Fermi全家会出现无论颗粒体质如何都无法轻易上到4GHz以上的情况。

关键是也 ...

Fermi时代的显存控制器架构不够先进，这是其一；第一代的GF110，更是在某些checklist上没有做踏实，做了三版的Metal ECO还是只能稳定在3.6GHz; 等到GF110以后，4GHz是可以到了；但更高的4.5G+受限于显存控制器架构。

这里显存控制器又称为MC， FB等等，就如同一个团队的领导，策划团队；
上面说的显存接口逻辑FBIO，如同一个团队真正干活的基层人员。
两者都要牛掰，才能跑得快。跑得快的最终目的不是为了快而快！关键是要满足GPU内部的运算核心对数据吞吐率的要求，这即是显存带宽 = 单个FBIO的频率 * 位宽。
但实际芯片中，有效的显存带宽 = 单个FBIO的频率 * 位宽 * 读写效率。
读写效率也是体现设计水准的指标，没记错的话Fermi时代，两家的读写效率都只在 60% -70%。
还有显存带宽也不完全是个好东西，这个越高，显存消耗的功率直线上升。例如12GB的基于GF110的产品，显存这一块消耗的功耗就有60W，如果整个board的设计功耗是225W左右的话，意味着留给GPU核心的功耗最多只能有165W左右了，性能随之受限。

作者: Xenomorph 时间: 2014-8-3 20:07

asdfjkl 发表于 2014-8-2 23:00
Fermi时代的显存控制器架构不够先进，这是其一；第一代的GF110，更是在某些checklist上没有做踏实，做了 ...

真是受益匪浅，谢谢猫猫~

作者: 拜占廷查士丁尼 时间: 2014-8-3 21:52

asdfjkl 发表于 2014-8-2 23:00
Fermi时代的显存控制器架构不够先进，这是其一；第一代的GF110，更是在某些checklist上没有做踏实，做了 ...

大神果然牛逼，涨知识。问个问题，我特地查了下有效带宽。炮村给的数据，hawaii有效带宽甚至不如titan，效率很低，请问是真的吗？如果是真的，哪是基于什么原理？[attach]2632244[/attach][attach]2632245[/attach]

作者: asdfjkl 时间: 2014-8-3 22:29

拜占廷查士丁尼发表于 2014-8-3 21:52
大神果然牛逼，涨知识。问个问题，我特地查了下有效带宽。炮村给的数据，hawaii有效带宽甚至不如titan，效 ...

这张图就是显示了各个显卡的读写效率和带宽的一些情况。  我之前不知道有这些图，但这些图给出的信息和我之前理解的信息一致。
效率的含义可以通过一个简单的例子去理解。一个营业厅有很多的客户来买东西，但展台有限，有时候客户想看的东西不在展台，需要派一批人去仓库去取。这里人的数量就如同位宽，10分钟他可以来回展台几次就如同显存频率。为了提高去仓库取货的效率，一个办法就是把多个客户的需求能否合并，能否一个来回就满足尽可能多的客户需求。
这里两种情况，20个人10分钟来回1次和10个人10分钟来回两次。  如果效率都是100%，两者差别不大。这里第一种方式，对合并的效率更为看重，一旦一次取货失败，下次再去去仓库就要再等10分钟，而且他要把这20人的要去取的都想好；还有一点就是第一张方式的延迟大，需要客户等更久些；但延迟大可以通过流水线去掩盖。  第一种方法也有好处，是可以或者说更容易提高带宽，而且单位bit读写消耗的功耗更低，这就是例如Wide IO，HBM的技术。
技术要和自身的架构研发能力想匹配，这样才能发挥技术的领先优势，否则得不偿失。想想AMD和Intel的CPU之争。
这里290X的效率是第一种模式，所以它的效率他落后与7970是很正常的；但落后的幅度如此之大，看的出AMD是重用了7970的MC设计而没有对512bit有优化。另外7970和Titan同样是384bit，看得出NV的效率是领先于AMD的。

作者: 拜占廷查士丁尼 时间: 2014-8-4 00:02
本帖最后由拜占廷查士丁尼于 2014-8-4 00:03 编辑

asdfjkl 发表于 2014-8-3 22:29
这张图就是显示了各个显卡的读写效率和带宽的一些情况。我之前不知道有这些图，但这些图给出的信息和我 ...

懂了，不过hawaii效率差距真有这么大吗，差GK110 15%了，如果我也想看看怎么做这种测试？

作者: fengpc 时间: 2014-8-5 22:15

asdfjkl 发表于 2014-8-3 22:29
这张图就是显示了各个显卡的读写效率和带宽的一些情况。我之前不知道有这些图，但这些图给出的信息和我 ...

AMD自己宣传hawaii用了面积更小的低速FBIO，看来MC也是缩水了的，流水线更短缓存更少，那就是跑不了高频效率也低，要不然怎么塞了那么多的CU和8个MC，面积还那么小～～

欢迎光临 POPPUR爱换 (https://we.poppur.com/)