非对称显存性能带宽讨论

vista@xp · 发表于 2012-11-30 19:37

这帖子翻上来真有意思

wzglwoc · 发表于 2012-12-1 21:14

提示: 作者被禁止或删除内容自动屏蔽

只看该作者 · 发表于 2013-1-19 09:40

提示: 作者被禁止或删除内容自动屏蔽

樟树 · 发表于 2013-1-21 11:24

本帖最后由樟树于 2013-1-21 11:37 编辑

westlee 发表于 2013-1-19 09:40
请不要想当然。

4gx1+8gx1用ramdisk 吞掉8.3g以后的测试结果是没有明显的性能下降。

不像显卡驱动，操作系统是有页交换的。
你的这个测试仍然只是一个峰值带宽测试。

樟树 · 发表于 2013-1-21 11:25

本帖最后由樟树于 2013-1-21 11:39 编辑

http://www.intel.com/support/motherboards/desktop/sb/cs-011965.htm

intel关于多通道内存官方技术文档，2012年12月更新过的版本。参考flex mode一节

“Flex mode

Flex mode results in both dual- and single- channel operation across the whole of DRAM memory. The figure below shows a flex mode configuration using two DIMMs. The operation is as follows:

The 2 GB DIMM in slot 1 and the lower 2 GB of the DIMM in the slot 2 operate together in dual-channel mode.
The remaining (upper) 2 GB of the DIMM in Slot 2 operates in single-channel mode.”

非对称内存系统性能下降是基本性质，而不是想当然。

只看该作者 · 发表于 2013-3-5 20:38

提示: 作者被禁止或删除内容自动屏蔽

aibo · 发表于 2013-3-5 22:28

哎
其实翻来覆去这么多测试都没有准确的定论

从反面来说就证明了nv这么做不是没有道理的。
也许在某些极端场合，最后那0.5G的确性能不足。
但要么这时候的分辨率已经爆了核心
要么是蛋疼的极限分辨率

总之，在660定位的应用范畴内，非对称的弊端非常不明显

recruitbj · 发表于 2013-3-6 08:36

用660TI的，本来就不是高端玩家，他们买得起1440P显示器就怪了，而且还得买大厂ips的。

intel10k · 发表于 2013-11-15 17:42

樟树发表于 2012-9-23 14:12
最新版本，不用参数直接出结果，或者加上-step=16 控制测试块大小。解压后改名为bandwidth.71, 解压运行e ...

关于非对称显存问题得到了一点新的结果，特与大家分享。
同意樟树的看法，660Ti的后0.5G显存带宽应下降为正常带宽的1/3。不过樟树的测试程序似乎只能看到带宽下降，1/3没能看出来？
简单分析原因，樟树的程序应该是在SDK例子中的bandwidthtest基础上改的，进行的是显存拷贝操作，而拷贝涉及读写两个显存地址有些不利于分析。其实如果用SDK中的另一个例子(reduction)来验证效果会更明显，因为reduction只涉及显存读操作，并也可探到实际带宽峰值。
照此思路具体编写了一个程序，并在一块660Ti(2G显存，理论带宽149GB/s)上进行验证。具体测试结果如下，可以看到带宽很精确地下降到正常值的1/3：

0 - 1.5GB: 实测带宽为117.6GB/s
1.5 - 2GB: 实测带宽为39.4GB/s

测试结果很稳定，程序运行了多次基本没有波动。其中39.4/117.6=0.335，正好是1/3。

532 · 发表于 2013-11-15 19:06

recruitbj 发表于 2013-3-6 08:36
用660TI的，本来就不是高端玩家，他们买得起1440P显示器就怪了，而且还得买大厂ips的。

660ti 跟2713hm路过，有什么要指教么

fengpc · 发表于 2013-11-16 01:27

1.5 - 2GB: 实测带宽为39.4GB/s，这已经比爆显存的时候通过16GB/s带宽的PCIE3.0调用内存要快多了
0 - 1.5GB: 实测带宽为117.6GB/s是因为3通道MC可以同时读写；1.5 - 2GB这部分容量物理上只存在于同一个MC上，所以速度就慢下来了

chick0312 · 发表于 2014-6-13 14:16

我个人猜想楼主的意思是位宽绑定显存颗粒。
就像"64BIT绑512M"（这里我比作是A），也就是A+A+A形成192BIT+1.5G三通道，而多出来的512M只能是单通道走64BIT。我这么理解樟木没错吧？

那我另外猜想MOONCOCOON的意思是，含位宽并不直接绑定显存颗粒，而是整合后平分，也就是64BIT+64BIT+64BIT=192BIT三路，2G的显存除以3=682.7M，也就是说64BIT+682.7M为一路，共三通道。。。是这个意思吧？？

小白一枚，专门的术语看不懂，似懂非懂，只能大概猜测一下了。不知道我说的有无道理？

本人专挖坟……不小心路过挖了一锄。。。勿怪！！！

最后谁能告诉我。。。哪位说得正确？表示正在使用GTX660，对于这个问题很感兴趣。。。

taizer · 发表于 2014-6-13 23:54

MC的读取只对应地址线，所以无论数据如何分布就可以达到192bit的速度，顾杰这个理论并没有错误。樟树的测试则是面向显存溢出的，实际是对应地址线已经被占用但仍旧有数据请求，这时候就会出现剩下的512MB自行迁移的状况，这时候这部分数据就只有64bit。
实际游戏中应该是在规避地址线塞满仍旧有数据请求的情况，简单的说就是拥有2GB的显存容量，依靠MC自身特性使得它用起来和192bit同时又对称的显存很接近，但无法完全避免地址线的塞满。

唯一可惜的事顾胖子伤心离开了。

iamw2d · 发表于 2015-1-26 14:44

为啥当年660的问题明明比较严重最后却变成了模棱两可
970的问题不那么严重反而却洗不了地喃？

只看该作者 · 发表于 2015-1-26 15:14

提示: 作者被禁止或删除内容自动屏蔽

eraser666 · 发表于 2015-1-26 22:14

iamw2d 发表于 2015-1-26 14:44
[mellow> 为啥当年660的问题明明比较严重最后却变成了模棱两可
970的问题不那么严重反而却洗不了地喃？

因为970还在卖，660ti很快就被760取代了

樟树 · 发表于 2015-1-30 11:00

本帖最后由樟树于 2015-1-30 11:44 编辑

660和970这两个本质上是一样的
970是相当于是屏蔽成了7组ROP(架构不同，只是为了方便说明，相当于7组)，其中一组接双倍容量的存储器，七分之一的容量只有七分之一速度
660是3组存储器控制器，其中一组接双倍容量的存储器，三分之一的容量只有三分之一速度。不同是瓶颈从MC移到了ROP／L2，前七分之六按理也会受一点点影响。和660一样，只要把剩下的0.5GB当成附送的比PCI－E爆显存好的方案就行了。

为什么970影响这么差？
970宣传的规格是64RO，与实际规格不符。
而660一开始宣传资料里就开诚布公的明说设计就是这样的，而某些人还要试图洗地否定。

3670636 · 发表于 2015-1-30 13:47

都啥时候的话题了，真是无风不起浪啊，谁挖坟功夫这么厉害？佩服啊~

amx004 · 发表于 2015-1-30 14:53

樟树发表于 2015-1-30 11:00
660和970这两个本质上是一样的
970是相当于是屏蔽成了7组ROP(架构不同，只是为了方便说明，相当于7组)，其 ...

nv日后真心要慎重考虑阉割的手法了
660/ti说白了是1.5/3G显存最佳匹配, 但因为竞争对象7850/7870是2G, nv为了不在宣传上吃亏就搞那么些所谓不对称显存技术.
这次970事件完全是报应, 活该

Edison · 发表于 2015-2-1 09:15

nvidia 之所以"敢"这样，是因为 970 比 660 ti 更具迷惑性，从表面看 970 不应该存在非对称问题，但是 nvidia 却偏偏在切 jj 的时候顺便封掉了菊花。

帐号		自动登录	找回密码
密码			注册

wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽	202^# 发表于 2012-12-1 21:14 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

westlee 该用户已被删除	203^# 发表于 2013-1-19 09:40 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
westlee 该用户已被删除
	回复支持反对使用道具举报显身卡

westlee 该用户已被删除	206^# 发表于 2013-3-5 20:38 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
westlee 该用户已被删除
	回复支持反对使用道具举报显身卡

G70 该用户已被删除	215^# 发表于 2015-1-26 15:14 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
G70 该用户已被删除
	回复支持反对使用道具举报显身卡