POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: 樟树
打印 上一主题 下一主题

非对称显存性能带宽讨论

  [复制链接]
201#
发表于 2012-11-30 19:37 | 只看该作者
这帖子翻上来真有意思
回复 支持 反对

使用道具 举报

头像被屏蔽
202#
发表于 2012-12-1 21:14 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
203#
发表于 2013-1-19 09:40 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

204#
 楼主| 发表于 2013-1-21 11:24 | 只看该作者
本帖最后由 樟树 于 2013-1-21 11:37 编辑
westlee 发表于 2013-1-19 09:40
请不要想当然。

4gx1+8gx1用ramdisk 吞掉8.3g以后的测试结果是没有明显的性能下降。

不像显卡驱动,操作系统是有页交换的。
你的这个测试仍然只是一个峰值带宽测试。
回复 支持 反对

使用道具 举报

205#
 楼主| 发表于 2013-1-21 11:25 | 只看该作者
本帖最后由 樟树 于 2013-1-21 11:39 编辑

http://www.intel.com/support/motherboards/desktop/sb/cs-011965.htm

intel关于多通道内存官方技术文档,2012年12月更新过的版本。参考flex mode一节

Flex mode
Flex mode results in both dual- and single- channel operation across the whole of DRAM memory. The figure below shows a flex mode configuration using two DIMMs. The operation is as follows:
  • The 2 GB DIMM in slot 1 and the lower 2 GB of the DIMM in the slot 2 operate together in dual-channel mode.
  • The remaining (upper) 2 GB of the DIMM in Slot 2 operates in single-channel mode.


非对称内存系统性能下降是基本性质,而不是想当然。

回复 支持 反对

使用道具 举报

westlee 该用户已被删除
206#
发表于 2013-3-5 20:38 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

207#
发表于 2013-3-5 22:28 | 只看该作者

其实翻来覆去这么多测试都没有准确的定论

从反面来说就证明了nv这么做不是没有道理的。
也许在某些极端场合,最后那0.5G的确性能不足。
但要么这时候的分辨率已经爆了核心
要么是蛋疼的极限分辨率

总之,在660定位的应用范畴内,非对称的弊端非常不明显
回复 支持 反对

使用道具 举报

208#
发表于 2013-3-6 08:36 | 只看该作者
用660TI的,本来就不是高端玩家,他们买得起1440P显示器就怪了,而且还得买大厂ips的。
回复 支持 反对

使用道具 举报

209#
发表于 2013-11-15 17:42 | 只看该作者
樟树 发表于 2012-9-23 14:12
最新版本,不用参数直接出结果,或者加上-step=16 控制测试块大小。解压后改名为bandwidth.71, 解压运行e ...

关于非对称显存问题得到了一点新的结果,特与大家分享。
同意樟树的看法,660Ti的后0.5G显存带宽应下降为正常带宽的1/3。不过樟树的测试程序似乎只能看到带宽下降,1/3没能看出来?
简单分析原因,樟树的程序应该是在SDK例子中的bandwidthtest基础上改的,进行的是显存拷贝操作,而拷贝涉及读写两个显存地址有些不利于分析。其实如果用SDK中的另一个例子(reduction)来验证效果会更明显,因为reduction只涉及显存读操作,并也可探到实际带宽峰值。
照此思路具体编写了一个程序,并在一块660Ti(2G显存,理论带宽149GB/s)上进行验证。具体测试结果如下,可以看到带宽很精确地下降到正常值的1/3:

0 - 1.5GB: 实测带宽为117.6GB/s
1.5 - 2GB: 实测带宽为39.4GB/s

测试结果很稳定,程序运行了多次基本没有波动。其中39.4/117.6=0.335,正好是1/3。
回复 支持 反对

使用道具 举报

210#
发表于 2013-11-15 19:06 | 只看该作者
recruitbj 发表于 2013-3-6 08:36
用660TI的,本来就不是高端玩家,他们买得起1440P显示器就怪了,而且还得买大厂ips的。

660ti 跟2713hm路过,有什么要指教么
回复 支持 反对

使用道具 举报

211#
发表于 2013-11-16 01:27 | 只看该作者
1.5 - 2GB: 实测带宽为39.4GB/s,这已经比爆显存的时候通过16GB/s带宽的PCIE3.0调用内存要快多了
0 - 1.5GB: 实测带宽为117.6GB/s是因为3通道MC可以同时读写;1.5 - 2GB这部分容量物理上只存在于同一个MC上,所以速度就慢下来了
回复 支持 反对

使用道具 举报

212#
发表于 2014-6-13 14:16 | 只看该作者
我个人猜想楼主的意思是位宽绑定显存颗粒。
就像"64BIT绑512M"(这里我比作是A),也就是A+A+A形成192BIT+1.5G三通道,而多出来的512M只能是单通道走64BIT。我这么理解樟木没错吧?

那我另外猜想MOONCOCOON的意思是,含位宽并不直接绑定显存颗粒,而是整合后平分,也就是64BIT+64BIT+64BIT=192BIT三路,2G的显存除以3=682.7M,也就是说64BIT+682.7M为一路,共三通道。。。是这个意思吧??

小白一枚,专门的术语看不懂,似懂非懂,只能大概猜测一下了。不知道我说的有无道理?

本人专挖坟……不小心路过挖了一锄。。。勿怪!!!

最后谁能告诉我。。。哪位说得正确?表示正在使用GTX660,对于这个问题很感兴趣。。。
回复 支持 反对

使用道具 举报

213#
发表于 2014-6-13 23:54 | 只看该作者
MC的读取只对应地址线,所以无论数据如何分布就可以达到192bit的速度,顾杰这个理论并没有错误。樟树的测试则是面向显存溢出的,实际是对应地址线已经被占用但仍旧有数据请求,这时候就会出现剩下的512MB自行迁移的状况,这时候这部分数据就只有64bit。
实际游戏中应该是在规避地址线塞满仍旧有数据请求的情况,简单的说就是拥有2GB的显存容量,依靠MC自身特性使得它用起来和192bit同时又对称的显存很接近,但无法完全避免地址线的塞满。

唯一可惜的事顾胖子伤心离开了。
回复 支持 反对

使用道具 举报

214#
发表于 2015-1-26 14:44 | 只看该作者
为啥当年660的问题明明比较严重 最后却变成了模棱两可
970的问题不那么严重反而却洗不了地喃?
回复 支持 反对

使用道具 举报

G70 该用户已被删除
215#
发表于 2015-1-26 15:14 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

216#
发表于 2015-1-26 22:14 | 只看该作者
iamw2d 发表于 2015-1-26 14:44
[mellow> 为啥当年660的问题明明比较严重 最后却变成了模棱两可
970的问题不那么严重反而却洗不了地喃?

因为970还在卖,660ti很快就被760取代了
回复 支持 反对

使用道具 举报

217#
 楼主| 发表于 2015-1-30 11:00 | 只看该作者
本帖最后由 樟树 于 2015-1-30 11:44 编辑

660和970这两个本质上是一样的
970是相当于是屏蔽成了7组ROP(架构不同,只是为了方便说明,相当于7组),其中一组接双倍容量的存储器,七分之一的容量只有七分之一速度
660是3组存储器控制器,其中一组接双倍容量的存储器,三分之一的容量只有三分之一速度。不同是瓶颈从MC移到了ROP/L2,前七分之六按理也会受一点点影响。和660一样,只要把剩下的0.5GB当成附送的比PCI-E爆显存好的方案就行了。

为什么970影响这么差?
970宣传的规格是64RO,与实际规格不符。
而660一开始宣传资料里就开诚布公的明说设计就是这样的,而某些人还要试图洗地否定。


回复 支持 反对

使用道具 举报

218#
发表于 2015-1-30 13:47 | 只看该作者
都啥时候的话题了,真是无风不起浪啊,谁挖坟功夫这么厉害?佩服啊~
回复 支持 反对

使用道具 举报

219#
发表于 2015-1-30 14:53 | 只看该作者
樟树 发表于 2015-1-30 11:00
660和970这两个本质上是一样的
970是相当于是屏蔽成了7组ROP(架构不同,只是为了方便说明,相当于7组),其 ...

nv日后真心要慎重考虑阉割的手法了
660/ti说白了是1.5/3G显存最佳匹配, 但因为竞争对象7850/7870是2G, nv为了不在宣传上吃亏就搞那么些所谓不对称显存技术.
这次970事件完全是报应, 活该
回复 支持 反对

使用道具 举报

220#
发表于 2015-2-1 09:15 | 只看该作者
nvidia 之所以"敢"这样,是因为 970 比 660 ti 更具迷惑性,从表面看 970 不应该存在非对称问题,但是 nvidia 却偏偏在切 jj 的时候顺便封掉了菊花。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-5-4 02:46

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表