POPPUR爱换

标题: 晕倒,看不懂,Cell的Local Memory读取速度是16MB/s?? [打印本页]

作者: Prescott    时间: 2006-6-5 12:25
标题: 晕倒,看不懂,Cell的Local Memory读取速度是16MB/s??
这个Local Memory Read指的是什么?16MB/s?可是写速度却是4GB/s,这也太匪夷所思了。
写进去的数据就不用再读了?

http://theinquirer.net/?article=32171


作者: Edison    时间: 2006-6-5 12:29
就是cell主动发出读取rsx上挂的图形内存操作,可能是因为要模拟的缘故吧(当然也可能是一些别的原因,说不定是非技术的)。

不过这个动作是可以用RSX写到main memory来替代,速度要比PC上GPU dump to main memory快的多(PC上PCIE 16x的dump speed实际测试是1.2GB/s,PS3上可以做到10.6GB/s)。
作者: Prescott    时间: 2006-6-5 12:44
Ok, 大概有点明白了,原来Local Memory指的是RSX的图形内存。

不过,16MB/s也太夸张了,还不如干脆禁止读算了。免得开法人员犯错误。
作者: Edison    时间: 2006-6-5 12:59
有总比没有好吧。
作者: RacingPHT    时间: 2006-6-5 13:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2006-6-5 13:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: RacingPHT    时间: 2006-6-5 13:19
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-6-5 13:40
如果从NVIDIA在2002年着手Cg来看,你就会发现RSX的推出并非完全偶然了。
作者: hourousha    时间: 2006-6-5 16:20
原帖由 RacingPHT 于 2006-6-5 13:04 发表
这个功能在游戏里还是比较少用的.
比如你可以让CELL去读取FrameBuffer的某个Pixel的内容, 一般只有几个字节.一般的鼠标点取场景物体就可以这么做.没必要禁止.

pixel-level pick不一定非要读取整个framebuffer,往往可以设置另一个view和更小的rendertarget来做。
作者: RacingPHT    时间: 2006-6-5 16:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: Prescott    时间: 2006-6-5 16:39
这个解释倒也满reasonable的,但是这样是不是截屏基本上是不可能了?1920*1080*24 = 6.2MB,截个图都要0.4S。
作者: Edison    时间: 2006-6-5 16:42
所以我说了可能是有非技术的原因,例如不能抓视频的画面,要抓的话,就得冻结掉rsx的部分状态。
作者: hourousha    时间: 2006-6-5 16:43
原帖由 RacingPHT 于 2006-6-5 16:30 发表


:) 我前面说的只是一个大致思想...太阳光晕这样的东西可以这么用.

具体优化细节当然很多, 在PS3这样的视频游戏机上面没必要使用全尺寸backBuffer; 并且一般也不是读取单个Pixel, 而是一个小block + 优先级 ...

目前在PC上lens之类的差不多是D3DQuery的应用方式了。
其实我觉得是这样:首先呢,做picking的话,直接用framebuffer中的颜色不见得合适,应该用ID颜色来渲染,这样一来呢必然就得多出一次渲染(何不渲染到main mem中)。然后呢,用默认view不见得合适,我觉得还是应该用view_pos-cursor_pos这个view来渲染,自然这样一来,就可以把fov设得很小,同时render target也可以很小了:rolleyes:
所以呢,我认为其实直接抓GPU的local mem这个功能比较鸡肋,也就是聊胜于无吧。
作者: RacingPHT    时间: 2006-6-5 17:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: ainomushime    时间: 2006-6-5 17:36
那个文章里提到RSX现在居然只有420MHZ的频率?  显存也只有600MHZ.  怎么回事. 难到最后真的要再次缩水?  请这里的业内人士放点风啊```
作者: hourousha    时间: 2006-6-5 17:51
原帖由 RacingPHT 于 2006-6-5 17:12 发表
至于lens, 我个人不觉得D3DQuery有什么特别的优势.. 只要小心处理stall的状况.  

问题是做lens很多时侯需要抓取的是相当的一片区域啊:rolleyes:
作者: cxj3000    时间: 2006-6-6 01:11
CELL的SPE不是说可以做VS计算吗?连GPU的local mem都难进去,怎么和GPU配合做VS?
作者: hourousha    时间: 2006-6-6 07:49
原帖由 cxj3000 于 2006-6-6 01:11 发表
CELL的SPE不是说可以做VS计算吗?连GPU的local mem都难进去,怎么和GPU配合做VS?

这个简单。
cell从main mem中提取顶点,按照vs的要求处理,处理完后写入main mem或者local mem,然后RSX直接抓这些处理完的顶点数据,这样不就行了?
当然,打算直接用cell把顶点数据送进RSX的post T&L cache中那本来就是不可能的事情。
作者: RacingPHT    时间: 2006-6-6 08:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: HeavenPR    时间: 2006-6-6 20:46
160MB 也就算了,竟然 16MB,吓死了
作者: complexmind    时间: 2006-6-6 20:46
原帖由 hourousha 于 2006-6-6 07:49 AM 发表

这个简单。
cell从main mem中提取顶点,按照vs的要求处理,处理完后写入main mem或者local mem,然后RSX直接抓这些处理完的顶点数据,这样不就行了?
当然,打算直接用cell把顶点数据送进RSX的post T&L c ...

这个在PCINLIFE上早有人说过,但Local Memory太慢且小,没什么意义
用GPU来处理能耗比与速度都好,为什么舍近求远??
作者: aeondxf    时间: 2006-8-14 21:06
原帖由 complexmind 于 2006-6-6 20:46 发表

这个在PCINLIFE上早有人说过,但Local Memory太慢且小,没什么意义
用GPU来处理能耗比与速度都好,为什么舍近求远??

只用RSX的话CELL就浪费了.




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4