POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 4256|回复: 21
打印 上一主题 下一主题

晕倒,看不懂,Cell的Local Memory读取速度是16MB/s??

[复制链接]
跳转到指定楼层
1#
发表于 2006-6-5 12:25 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
这个Local Memory Read指的是什么?16MB/s?可是写速度却是4GB/s,这也太匪夷所思了。
写进去的数据就不用再读了?

http://theinquirer.net/?article=32171

2#
发表于 2006-6-5 12:29 | 只看该作者
就是cell主动发出读取rsx上挂的图形内存操作,可能是因为要模拟的缘故吧(当然也可能是一些别的原因,说不定是非技术的)。

不过这个动作是可以用RSX写到main memory来替代,速度要比PC上GPU dump to main memory快的多(PC上PCIE 16x的dump speed实际测试是1.2GB/s,PS3上可以做到10.6GB/s)。
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2006-6-5 12:44 | 只看该作者
Ok, 大概有点明白了,原来Local Memory指的是RSX的图形内存。

不过,16MB/s也太夸张了,还不如干脆禁止读算了。免得开法人员犯错误。
回复 支持 反对

使用道具 举报

4#
发表于 2006-6-5 12:59 | 只看该作者
有总比没有好吧。
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
5#
发表于 2006-6-5 13:04 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
6#
发表于 2006-6-5 13:08 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
7#
发表于 2006-6-5 13:19 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

8#
发表于 2006-6-5 13:40 | 只看该作者
如果从NVIDIA在2002年着手Cg来看,你就会发现RSX的推出并非完全偶然了。
回复 支持 反对

使用道具 举报

9#
发表于 2006-6-5 16:20 | 只看该作者
原帖由 RacingPHT 于 2006-6-5 13:04 发表
这个功能在游戏里还是比较少用的.
比如你可以让CELL去读取FrameBuffer的某个Pixel的内容, 一般只有几个字节.一般的鼠标点取场景物体就可以这么做.没必要禁止.

pixel-level pick不一定非要读取整个framebuffer,往往可以设置另一个view和更小的rendertarget来做。
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
10#
发表于 2006-6-5 16:30 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

11#
 楼主| 发表于 2006-6-5 16:39 | 只看该作者
这个解释倒也满reasonable的,但是这样是不是截屏基本上是不可能了?1920*1080*24 = 6.2MB,截个图都要0.4S。
回复 支持 反对

使用道具 举报

12#
发表于 2006-6-5 16:42 | 只看该作者
所以我说了可能是有非技术的原因,例如不能抓视频的画面,要抓的话,就得冻结掉rsx的部分状态。
回复 支持 反对

使用道具 举报

13#
发表于 2006-6-5 16:43 | 只看该作者
原帖由 RacingPHT 于 2006-6-5 16:30 发表


:) 我前面说的只是一个大致思想...太阳光晕这样的东西可以这么用.

具体优化细节当然很多, 在PS3这样的视频游戏机上面没必要使用全尺寸backBuffer; 并且一般也不是读取单个Pixel, 而是一个小block + 优先级 ...

目前在PC上lens之类的差不多是D3DQuery的应用方式了。
其实我觉得是这样:首先呢,做picking的话,直接用framebuffer中的颜色不见得合适,应该用ID颜色来渲染,这样一来呢必然就得多出一次渲染(何不渲染到main mem中)。然后呢,用默认view不见得合适,我觉得还是应该用view_pos-cursor_pos这个view来渲染,自然这样一来,就可以把fov设得很小,同时render target也可以很小了:rolleyes:
所以呢,我认为其实直接抓GPU的local mem这个功能比较鸡肋,也就是聊胜于无吧。
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
14#
发表于 2006-6-5 17:12 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

15#
发表于 2006-6-5 17:36 | 只看该作者
那个文章里提到RSX现在居然只有420MHZ的频率?  显存也只有600MHZ.  怎么回事. 难到最后真的要再次缩水?  请这里的业内人士放点风啊```
回复 支持 反对

使用道具 举报

16#
发表于 2006-6-5 17:51 | 只看该作者
原帖由 RacingPHT 于 2006-6-5 17:12 发表
至于lens, 我个人不觉得D3DQuery有什么特别的优势.. 只要小心处理stall的状况.  

问题是做lens很多时侯需要抓取的是相当的一片区域啊:rolleyes:
回复 支持 反对

使用道具 举报

17#
发表于 2006-6-6 01:11 | 只看该作者
CELL的SPE不是说可以做VS计算吗?连GPU的local mem都难进去,怎么和GPU配合做VS?
回复 支持 反对

使用道具 举报

18#
发表于 2006-6-6 07:49 | 只看该作者
原帖由 cxj3000 于 2006-6-6 01:11 发表
CELL的SPE不是说可以做VS计算吗?连GPU的local mem都难进去,怎么和GPU配合做VS?

这个简单。
cell从main mem中提取顶点,按照vs的要求处理,处理完后写入main mem或者local mem,然后RSX直接抓这些处理完的顶点数据,这样不就行了?
当然,打算直接用cell把顶点数据送进RSX的post T&L cache中那本来就是不可能的事情。
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
19#
发表于 2006-6-6 08:54 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

20#
发表于 2006-6-6 20:46 | 只看该作者
160MB 也就算了,竟然 16MB,吓死了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-12-23 03:53

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表