POPPUR爱换

标题: G80与PS3的RSX和XO的C1的数据图! [打印本页]

作者: codxk    时间: 2006-11-9 12:40
标题: G80与PS3的RSX和XO的C1的数据图!






这图 不知道是否得到了确实消息 竟然把RSX的频率改成了500MHZ !#。
作者: dxf_keke    时间: 2006-11-9 13:17
看最后的那个表格,怎么觉得PS3要比XBOX360差?
作者: chairmanai    时间: 2006-11-9 13:22
原帖由 dxf_keke 于 2006-11-9 01:17 PM 发表
看最后的那个表格,怎么觉得PS3要比XBOX360差?


显示部分PS3是不如CI的啊
作者: dxf_keke    时间: 2006-11-9 13:32
原帖由 chairmanai 于 2006-11-9 13:22 发表


显示部分PS3是不如CI的啊


哦,这个图单单是显示芯片部分啊,查一点让我失去信心买PS3了
作者: ayanamei    时间: 2006-11-9 13:34
原帖由 dxf_keke 于 2006-11-9 13:32 发表


哦,这个图单单是显示芯片部分啊,查一点让我失去信心买PS3了

迷信这种理论值没啥意义
PS3整体上和 X-BOX是各有胜负
sony爱借助媒体怎么吹嘘是他的事情  但是我们要理智
作者: 梦游的猪    时间: 2006-11-9 13:37
cho应该是暂从西川善司的说法吧。
不知道who有确切消息。按道理这种关键规格的变更如果属实的话,索尼应该会在发布之前说明的,但是目前还没有任何这方面的官方说明。此外,这里列的RSX的VS和PS都是500MHz比较奇怪。
作者: dxf_keke    时间: 2006-11-9 13:38
原帖由 ayanamei 于 2006-11-9 13:34 发表

迷信这种理论值没啥意义
PS3整体上和 X-BOX是各有胜负
sony爱借助媒体怎么吹嘘是他的事情  但是我们要理智



你有何见解,不妨说来听听,我暂时犹豫不决
作者: codxk    时间: 2006-11-9 13:40
原帖由 梦游的猪 于 2006-11-9 13:37 发表
cho应该是暂从西川善司的说法吧。
不知道who有确切消息。按道理这种关键规格的变更如果属实的话,索尼应该会在发布之前说明的,但是目前还没有任何这方面的官方说明。此外,这里列的RSX的VS和PS都是500MHz比较 ...


是啊 如果频率有改变  官方应该说明的
RSX是不会比C1差的  甚至会更强
作者: aeondxf    时间: 2006-11-9 14:28
PS部分RSX要比C1低……这图可信么?:funk:
作者: supreme25    时间: 2006-11-9 14:39
原帖由 aeondxf 于 2006-11-9 14:28 发表
PS部分RSX要比C1低……这图可信么?:funk:

这又不是什么新闻:)
作者: aeondxf    时间: 2006-11-9 14:49
:wacko: 我可是一直坚信RSX在PS方面高C1那么一点点,而VS却是低不是一点点的。
作者: XRICE    时间: 2006-11-9 14:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: hdfeel    时间: 2006-11-9 15:42
原帖由 codxk 于 2006-11-9 13:40 发表


是啊 如果频率有改变  官方应该说明的
RSX是不会比C1差的  甚至会更强



这是不可能的,更多的实事,无论是理论还是实际,还是游戏, c1 都是绝对强过rsx。
作者: linwu1    时间: 2006-11-9 15:45
原帖由 aeondxf 于 2006-11-9 14:28 发表
PS部分RSX要比C1低……这图可信么?:funk:

C1在游戏中不可能单独做VS或PS,如果RSX是500mhz的话,C1是240Gflops,RSX是192+40=232Gflops。
作者: 梦游的猪    时间: 2006-11-9 16:12
cho在这个图片之前已经说过了,希望大家正确的理解这个图,有很多东西是这个图上看不出来的。比如G80的flops看上去相对R580没什么优势,但是运行性能呢?
RSX和C1谁强,我相信上海育碧的那几位也未必就能给出一个很明确的结论。
最后,游戏机本身也是一个整体,讨论其中个体的性能是否合适?即便一样的显卡,在扣肉平台和K8平台上性能就是一样的?
作者: aeondxf    时间: 2006-11-9 16:31
简单地算算,即使是减去40G,剩下的200G也要比RSX那192G高那么一点点啊……至于说游戏机作为一个整体设计,那么PS3现在看起来和XO比真的就像拼凑的……
作者: hdfeel    时间: 2006-11-9 16:35
原帖由 梦游的猪 于 2006-11-9 16:12 发表
cho在这个图片之前已经说过了,希望大家正确的理解这个图,有很多东西是这个图上看不出来的。比如G80的flops看上去相对R580没什么优势,但是运行性能呢?
RSX和C1谁强,我相信上海育碧的那几位也未必就能给出一 ...


这图 有几十个指标。
作者: ayanamei    时间: 2006-11-9 16:40
原帖由 dxf_keke 于 2006-11-9 13:38 发表



你有何见解,不妨说来听听,我暂时犹豫不决

C1 /RSX在最终表现上不会存在太大差距
X-BOX360 /PS3最后性能发挥如何还是看 PS3 CELL发挥的怎么样
个人还是倾向于X-BOX360的构架  
CELL缺点和优点同样突出,这样的构架让人没啥安全感
完全赌开发人员的水平
作者: ayanamei    时间: 2006-11-9 16:41
原帖由 UNK 于 2006-11-9 16:05 发表

为什么?

C1 是US结构 运行起来的时候 至少有16个Shader在跑VS
没有VS全面跑PS是不现实的
作者: aeondxf    时间: 2006-11-9 16:50
原帖由 ayanamei 于 2006-11-9 16:41 发表

C1 是US结构 运行起来的时候 至少有16个Shader在跑VS
没有VS全面跑PS是不现实的

做image space的Defrred Rendering的时候……好吧,我承认我是转的……
作者: ayanamei    时间: 2006-11-9 16:52
原帖由 aeondxf 于 2006-11-9 16:50 发表

做image space的Defrred Rendering的时候……好吧,我承认我是转的……

你不能用特定的case 去代表大部分时候的工作状态
基本上  RSX C1 Flops还是一个档次上的
作者: hdfeel    时间: 2006-11-9 17:07
Flops 上 rsx 差c1 一些,对游戏影响不大, edram, 支持更高级的shade 版本的 作用 体现的会更明显一些。      ps3 快发售了,多平台游戏 也会一个一个 出来。目前一个多平台游戏,ps3评价差xo 一级,  很快,     ps3 机能的弱势, 会体现出来。
作者: RacingPHT    时间: 2006-11-9 17:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: 梦游的猪    时间: 2006-11-9 17:44
原帖由 hdfeel 于 2006-11-9 17:07 发表
Flops 上 rsx 差c1 一些,对游戏影响不大, edram, 支持更高级的shade 版本的 作用 体现的会更明显一些。      ps3 快发售了,多平台游戏 也会一个一个 出来。目前一个多平台游戏,ps3评价差xo 一级,  很快, ...


恰恰相反吧,多平台游戏开发商自己普遍都说PS3版本特效更多。
另回上面某位,C1的US16个一组,一组同一时间只能干VS或者PS之一,哪能你想减多少就减多少的?

我觉得就目前已公布的资料来讨论这个问题实在很无聊,我们连PS3发布版的RSX的频率情况都还在猜测(当然也欢迎各位大佬爆料),这种情况下的讨论是毫无意义的。
游戏机本身是一个成本妥协的产物,就拿XO来说,22.4G的主内存带宽还是C1和CPU共享的,看上去是不是也让人很不屑一顾呢?

[ 本帖最后由 梦游的猪 于 2006-11-9 17:47 编辑 ]
作者: ayanamei    时间: 2006-11-9 17:52
原帖由 梦游的猪 于 2006-11-9 17:44 发表


恰恰相反吧,多平台游戏开发商自己普遍都说PS3版本特效更多。
另回上面某位,C1的US16个一组,一组同一时间只能干VS或者PS之一,哪能你想减多少就减多少的?

我觉得就目前已公布的资料来讨论这个问题实 ...


US的优势还是不容否认的 只不过c1还不算很完善

x-box360总体构架还是要来的和谐很多
还是为CELL先捏汗吧
共享主内存带宽本来就不是什么问题
作者: 梦游的猪    时间: 2006-11-9 18:00
原帖由 ayanamei 于 2006-11-9 17:52 发表


US的优势还是不容否认的 只不过c1还不算很完善

x-box360总体构架还是要来的和谐很多
还是为CELL先捏汗吧
共享主内存带宽本来就不是什么问题


US当然是更具有先进性的结构,但是未必用了US就是具有先进性的产品。明年肯定会出现US但不如G71/R580的G8x/RV6xx,对不对?
CELL有其优势,也有其劣势。人类对未知世界总是恐慌的,谁不想顺着一条路走下去呢,出现太多的路径选择可能大多数人仍按老路走,虽然很可能新路比较近。但新路一定会有人走。
UMA本来不是什么问题,但我觉得太小了就是问题了。如果XO主内存位宽是256bit的话你对,但是现在K8/扣肉都有双通道的64bit×667MHz带宽的时候,XO的3核CPU与显卡共享这么点带宽,真的够用吗?
作者: ayanamei    时间: 2006-11-9 18:17
原帖由 梦游的猪 于 2006-11-9 18:00 发表


US当然是更具有先进性的结构,但是未必用了US就是具有先进性的产品。明年肯定会出现US但不如G71/R580的G8x/RV6xx,对不对?
CELL有其优势,也有其劣势。人类对未知世界总是恐慌的,谁不想顺着一条路走下去 ...

同样规模下 G8X/RV6XX构架是没有任何理由输给G7X/R58X构架的理由的  你硬要拿最低端那么点晶体管的产品说事也就没意义了。
拿CPU来说 core2 duo双核前端总线也只有8.5G/s 别太神化CPU对带宽的需求 。CPU微构架才是决定最后效率的关键,外部总线不要成为明显的瓶颈就好了

至于GPU ,C1的ROP有eDRAM结局AA时的高带宽需求 实际上C1在这个时候对带宽的需求也不是很苛刻了
我实在看不出带宽有不够用的地方在哪里  或者如你所说哪儿存在什么问题

至于CELL的问题 远远比你所说的带宽什么的重要的多 PS3最大的卖点和最大的硬伤都是这个CELL
作者: popwangyuII    时间: 2006-11-9 18:27
原帖由 ayanamei 于 2006-11-9 18:17 发表

同样规模下 G8X/RV6XX构架是没有任何理由输给G7X/R58X构架的理由的  你硬要拿最低端那么点晶体管的产品说事也就没意义了。
拿CPU来说 core2 duo双核前端总线也只有8.5G/s 别太神化CPU对带宽的需求 。CPU微构 ...



:lol: 部分人就是非常喜欢SONY YY的理论性能,而且坚信不疑。

PS3快发布了,马上就有好戏看了
作者: ayanamei    时间: 2006-11-9 18:38
CELL是很有意思的设计
但是不代表CELL for PS3就是好东西
CELL是一个构架 一个理念 CELL for PS3是一个console的产品
这个产品到底怎么样还真不好说
6800曾经辉煌 但是没有人说6200也能辉煌
作者: popwangyuII    时间: 2006-11-9 18:44
原帖由 ayanamei 于 2006-11-9 18:38 发表
CELL是很有意思的设计
但是不代表CELL for PS3就是好东西
CELL是一个构架 一个理念 CELL for PS3是一个console的产品
这个产品到底怎么样还真不好说
6800曾经辉煌 但是没有人说6200也能辉煌



:lol: 同感同感,我到现在都纳闷SONY为什么会选CELL来装PS3。


全新的架构,软件开发问题相当严重。如果一个平台不能解决软件开发的问题,拿什么和微软竞争?Xbox要什么有什么,OS?现成的。开发工具?现成的。SONY呢?也有,嘴巴
作者: Edison    时间: 2006-11-9 18:50
SONY无论用什么CPU,都不可能在开发平台上超越微软,换句话说,PS3就算用Gesher,也会有人指责索尼的用Gesher太傻了。
作者: Illuminati    时间: 2006-11-9 19:01
赫赫,  Xbox360 得 OS 可跟 Windows 一点儿关系都没有
作者: 梦游的猪    时间: 2006-11-9 19:10
原帖由 ayanamei 于 2006-11-9 18:17 发表

同样规模下 G8X/RV6XX构架是没有任何理由输给G7X/R58X构架的理由的  你硬要拿最低端那么点晶体管的产品说事也就没意义了。
拿CPU来说 core2 duo双核前端总线也只有8.5G/s 别太神化CPU对带宽的需求 。CPU微构 ...


按照您的说法,那么我们只要关掉AA,那么对于同一个GPU核心就对带宽大小不敏感了?有事实能支持您的说法吗?当代GPU只剩下AA是富带宽应用?C1发布的时候,NV还说当时条件下US只能达到分离结构70-80%的效率,我们是否也应该相信?
再者,对于G80,考虑到晶体管规模和SP的频率,我们如何看待“相同规模下”G80和G71/R580的性能?是从晶体管数目还是频率还是兼而有之?我认为G80的杰出,最主要表现在每瓦特性能的提升上。
至于CELL,我可从没把它捧上天,只是对于它限定的应用范围,我个人认为是具备自身的优势的,简单的把它视为“硬伤”,是否过于武断?
再者,把游戏机的CPU和PC的CPU在体系中的作用同等看待,是否合适?

[ 本帖最后由 梦游的猪 于 2006-11-9 19:21 编辑 ]
作者: ayanamei    时间: 2006-11-9 19:59
原帖由 梦游的猪 于 2006-11-9 19:10 发表


按照您的说法,那么我们只要关掉AA,那么对于同一个GPU核心就对带宽大小不敏感了?有事实能支持您的说法吗?当代GPU只剩下AA是富带宽应用?C1发布的时候,NV还说当时条件下US只能达到分离结构70-80%的效率, ...

能问出这么低级的问题说明你连对GPU工作都一点概念都没有
8个ROP@500mhz without AA 满负荷输出也只能用掉16G带宽
何况现在应用是Shader重ROP负担轻 ROP并没有想象中那么繁忙

US能够达到什么效率取决于软件如何应用,Consoles平台软件完全贴着硬件走,C1没有理由出现上述情况
基本上不管是C1还是RSX 基本上它们的效率 程序员都能挖到渣都不剩 。而C1的构架比G7X的构架先进也是无可争议的事实。
“我认为G80的杰出,最主要表现在每瓦特性能的提升上”这句话是依据概括得不能再概括的P话 这个最终结果需要建立在一系列的改进上实现的
俗话说懂行的看门道 不懂得看热闹 就这么回事

回头说CPU,游戏机也好,PC也好,CPU最后带宽的实际需求更多的是有它的应用决定的 。游戏机不是服务器 不是I/O密集型的 ok?
很简单一个道理 双通道的机器 解除双通道以后 也不是任何应用都会存在性能下降。而且出现的下降 也不是和带宽成线性比例的。
不要迷信这些数值上的东西

[ 本帖最后由 ayanamei 于 2006-11-9 20:01 编辑 ]
作者: 梦游的猪    时间: 2006-11-9 20:20
原帖由 ayanamei 于 2006-11-9 19:59 发表

能问出这么低级的问题说明你连对GPU工作都一点概念都没有
8个ROP@500mhz without AA 满负荷输出也只能用掉16G带宽
何况现在应用是Shader重ROP负担轻 ROP并没有想象中那么繁忙

US能够达到什么效率取决于软 ...


你已经跑题了,我希望你能用事实说明22.4G共享带宽对于CPU和C1来说够用了,或者证明你说的,不做AA,共享带宽小点对于C1来说没什么问题,OK?你扯到ROP上去干什么?GPU的处理过程就剩下个ROP?纹理过滤等等都不再需要显存带宽了?
谁否认了G80的框架作出的努力?它当然还带来更多的特性和更广泛的应用范围。你扯什么“同等规模下”,我就问你,你这个“同等规模”是怎么定义的?我的原话是说对于G80各种改进实际达到的效果来说,G80最显著的表现就是每瓦特性能提升。
至于CPU的地位,我想问你,UE3等引擎中的物理引擎部分在游戏机中靠谁?在PC上靠谁?这一部分需不需要带宽?如果不需要,物理加速卡给单独配上128bit GDDR3干什么?

至于什么线性增长,好像只有你自己在提。
作者: popo1937    时间: 2006-11-9 20:54
高手好多啊,厉害,
作者: ayanamei    时间: 2006-11-9 20:56
原帖由 梦游的猪 于 2006-11-9 20:20 发表


你已经跑题了,我希望你能用事实说明22.4G共享带宽对于CPU和C1来说够用了,或者证明你说的,不做AA,共享带宽小点对于C1来说没什么问题,OK?你扯到ROP上去干什么?GPU的处理过程就剩下个ROP?纹理过滤等等 ...

长见识了 纹理寻址纹理过滤依赖显存带宽  又见高手
你把GPU其它除了ROP干的工作 哪儿还需要很高带宽的都给列一下 我好学习一下
物理引擎,现阶段主流PC,X-BOX,PS3都是由CPU完成的。
现在不管是PS3,还是X-BOX还是PC都不具备PPU着么高的FLOP/S ,CPU的特性和它有本质的不同,别把DSP和CPU混在一起讨论。要说PS3 SPE比较接近,但是和PPU还是有相当的差距 如果完全跑PPU的工作量,PS3啥也别干了。别忘了CPU还有相当大的Cache缓解总线压力

你怎么不告诉我 为什么需要更大的带宽 你证明一下除了ROP以外 GPU拿什么去吃掉22.4G带宽
为什么x-box360 22.4G带宽不够用
作者: fineday    时间: 2006-11-9 20:57
原帖由 dxf_keke 于 2006-11-9 13:32 发表


哦,这个图单单是显示芯片部分啊,查一点让我失去信心买PS3了

:p 当时SONY是怎么吹嘘PS2的?好像说是PIII的100倍性能吧?
作者: 梦游的猪    时间: 2006-11-9 22:05
原帖由 ayanamei 于 2006-11-9 20:56 发表

长见识了 纹理寻址纹理过滤依赖显存带宽  又见高手
你把GPU其它除了ROP干的工作 哪儿还需要很高带宽的都给列一下 我好学习一下
物理引擎,现阶段主流PC,X-BOX,PS3都是由CPU完成的。
现在不管是PS3,还是X- ...


好吧,显存带宽为零,GPU除了ROP以外其它活都能干,行不?
没人否认ROP是GPU处理过程中最消耗内存带宽的部分,但是请不要忽略其他部分的带宽需求。一个浅显的例子,按照某娱乐网站的测试,同平台1024*768分辨率下,无AA情况下500MHZ的7300GT在显存频率分别为1G和1.4G有10%左右的性能差距,你能解释一下吗?喂8PS的7300GT尚且如此,喂48US的C1会怎么样?
一个错误:PPU浮点能力很强?似乎它的浮点能力远远赶不上CELL或者 GPU吧。
作者: aeondxf    时间: 2006-11-9 22:12
原帖由 梦游的猪 于 2006-11-9 17:44 发表


恰恰相反吧,多平台游戏开发商自己普遍都说PS3版本特效更多。
另回上面某位,C1的US16个一组,一组同一时间只能干VS或者PS之一,哪能你想减多少就减多少的?

我觉得就目前已公布的资料来讨论这个问题实 ...

这话怎么看怎么像我说过的……或者你是在LU混的?
作者: ayanamei    时间: 2006-11-9 23:56
原帖由 梦游的猪 于 2006-11-9 22:05 发表


好吧,显存带宽为零,GPU除了ROP以外其它活都能干,行不?
没人否认ROP是GPU处理过程中最消耗内存带宽的部分,但是请不要忽略其他部分的带宽需求。一个浅显的例子,按照某娱乐网站的测试,同平台1024*768分 ...

首先 Shader不能访问内存(DX10以前)数据都继承自Vertex或者通过Tex动作获得
通过提高带宽提高Shader性能是不现实的。
提高40%显存频率提高10%的性能很奇怪么? 内存控制器也不是没有延迟的,不可能达到理论效率。提高40%频率可以改善延迟带来的影响 .但是这个提升已经是不经济的,OK? 完全和性能不成曲线提升。
同样的道理 RSX显存频率提高 50% 来提高10%几的性能 SONY有病?  
你分不分得清楚什么情况叫带宽不够?

GPU这么高的实际Flop/s 很大步分原因是因为整个Shader流水线 都是寄存器操作,Tex动作需要访问内存的时候 都建立了相应的Cache 减少延迟,减少流水线阻塞的时间,同时建立了大量的线呈互相遮掩,这个和CPU有些接近。GPU的带宽可以说90%以上都是为了ROP服务的。 CPU实际上也是一个算数逻辑单元,,不像ROP,TMU这种重复机械的动作,只需要带宽来撑。CPU内部也有大量的寄存器和Cache,直接对内存I/O的比率是不高的。这样的设计本来就降低了对外部带宽的需求,带宽这个东西自然是油多不坏菜,但是也必须取一个平衡。
x-box C1可以直接取CPU L2的数据的设计,加上ROP自带eDRAM,可以说是把最大的吃带宽的东西甩掉了,这些都是减少对主内存带宽依赖性的设计。 为什么就光看到一个数值呢。为什么就一定认定22.4G住内存带宽不够?难道要多到靠频率来改善Latency才算够用么?

至于PPU这个东西我对它关注的很少 一开始就确定它是没有前途的东西。刚去看一下貌似还不是那么回事Flops也不高,具体工作流程还不清楚,居然那么需要带宽,或许都是stream operation吧 这个东西和CPU肯定是截然不同的东西

[ 本帖最后由 ayanamei 于 2006-11-9 23:59 编辑 ]
作者: 梦游的猪    时间: 2006-11-10 00:20
原帖由 ayanamei 于 2006-11-9 23:56 发表

首先 Shader不能访问内存(DX10以前)数据都继承自Vertex或者通过Tex动作获得
通过提高带宽提高Shader性能是不现实的。
提高40%显存频率提高10%的性能很奇怪么? 内存控制器也不是没有延迟的,不可能达到理 ...


首先,谁也没有期待什么线性提高。这个例子只是说明,在ROP不是瓶颈甚至可以忽略不计的情况下,内存带宽仍然对性能有影响,而不是你所说的,没事。
其次,你又提出了90%这么个数据,这个数据能够得到支持吗?
最后,你还是在以PC的思路来思考游戏机,在这样的思想下,你认为内存带宽足够了,因为你没有考虑过游戏机还要跑别的东西,它不像PC,跑不了了就加个卡,游戏机没得加,只能CPU来顶住。基于这样的原因,我才提出,XO的主存带宽够不够的疑问,记住,仅仅是疑问而不是像你那样一上来就来个“硬伤”之类的。
作者: ayanamei    时间: 2006-11-10 00:59
原帖由 梦游的猪 于 2006-11-10 00:20 发表


首先,谁也没有期待什么线性提高。这个例子只是说明,在ROP不是瓶颈甚至可以忽略不计的情况下,内存带宽仍然对性能有影响,而不是你所说的,没事。
其次,你又提出了90%这么个数据,这个数据能够得到支持吗 ...

诚心找碴是不 同样内存频率下 高内存参数和低内存参数 对CPU跑SUPER-PI还有影响呢
这个时候你提高频率只是改善MC,ROP,TMU等Latency对GPU带来的影响。
DDRI 和 DDRIII 同样跑600mhz 性能还不同呢,你以为内存性能光一个带宽就代表一切了?,还有时序等 ok?,提高40%才能提高10%性能,也能用来说明带宽不够?满足ROP理论填充能力就需要消耗16G带宽  提高6.4G带宽就提高了10%(就且算是提高带宽带来的好处,不算latency方面的改进),还真说明GPU除了ROP还有其他东西很吃带宽阿  整整10%呢!

这个90% 还需要数据支持么? 90%已经是很保守的估计 Shader不访问显存  TMU只有Tex动作的时候才访问显存,Filter和显存也毫无关系。 现代GPU除掉 VS/PS TMU. ROP 还能剩下什么?  自己去看几本图形方面的书OK?

另外别一口一个pc,游戏机,都是计算机体系下的东西,只不够硬体构架不同,但是基本原理原则都是相同的。CPU到底能够解决多少应用,决定因素是CPU的IPC,而不是带宽,而为什么你就认为CPU的IP/C不会先成为瓶颈而是,系统带宽拖累CPU呢?
我承认CPU的IPC需要带宽做保证,但是别忘了CPU有Cache这种东西存在,如果不知道这个这个东西的意义可以去查一下。
不同设计的CPU对总线带宽的依赖是不同的。反观CELL forPS3  PPE搭配 64KB L1缓存和512KB ,而SPE则完全没有Cache
我还真不知道程序能否真的做到每次提前将数据MOV 到SPE的buffer中去。 PPE的负担负责协调7个SPE(1个备用的救险不算了)
本身还要负责通用计算,又只有512K cache,如果MISS ,访问主存,那性能就真叫好看了。这种构架软件优化的好就不错,如果优化不到位,性能完全没有保障。

太依赖外部环境的构架都是很危险的。  X-BOX 相当的保守 首先核心账面上不会和CELL for PS3那么多,3个核心都能做通用计算,都具备64k L1, 然后共享1MB L2.虽然保守。但是可靠。 22.4G内存带宽,21.6G前端总线  配合的相当不错啊
有什么问题么?而且CPU不是GPU的ROP 不断的读写内存 #那样会慢死的。

Cell for PS3一直都是SONY一个劲叫好 Derverloper一个一个叫苦 为啥?因为你?因为我? 或许PS3最后实际的表现会很不错
一下控制8个两种异质的CORE,上帝保佑伟大的DEVERLOPER

[ 本帖最后由 ayanamei 于 2006-11-10 01:03 编辑 ]
作者: 来不及思考    时间: 2006-11-10 01:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: aeondxf    时间: 2006-11-10 01:08
:( 程序员拼命加班,美工选择加班,组长陪着加班,老板永不加班.
愿上天保佑CELL~
愿魔鬼诅咒CELL......
作者: jackpeng33    时间: 2006-11-10 10:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: RacingPHT    时间: 2006-11-10 10:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: hdfeel    时间: 2006-11-10 11:47
原帖由 jackpeng33 于 2006-11-10 10:00 发表

怎么整个DC vs ps2的翻版,我还记得那时的人说,ps2就这个DC的机能 ,做出来的游戏和DC差不多还吹是p3的几陪几陪 :o后来又怎么样了 :lol:

ps2 在多边形 和 带宽上 强过 dc, dc 在特效支持, 显存大小上强过 ps2。


而 c1  在 多边形上  ,带宽, 特效支持, 显存大小上  全部 强过  rsx。
作者: hdfeel    时间: 2006-11-10 12:33
原帖由 梦游的猪 于 2006-11-9 17:44 发表


恰恰相反吧,多平台游戏开发商自己普遍都说PS3版本特效更多。
另回上面某位,C1的US16个一组,一组同一时间只能干VS或者PS之一,哪能你想减多少就减多少的?

我觉得就目前已公布的资料来讨论这个问题实 ...

以前的 说不清楚,现在ps3 要发布了。实事总会出来。

第一个 多平台游戏 评分已经出来了。  ps3 差 xo 一个级别。   接下去 ,就看 第二个,第三个,有的是好戏看。


:lol:
作者: R620    时间: 2006-11-10 12:38
原帖由 RacingPHT 于 2006-11-10 10:22 发表
GPU的带宽消耗主要是两个部分, ROP, TMU.
ROP是最占带宽的一个操作, 这是毫无疑问的.

如果需要数据的话, 可以这么考虑: TMU fetch DXT1, 每个fetch需要2byte.那么满载的时候, 内部带宽就是16G/s. 假设cache ...


难道象素填充率就不消耗带宽吗?:blink:
作者: ayanamei    时间: 2006-11-10 13:18
原帖由 R620 于 2006-11-10 12:38 发表


难道象素填充率就不消耗带宽吗?:blink:

ROP=Raster operation processor
作者: R620    时间: 2006-11-10 13:20
原帖由 ayanamei 于 2006-11-10 13:18 发表

ROP=Raster operation processor


请说明白些,难到不消耗带宽,只消耗ROP?
作者: ayanamei    时间: 2006-11-10 13:22
原帖由 R620 于 2006-11-10 13:20 发表


请说明白些,难到不消耗带宽,只消耗ROP?

那你以为ROP是干什么事情的?
作者: R620    时间: 2006-11-10 13:25
原帖由 ayanamei 于 2006-11-10 13:22 发表

那你以为ROP是干什么事情的?


只是消耗ROP?不消耗显存带宽吗?
作者: ayanamei    时间: 2006-11-10 13:29
原帖由 R620 于 2006-11-10 13:25 发表


只是消耗ROP?不消耗显存带宽吗?

:wacko: 麻烦你回贴之前好好看看帖子
作者: R620    时间: 2006-11-10 13:31
原帖由 ayanamei 于 2006-11-10 13:29 发表

:wacko: 麻烦你回贴之前好好看看帖子


我好苯的,你解释清楚好吗?
作者: ayanamei    时间: 2006-11-10 13:33
原帖由 R620 于 2006-11-10 13:31 发表


我好苯的,你解释清楚好吗?

你说的填充动作 包括z/alpha/color都是ROP在做的 所以带宽都是被ROP吃掉的
作者: 无梦之夜    时间: 2006-11-10 13:38
原帖由 jackpeng33 于 2006-11-10 10:00 发表

怎么整个DC vs ps2的翻版,我还记得那时的人说,ps2就这个DC的机能 ,做出来的游戏和DC差不多还吹是p3的几陪几陪 :o后来又怎么样了 :lol:


DC的生化:代号维罗尼卡据说比PS2版的强多了....:unsure:
作者: RacingPHT    时间: 2006-11-10 13:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: R620    时间: 2006-11-10 13:42
原帖由 ayanamei 于 2006-11-10 13:33 发表

你说的填充动作 包括z/alpha/color都是ROP在做的 所以带宽都是被ROP吃掉的


在特效全开的情况下,G80现在的显存带宽能满足24个ROP的胃口吗?
作者: R620    时间: 2006-11-10 13:43
原帖由 RacingPHT 于 2006-11-10 13:41 发表


你们这些ROP党, 连ROP在做什么都不知道?


不是ROP党,所以不知道ROP是做什么的
作者: ayanamei    时间: 2006-11-10 13:46
原帖由 R620 于 2006-11-10 13:42 发表


在特效全开的情况下,G80现在的显存带宽能满足24个ROP的胃口吗?

特效全开,ROP就清闲了
都在敲碗催:Shader 你快点阿 #。我们这没啥干了 #

当然开高AA的话,绝对满足是不现实的。。只是说尽量少拖后腿
作者: lazybat    时间: 2006-11-10 14:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: ayanamei    时间: 2006-11-10 14:17
原帖由 lazybat 于 2006-11-10 14:11 发表
高手好多,不过我自己买的是xbox。现在xbox已经被ms彻底抛弃了。
可是ps2呢?依旧有游戏玩,依旧在被挖掘着潜力!
就这点,就坚决了我不再买ms的游戏机的决心,听说什么xbox720又在设计中了......

这里只讨论硬件层
游戏开发阵营 X-BOX本来就不在优势
作者: scast    时间: 2006-11-10 16:54
理想ps3 :四核Intel kentfield + G80

这样达到05年E3的演示画面水平才差不多

纯YY:loveliness:

[ 本帖最后由 scast 于 2006-11-10 17:00 编辑 ]
作者: RacingPHT    时间: 2006-11-10 16:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: R620    时间: 2006-11-10 18:15
原帖由 scast 于 2006-11-10 16:54 发表
理想ps3 :四核Intel kentfield + G80

这样达到05年E3的演示画面水平才差不多

纯YY:loveliness:


CELL+G80就可以达到05年E3的演示画面水平了
作者: complexmind    时间: 2006-11-11 17:20
大虾的教导小弟听懂了,但我就是觉得光栅化处理器不就是把立体图形转化到平面的么?怎么连读纹理都管到了??
另外,我还觉得奇怪,在全开特效时,即使Shader拖速度,但ROP的任务量还没少啊,要保证流畅运行,至少不会闲吧??
其次,我对C1和RSX相当于什么级别的PC卡很感兴趣w00t)  ,我在别处听很多开发者都说RSX就是7600GT的水准,大虾有什么看法??
转载如下:
c1除了理论上的像素填充率略低于g71外其余都很高,而现在rsx只是知道是g71缩水版,但是缩多少不好说,比较一致的看法是7600gt的水平,这是求证不少开发过Ps3 游戏的人的说法,以前是我自己判断的。如果是这样的话,c1的所有关键性能肯定是大于rsx的,因为ea某人说过c1的表面性能就是x1800xt水准,用专用编译器和开发工具可以渣出x1950的水平来。
cpu是最不好说的东西,因为cell设计颇为另类,如果用好了的话对于矢量加速和处理一些特殊的光影、ai和物理很有帮助,扬长避短的话会不错。而xo的xenos是一个相对稳妥的设计,3个物理内核虽然峰值不是很高,但是效率不俗,因为对称多处理技术已经很成熟,编译器方面都很成熟。xenos设计最特殊的地方是可以和gpu通过专用超高速通道互操作,这才是关键,c1可以实现dx的所有核心集很大程度就是靠这种cpu和gpu的一体划设计。
ps3理论值照现有资料看不少地方高于xo,可惜没法求证,因为已经半年没rsx和南桥的消息了。
如果cell和rsx很好的协调是可以做出很好的画面的,至少比现在强一个等级,但是这不是短时间可以解决的,起码要再等一年,可能会有办法,但是前提是sony有良好的技术支持,可就目前来说做得很不好,抱怨的人很多。比如说《战鹰》的网络模式取消就是因为连函数库都拿不出,按说网络部分只是比较低的一环,而且技术也相对比较成熟。
有一点可以肯定的是ps3因为频宽限制,材质上肯定是做不到xo那种素质的,光影倒是可以,还有就是建模质量还是可以挖掘一下潜力的,ps3的几何运算能力还是可以的。
作者: 1天    时间: 2006-11-11 17:26
原帖由 complexmind 于 2006-11-11 17:20 发表
大虾的教导小弟听懂了,但我就是觉得光栅化处理器不就是把立体图形转化到平面的么?怎么连读纹理都管到了??
另外,我还觉得奇怪,在全开特效时,即使Shader拖速度,但ROP的任务量还没少啊,要保证流畅运行,至少不会闲吧??
其次,我对C1和RSX相当于什么级别的PC卡很感兴趣  ,我在别处听很多开发者都说RSX就是7600GT的水准,大虾有什么看法??


冒昧地来回答几句,因为不是大虾,可能会有错误……
读取纹理……纹理是储存在显存里的,自然要读取的话只能通过ROP了……
Shader拖速度,ROP会闲下来的,因为暂时没有读写动作……
C1……应该说不如X1800XT吧……GTO的水平?RSX肯定是要比7600GT高的,24PS在那儿摆着。
作者: ayanamei    时间: 2006-11-11 17:26
shader OpenGL被称为Fragment program 我觉得这个称呼更为合理
就是说它操作的是Vertex数据--Pixel之间的中过程   
ROP的动作是填充 如果Shader没有完成操作的话 根本没有数据送去给ROP
ROP自然就清闲了  
TMU的动作和ROP没啥关系 但是TMU是除掉ROP外 另一个需要消耗带宽的东西
但是事实上现在你看NFS10  arithmetic :tex 达到25:1 基本上TMU的动作也很少 所也不可能吃掉多少带宽
作者: complexmind    时间: 2006-11-11 17:29
但似乎Nvidia没有明确的提出24条流水线的说法,幻灯片上的说法是:
G71 based
136 op/per clock
仅此
作者: ayanamei    时间: 2006-11-11 17:51
原帖由 complexmind 于 2006-11-11 17:29 发表
但似乎Nvidia没有明确的提出24条流水线的说法,幻灯片上的说法是:
G71 based
136 op/per clock
仅此

136 OP/s的话 #这个Op/s不知道怎么算出来的
从上面给出的Flops 来看
和G71是一样的规格  196Gflops 来看  是24PS没错的 频率500
但是ROP部分减少了  基本上综合表现应该是在7600gt这一档
利用的好比它略强

[ 本帖最后由 ayanamei 于 2006-11-11 17:53 编辑 ]
作者: popwangyuII    时间: 2006-11-11 18:00
原帖由 ayanamei 于 2006-11-10 00:59 发表

诚心找碴是不 同样内存频率下 高内存参数和低内存参数 对CPU跑SUPER-PI还有影响呢
这个时候你提高频率只是改善MC,ROP,TMU等Latency对GPU带来的影响。
DDRI 和 DDRIII 同样跑600mhz 性能还不同呢,你以为内 ...



:lol: 兄台是懂技术的人,而且应该是管理层面的人。分析的全面到位,佩服
作者: ayanamei    时间: 2006-11-11 18:23
原帖由 popwangyuII 于 2006-11-11 18:00 发表



:lol: 兄台是懂技术的人,而且应该是管理层面的人。分析的全面到位,佩服

都只是爱好者 谈不上很懂 刚入门的老鸟
仅仅是看不惯有些人整天胡说八道
这么高的帽子我就戴不起了w00t)
作者: ayanamei    时间: 2006-11-11 18:30
原帖由 1天 于 2006-11-11 17:26 发表


冒昧地来回答几句,因为不是大虾,可能会有错误……
读取纹理……纹理是储存在显存里的,自然要读取的话只能通过ROP了……
Shader拖速度,ROP会闲下来的,因为暂时没有读写动作……
C1……应该说不如X18 ...

TMU和ROP是分开的
关系上TMU和Shader是并列的
Shader需要读取texel 就要动用TMU了
作者: complexmind    时间: 2006-11-11 18:31
大虾别谦虚了,小弟在Gz上就久仰大名了
作者: complexmind    时间: 2006-11-11 18:38
呵呵,连7900GS还不如,SONY的宣传攻势厉害啊!百度贴吧上连7800GTX 512都吹出来了,SONY宣传部都是人才啊。
作者: 来不及思考    时间: 2006-11-11 18:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: ayanamei    时间: 2006-11-11 18:48
原帖由 来不及思考 于 2006-11-11 18:42 发表


铃波女神,又谦虚了 :a)
真可爱,来,来,来,亲一个 :wub:

=。= 表恶心我
偶说的是事实么
难道你说不是?
作者: apexmfg    时间: 2006-11-11 19:09
看不懂,太专业了:loveliness:
作者: ximimi    时间: 2006-11-11 19:12
原帖由 ayanamei 于 2006-11-10 00:59 发表
还真不知道程序能否真的做到每次提前将数据MOV 到SPE的buffer中去。 PPE的负担负责协调7个SPE(1个备用的救险不算了)
本身还要负责通用计算,又只有512K cache,如果MISS ,访问主存,那性能就真叫好看了。这种构架软件优化的好就不错,如果优化不到位,性能完全没有保障。

你已经过时了

你知道xbox2的那个l2 cache share是怎么回事么,为什么要l2 cache share

cell把这个进程间通信完全硬件化了,这是个开销非常大的操作,从最底层彻底的实现了架构的改变

cell不用cache,而是本地内存

属于异步架构

他不存在cache miss

他每次装载的是一大块(chunk)数据而开销只需要一个dma指令,而cpu每次只能一个字的传送,传统cpu设计是一个慢速设备

cell是一种未来的超强架构
作者: popwangyuII    时间: 2006-11-11 19:13
原帖由 ayanamei 于 2006-11-11 18:48 发表

=。= 表恶心我
偶说的是事实么
难道你说不是?



:loveliness: 原来是个MM啊,有这样的见地真是令我佩服得五体投地。真的
作者: complexmind    时间: 2006-11-11 19:32
原来是女孩啊 !!!!!!#!
昏厥ing!!
原来是我女朋友的理想人选啊。
falling in love!!!

[ 本帖最后由 complexmind 于 2006-11-11 19:38 编辑 ]
作者: complexmind    时间: 2006-11-11 19:36
原帖由 ximimi 于 2006-11-11 07:12 PM 发表

你已经过时了

你知道xbox2的那个l2 cache share是怎么回事么,为什么要l2 cache share

cell把这个进程间通信完全硬件化了,这是个开销非常大的操作,从最底层彻底的实现了架构的改变

cell不用cache, ...

???如何用你的理论来推出结论??小弟不才,好像SDRAM时代的异步性能很差啊??而且,Cell的DMA慢的吓人是第一手拿到Cell刀板的人放出来的结论啊。
作者: 1天    时间: 2006-11-11 19:40
原帖由 ayanamei 于 2006-11-11 18:30 发表

TMU和ROP是分开的
关系上TMU和Shader是并列的
Shader需要读取texel 就要动用TMU了

多谢指教……这么说TMU也有直接访问显存的能力了
作者: ayanamei    时间: 2006-11-11 19:41
原帖由 ximimi 于 2006-11-11 19:12 发表

你已经过时了

你知道xbox2的那个l2 cache share是怎么回事么,为什么要l2 cache share

cell把这个进程间通信完全硬件化了,这是个开销非常大的操作,从最底层彻底的实现了架构的改变

cell不用cache, ...

又见大师了
你就不用在这里模仿别人说话
不会cache miss? 当然咯 每次都要指令red内存 当然不会miss。
你怎么保证每次都能正好从提前内存抓到数据
还真指望编译器最后能完美实现阿
延迟怎么算 ,每次的延迟都是近似的,远远大于Cache数十倍, 7个SPE啊 你睡醒没
这种结构也只是说SPE这种有序内核可以用用 成本也低廉 就是风险全砸在软件上了
这样就叫面向未来的构架??
有序的构架的微核心又不是今天才有
硬件化??这叫硬件化 完完全全的靠软件实现这样的动作叫硬件化?
反而Cache这种主动的结构变成了开销非常大?  你知不知道Cache是干什么用的阿

[ 本帖最后由 ayanamei 于 2006-11-11 19:47 编辑 ]
作者: ayanamei    时间: 2006-11-11 19:41
原帖由 complexmind 于 2006-11-11 19:32 发表
原来是女孩啊 。。。#!
昏厥ing!!
原来是我女朋友的理想人选啊。
falling in love!!!

我不是MM 思考每次都用这个恶心我 #
作者: popwangyuII    时间: 2006-11-11 19:43
原帖由 complexmind 于 2006-11-11 19:32 发表
原来是女孩啊 。。。#!
昏厥ing!!
原来是我女朋友的理想人选啊。
falling in love!!!



:funk: 我比你先发现,不要和我抢
作者: 1天    时间: 2006-11-11 19:43
原帖由 ayanamei 于 2006-11-11 19:41 发表

我不是MM 思考每次都用这个恶心我 #

:sweatingbullets:
作者: ghrs2010    时间: 2006-11-11 19:43
原帖由 complexmind 于 2006-11-11 19:36 发表

???如何用你的理论来推出结论??小弟不才,好像SDRAM时代的异步性能很差啊??而且,Cell的DMA慢的吓人是第一手拿到Cell刀板的人放出来的结论啊。


和您想象的完全不是一回事

简单的说,SPE没有缓存,有的只是特别快的内存,至于缓存设计本身有什么优缺点,就不用说了吧

只能说是侧重点不同
作者: complexmind    时间: 2006-11-11 19:45
原帖由 ayanamei 于 2006-11-11 07:41 PM 发表

我不是MM 思考每次都用这个恶心我 #

哈哈哈,误会了,不过我们可能是情敌呦。我可也是很喜欢Rei的呢。
作者: popwangyuII    时间: 2006-11-11 19:48
原帖由 ayanamei 于 2006-11-11 19:41 发表

又见大师了
你就不用在这里模仿别人说话
不会cache miss? 当然咯 每次都要指令red内存 当然不会miss。
你怎么保证每次都能正好从提前内存抓到数据
还真指望编译器最后能完美实现阿
延迟怎么算 ,每次的 ...



对CELL的编译器最终能达到什么程度持非常怀疑的态度。像CELL这种有序体系为了达到其“可预知指令执行时间”,必然要做出很多性能上的让步,而完全依靠编译器仅就开发成本来讲,未必比无序体系的低。从PS3来看,CELL的确一般般。

[ 本帖最后由 popwangyuII 于 2006-11-11 19:55 编辑 ]
作者: ayanamei    时间: 2006-11-11 19:48
原帖由 ghrs2010 于 2006-11-11 19:43 发表


和您想象的完全不是一回事

简单的说,SPE没有缓存,有的只是特别快的内存,至于缓存设计本身有什么优缺点,就不用说了吧

只能说是侧重点不同

SPE的buffer 是SRAM, 但是没有Cache机制 仅仅是用来回避主存巨高延迟的折衷做法
每次都考之令先把数据搬到SRAM里面 然后再操作  SRAM延迟低不至于让SPE瘫痪
作者: ayanamei    时间: 2006-11-11 19:55
原帖由 complexmind 于 2006-11-11 19:45 发表

哈哈哈,误会了,不过我们可能是情敌呦。我可也是很喜欢Rei的呢。

Cell for ps3 PPE太少 ,SPE太多
严重失衡  不过SPE成本低啊 要不了多少晶体管 账面上又好听
这东西  用的好倒不错 用不好就玩完
成也SPE 败也SPE

SPE全是SIMD,跑1D指令的话 肯定浪费资源 IBM倒是提供了编译器自动向量化 但是不是什么东西都能向量化的
加上 不支持branch,要在要暴力解开。。 128K SRAM还真不知道到时候够不够
作者: 来不及思考    时间: 2006-11-11 19:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: popwangyuII    时间: 2006-11-11 19:57
PS3执行游戏AI逻辑时,CELL到底能达到什么程度?
作者: complexmind    时间: 2006-11-11 19:58
小弟想的话搬进数据的延迟浩大,所以性能依旧不咋地,是么??
但似乎这种构架对流式数据很吃得开呢。
作者: complexmind    时间: 2006-11-11 19:59
原帖由 来不及思考 于 2006-11-11 07:55 PM 发表


见到过不少装MM的人妖
但装男人的MM还真是少见 :blink:

唔唔唔,我到底该信谁??
作者: ayanamei    时间: 2006-11-11 20:00
原帖由 popwangyuII 于 2006-11-11 19:57 发表
PS3执行游戏AI逻辑时,CELL到底能达到什么程度?


AI就是Branch密集型的 PPE肯定是忙不过来了
SPE暴力硬上吧 实在不行就多堆几个SPE跑(AI也不会变态到这个程度,笑 极端的例子)
就是性能肯定会受点拖累

但是这方面和X-BOX就没得比了
我觉得PS3游戏 提高Physics表现倒是不错么。不是现在正这么做么  SPE这么多 不用也是浪费。许多事情又不适合它干,干脆就用来跑这个算了
作者: ayanamei    时间: 2006-11-11 20:02
原帖由 complexmind 于 2006-11-11 19:58 发表
小弟想的话搬进数据的延迟浩大,所以性能依旧不咋地,是么??
但似乎这种构架对流式数据很吃得开呢。

SPE本来设计出来就偏向于这个。。
不是PS3 当初同时解码 NN个视频么 简直是SPE秀阿

感觉就是到处找地方想办法把SPE用上

[ 本帖最后由 ayanamei 于 2006-11-11 20:04 编辑 ]




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4