POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: codxk
打印 上一主题 下一主题

G80与PS3的RSX和XO的C1的数据图!

[复制链接]
41#
发表于 2006-11-9 23:56 | 只看该作者
原帖由 梦游的猪 于 2006-11-9 22:05 发表


好吧,显存带宽为零,GPU除了ROP以外其它活都能干,行不?
没人否认ROP是GPU处理过程中最消耗内存带宽的部分,但是请不要忽略其他部分的带宽需求。一个浅显的例子,按照某娱乐网站的测试,同平台1024*768分 ...

首先 Shader不能访问内存(DX10以前)数据都继承自Vertex或者通过Tex动作获得
通过提高带宽提高Shader性能是不现实的。
提高40%显存频率提高10%的性能很奇怪么? 内存控制器也不是没有延迟的,不可能达到理论效率。提高40%频率可以改善延迟带来的影响 .但是这个提升已经是不经济的,OK? 完全和性能不成曲线提升。
同样的道理 RSX显存频率提高 50% 来提高10%几的性能 SONY有病?  
你分不分得清楚什么情况叫带宽不够?

GPU这么高的实际Flop/s 很大步分原因是因为整个Shader流水线 都是寄存器操作,Tex动作需要访问内存的时候 都建立了相应的Cache 减少延迟,减少流水线阻塞的时间,同时建立了大量的线呈互相遮掩,这个和CPU有些接近。GPU的带宽可以说90%以上都是为了ROP服务的。 CPU实际上也是一个算数逻辑单元,,不像ROP,TMU这种重复机械的动作,只需要带宽来撑。CPU内部也有大量的寄存器和Cache,直接对内存I/O的比率是不高的。这样的设计本来就降低了对外部带宽的需求,带宽这个东西自然是油多不坏菜,但是也必须取一个平衡。
x-box C1可以直接取CPU L2的数据的设计,加上ROP自带eDRAM,可以说是把最大的吃带宽的东西甩掉了,这些都是减少对主内存带宽依赖性的设计。 为什么就光看到一个数值呢。为什么就一定认定22.4G住内存带宽不够?难道要多到靠频率来改善Latency才算够用么?

至于PPU这个东西我对它关注的很少 一开始就确定它是没有前途的东西。刚去看一下貌似还不是那么回事Flops也不高,具体工作流程还不清楚,居然那么需要带宽,或许都是stream operation吧 这个东西和CPU肯定是截然不同的东西

[ 本帖最后由 ayanamei 于 2006-11-9 23:59 编辑 ]
回复 支持 反对

使用道具 举报

42#
发表于 2006-11-10 00:20 | 只看该作者
原帖由 ayanamei 于 2006-11-9 23:56 发表

首先 Shader不能访问内存(DX10以前)数据都继承自Vertex或者通过Tex动作获得
通过提高带宽提高Shader性能是不现实的。
提高40%显存频率提高10%的性能很奇怪么? 内存控制器也不是没有延迟的,不可能达到理 ...


首先,谁也没有期待什么线性提高。这个例子只是说明,在ROP不是瓶颈甚至可以忽略不计的情况下,内存带宽仍然对性能有影响,而不是你所说的,没事。
其次,你又提出了90%这么个数据,这个数据能够得到支持吗?
最后,你还是在以PC的思路来思考游戏机,在这样的思想下,你认为内存带宽足够了,因为你没有考虑过游戏机还要跑别的东西,它不像PC,跑不了了就加个卡,游戏机没得加,只能CPU来顶住。基于这样的原因,我才提出,XO的主存带宽够不够的疑问,记住,仅仅是疑问而不是像你那样一上来就来个“硬伤”之类的。
回复 支持 反对

使用道具 举报

43#
发表于 2006-11-10 00:59 | 只看该作者
原帖由 梦游的猪 于 2006-11-10 00:20 发表


首先,谁也没有期待什么线性提高。这个例子只是说明,在ROP不是瓶颈甚至可以忽略不计的情况下,内存带宽仍然对性能有影响,而不是你所说的,没事。
其次,你又提出了90%这么个数据,这个数据能够得到支持吗 ...

诚心找碴是不 同样内存频率下 高内存参数和低内存参数 对CPU跑SUPER-PI还有影响呢
这个时候你提高频率只是改善MC,ROP,TMU等Latency对GPU带来的影响。
DDRI 和 DDRIII 同样跑600mhz 性能还不同呢,你以为内存性能光一个带宽就代表一切了?,还有时序等 ok?,提高40%才能提高10%性能,也能用来说明带宽不够?满足ROP理论填充能力就需要消耗16G带宽  提高6.4G带宽就提高了10%(就且算是提高带宽带来的好处,不算latency方面的改进),还真说明GPU除了ROP还有其他东西很吃带宽阿  整整10%呢!

这个90% 还需要数据支持么? 90%已经是很保守的估计 Shader不访问显存  TMU只有Tex动作的时候才访问显存,Filter和显存也毫无关系。 现代GPU除掉 VS/PS TMU. ROP 还能剩下什么?  自己去看几本图形方面的书OK?

另外别一口一个pc,游戏机,都是计算机体系下的东西,只不够硬体构架不同,但是基本原理原则都是相同的。CPU到底能够解决多少应用,决定因素是CPU的IPC,而不是带宽,而为什么你就认为CPU的IP/C不会先成为瓶颈而是,系统带宽拖累CPU呢?
我承认CPU的IPC需要带宽做保证,但是别忘了CPU有Cache这种东西存在,如果不知道这个这个东西的意义可以去查一下。
不同设计的CPU对总线带宽的依赖是不同的。反观CELL forPS3  PPE搭配 64KB L1缓存和512KB ,而SPE则完全没有Cache
我还真不知道程序能否真的做到每次提前将数据MOV 到SPE的buffer中去。 PPE的负担负责协调7个SPE(1个备用的救险不算了)
本身还要负责通用计算,又只有512K cache,如果MISS ,访问主存,那性能就真叫好看了。这种构架软件优化的好就不错,如果优化不到位,性能完全没有保障。

太依赖外部环境的构架都是很危险的。  X-BOX 相当的保守 首先核心账面上不会和CELL for PS3那么多,3个核心都能做通用计算,都具备64k L1, 然后共享1MB L2.虽然保守。但是可靠。 22.4G内存带宽,21.6G前端总线  配合的相当不错啊
有什么问题么?而且CPU不是GPU的ROP 不断的读写内存 #那样会慢死的。

Cell for PS3一直都是SONY一个劲叫好 Derverloper一个一个叫苦 为啥?因为你?因为我? 或许PS3最后实际的表现会很不错
一下控制8个两种异质的CORE,上帝保佑伟大的DEVERLOPER

[ 本帖最后由 ayanamei 于 2006-11-10 01:03 编辑 ]
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
44#
发表于 2006-11-10 01:01 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

45#
发表于 2006-11-10 01:08 | 只看该作者
:( 程序员拼命加班,美工选择加班,组长陪着加班,老板永不加班.
愿上天保佑CELL~
愿魔鬼诅咒CELL......
回复 支持 反对

使用道具 举报

jackpeng33 该用户已被删除
46#
发表于 2006-11-10 10:00 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
47#
发表于 2006-11-10 10:22 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

48#
发表于 2006-11-10 11:47 | 只看该作者
原帖由 jackpeng33 于 2006-11-10 10:00 发表

怎么整个DC vs ps2的翻版,我还记得那时的人说,ps2就这个DC的机能 ,做出来的游戏和DC差不多还吹是p3的几陪几陪 :o后来又怎么样了 :lol:

ps2 在多边形 和 带宽上 强过 dc, dc 在特效支持, 显存大小上强过 ps2。


而 c1  在 多边形上  ,带宽, 特效支持, 显存大小上  全部 强过  rsx。
回复 支持 反对

使用道具 举报

49#
发表于 2006-11-10 12:33 | 只看该作者
原帖由 梦游的猪 于 2006-11-9 17:44 发表


恰恰相反吧,多平台游戏开发商自己普遍都说PS3版本特效更多。
另回上面某位,C1的US16个一组,一组同一时间只能干VS或者PS之一,哪能你想减多少就减多少的?

我觉得就目前已公布的资料来讨论这个问题实 ...

以前的 说不清楚,现在ps3 要发布了。实事总会出来。

第一个 多平台游戏 评分已经出来了。  ps3 差 xo 一个级别。   接下去 ,就看 第二个,第三个,有的是好戏看。


:lol:
回复 支持 反对

使用道具 举报

50#
发表于 2006-11-10 12:38 | 只看该作者
原帖由 RacingPHT 于 2006-11-10 10:22 发表
GPU的带宽消耗主要是两个部分, ROP, TMU.
ROP是最占带宽的一个操作, 这是毫无疑问的.

如果需要数据的话, 可以这么考虑: TMU fetch DXT1, 每个fetch需要2byte.那么满载的时候, 内部带宽就是16G/s. 假设cache ...


难道象素填充率就不消耗带宽吗?:blink:
回复 支持 反对

使用道具 举报

51#
发表于 2006-11-10 13:18 | 只看该作者
原帖由 R620 于 2006-11-10 12:38 发表


难道象素填充率就不消耗带宽吗?:blink:

ROP=Raster operation processor
回复 支持 反对

使用道具 举报

52#
发表于 2006-11-10 13:20 | 只看该作者
原帖由 ayanamei 于 2006-11-10 13:18 发表

ROP=Raster operation processor


请说明白些,难到不消耗带宽,只消耗ROP?
回复 支持 反对

使用道具 举报

53#
发表于 2006-11-10 13:22 | 只看该作者
原帖由 R620 于 2006-11-10 13:20 发表


请说明白些,难到不消耗带宽,只消耗ROP?

那你以为ROP是干什么事情的?
回复 支持 反对

使用道具 举报

54#
发表于 2006-11-10 13:25 | 只看该作者
原帖由 ayanamei 于 2006-11-10 13:22 发表

那你以为ROP是干什么事情的?


只是消耗ROP?不消耗显存带宽吗?
回复 支持 反对

使用道具 举报

55#
发表于 2006-11-10 13:29 | 只看该作者
原帖由 R620 于 2006-11-10 13:25 发表


只是消耗ROP?不消耗显存带宽吗?

:wacko: 麻烦你回贴之前好好看看帖子
回复 支持 反对

使用道具 举报

56#
发表于 2006-11-10 13:31 | 只看该作者
原帖由 ayanamei 于 2006-11-10 13:29 发表

:wacko: 麻烦你回贴之前好好看看帖子


我好苯的,你解释清楚好吗?
回复 支持 反对

使用道具 举报

57#
发表于 2006-11-10 13:33 | 只看该作者
原帖由 R620 于 2006-11-10 13:31 发表


我好苯的,你解释清楚好吗?

你说的填充动作 包括z/alpha/color都是ROP在做的 所以带宽都是被ROP吃掉的
回复 支持 反对

使用道具 举报

58#
发表于 2006-11-10 13:38 | 只看该作者
原帖由 jackpeng33 于 2006-11-10 10:00 发表

怎么整个DC vs ps2的翻版,我还记得那时的人说,ps2就这个DC的机能 ,做出来的游戏和DC差不多还吹是p3的几陪几陪 :o后来又怎么样了 :lol:


DC的生化:代号维罗尼卡据说比PS2版的强多了....:unsure:
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
59#
发表于 2006-11-10 13:41 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

60#
发表于 2006-11-10 13:42 | 只看该作者
原帖由 ayanamei 于 2006-11-10 13:33 发表

你说的填充动作 包括z/alpha/color都是ROP在做的 所以带宽都是被ROP吃掉的


在特效全开的情况下,G80现在的显存带宽能满足24个ROP的胃口吗?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-2 22:44

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表