POPPUR爱换

标题: SONY是否有实力搞好CELL的编译器? [打印本页]

作者: popwangyuII    时间: 2006-11-13 11:33
标题: SONY是否有实力搞好CELL的编译器?
搞了这么久还是不行,SONY当初就太自大了.这回吃到苦头了.

实在不行PS3就加一块K8吧.死撑到最后XBOX720都会出来了.
作者: AFXIF    时间: 2006-11-13 11:44
真这样不是华丽了么,一个板子上要用4种内存……
作者: popwangyuII    时间: 2006-11-13 11:49
原帖由 AFXIF 于 2006-11-13 11:44 发表
真这样不是华丽了么,一个板子上要用4种内存……



:lol: 那就没救了.
作者: RacingPHT    时间: 2006-11-13 11:50
提示: 作者被禁止或删除 内容自动屏蔽
作者: RacingPHT    时间: 2006-11-13 11:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-11-13 12:04
05年的时候PS3开发件用的是gcc 3.4.1,现在也许正准备迁往4.0。

对于游戏机来说,关键性的性能代码都是intrinsics或者汇编代码。

选择Cell是比Conroe更好的选择,看不出任何理由要选择K8。

M$的编译器在历史上性能都比较一般。

PS3是三个主机中唯一真正开放性的平台,你如果希望只借助编译器的话,也可以考虑IBM的XLor Cell(八爪鱼),完全免费。
作者: hdht    时间: 2006-11-13 12:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: ximimi    时间: 2006-11-13 12:39
sony的技术部门很多佬外的

其中图形部门尤甚
比如gentoo前总裁就任技术总监
至于编译器,往往是上帝之手的一些人加一点传奇和天才特点的人

一个很小的团队往往就可出奇制胜。

你知道世界上最好的编译器是几个人写的么:thumbsup:
作者: tooter    时间: 2006-11-13 12:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: popwangyuII    时间: 2006-11-13 12:47
原帖由 Edison 于 2006-11-13 12:04 发表
05年的时候PS3开发件用的是gcc 3.4.1,现在也许正准备迁往4.0。

对于游戏机来说,关键性的性能代码都是intrinsics或者汇编代码。

选择Cell是比Conroe更好的选择,看不出任何理由要选择K8。

M$的编译器 ...



CELL如何执行游戏AI中多如牛毛的分支?我想console的game不仅仅就只能像赛车游戏那样只有三个电脑对手吧? COD3中对PS3的限制,我想和CELL的整数性能差有很大关系吧.

其实对于游戏机来说,最重要的还是开发效率. PS3的理念和XO截然相反,如果当初SONY的PS3选择的是K8或Conroe,哪怕就是三块.最少也可以提前一年出货,至少游戏厂商在开发上也会有很大的改善,决不会像现在这样为了平衡CELL搞的天昏地暗.

看看PS3首发的这些游戏,其实哪个不是CELL导致的结果?
作者: hourousha    时间: 2006-11-13 13:41
http://ps3.ign.com/articles/745/745439p1.html
PS3向下兼容的问题……
不是把EEGS都塞进去了么?按理说这都应该快脱离LLE(低阶模拟)的范畴了,怎么还会出这种问题?
作者: ayanamei    时间: 2006-11-13 13:42
原帖由 hourousha 于 2006-11-13 13:41 发表
http://ps3.ign.com/articles/745/745439p1.html
PS3向下兼容的问题……
不是把EEGS都塞进去了么?按理说这都应该快脱离LLE(低阶模拟)的范畴了,怎么还会出这种问题?

就是这么干了
作者: hdht    时间: 2006-11-13 13:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: hourousha    时间: 2006-11-13 13:54
原帖由 hdht 于 2006-11-13 13:49 发表
傻,ps2部分型号都有游戏兼容性问题,你以为兼容游戏就是塞个cpu+gpu就解决了么(_(

欢迎高人来详细讲解一下兼容PS2的难点,嗯,pcsx2是开源的所以您应该可以找到一些材料来说明您的观点。可惜啊,PC上没往里塞EE和GS,所以包含EEGS的情形,还得您自己发挥智力了~
作者: RacingPHT    时间: 2006-11-13 13:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: hdht    时间: 2006-11-13 13:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: hourousha    时间: 2006-11-13 14:00
原帖由 RacingPHT 于 2006-11-13 13:56 发表
我想知道去掉EEGS之后会怎样..

那就只能和m$一样玩HLE了(半H半L也可能),不过可以预计到,这下兼容列表的更新速度一定很惊人……
作者: jackpeng33    时间: 2006-11-13 14:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: potomac    时间: 2006-11-13 14:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: ayanamei    时间: 2006-11-13 14:07
原帖由 potomac 于 2006-11-13 14:03 发表

担心啥哦。

本来就是IBM负责,他自己的刀片也是跑得Linux,PS3也是。

除非IBM想停产他的刀片,否则必定全力以赴。:loveliness:

IBM在自己的刀片上Cell的 作用 基本上就当个协处理器
和在PS3上的作用不太一样
作者: jackpeng33    时间: 2006-11-13 14:19
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-11-13 14:21
关于在CELL上消除分支的方法:
http://www.cellperformance.com/a ... elimination_pa.html

其实上次我就问过你说的AI到底是指哪种?专家系统还是图形分析系统,如果是专家系统,Cell可能不如XCPU,如果是图形分析系统,Cell还是非常适合的,例如Influence Mapping,在现在的游戏中,Pathfinding是最消耗AI资源的,如果对若干个点作lines of sight侦测,传统的CPU都会消耗很多的资源。

在CELL上面如果要侦测A是否看到B,可以以A视点到B窗口的中心渲染一个低分辨的render target纹理,例如64X64,然后对同样的窗口用伪色渲染,这个用来侦测Window中B的“部分“是否暴露了,这就是电脑可视化计算了,SPE的强项,IBM当初的几个CELL实例文件中就有一个关于监控系统。这里的轮廓,也可以是阴影、烟雾、伪装等。

而且对大多数的游戏来说,AI是允许一定的延时,不需要在0.00X秒内马上作出反应。

H Peter Hofstee是这样回答我的:

- It is an easy misperception to think of an SPE as a SIMD(vector) only processor. IT IS NOT. Just because we have unified the register file does not mean you have to use SIMD. ( An x86 with SSE or a 970 with VMX is still perfectly ok to use for scalar code and so is the SPE). Compilers support scalar code just fine.

- This SPE implementation has only trivial hardware branch prediction (because large branch prediction structures do not provide a good return on investment in terms of area and power ... better to have more SPEs). Still we do care a lot about idle cycles due to branches, so there is a nice branch hint instruction (architecturally a no-op) that notifies the instruction fetch unit that at address x a branch will end up at address y. Also we support the select instruction that often allows one to eliminate a branch altogether.

- With respect to AI, I don't have the answers, but I have good hope. I think AI is usually not bound by computation but by memory access penalties (on high-frequency processors). I can imagine tree search algorithms for the SPEs that absolutely rock, by getting a lot of memory accesses in flight concurrently. There may be a patent out there by M. Necker and myself that describes some of this for the case of routing table accesses ( also a kind of tree search ).
作者: 地上的云    时间: 2006-11-13 19:04
小日本为什么要把开发难度弄那么复杂
作者: ibelieveicandie    时间: 2006-11-13 19:45
原帖由 Edison 于 2006-11-13 14:21 发表
关于在CELL上消除分支的方法:
http://www.cellperformance.com/a ... elimination_pa.html

其实上次我就问过你说的AI到底是指哪种?专家系统还是图形分析系统,如果是专家系统 ...


第一感觉是你说的很有道理。不过仔细一想觉得还是不对。用渲染来模拟碰撞检测的前提是所有场景相对需要做linecheck的物体渲染一遍。由于启动可见性探测的对象未必是主角,也肯定远远多于一个,这个渲染步骤是很难合并的。如此,计算开销将远大于普通的碰撞检测方法。而且渲染需要大量内存(frame buffer+z buffer),也不是内存有限的SPE能够负担的。所以这个技术运用在游戏里的实用程度只怕非常有限。
当然如果碰撞检测能够构造的比较好,用SPE来处理不是不可以。但是数据结构一定得设计的足够好,才能匹配SPE有限的local memory,可能还得放弃一定的通用性。
作者: Edison    时间: 2006-11-13 19:50
我想如果是多个的话,可以采用类似BOX的方式,一个粗糙的box代表一群NPC,0.5秒间隔渲染一次,消耗的内存资源应该不大。
作者: PS5    时间: 2006-11-13 19:51
原帖由 airforce18 于 2006-11-13 19:39 发表
再怎么挖掘也逃脱不了DX9   OP2.0的局限了


RSX的PS3.0有局限?
作者: ayanamei    时间: 2006-11-13 19:56
原帖由 PS5 于 2006-11-13 19:51 发表


RSX的PS3.0有局限?

有一些
不严重
基本上游戏机平台这个不成问题 全都是软件可以小心回避掉的问题
关键是现在放出来的游戏看 这些厂商实在是没把RSX用好
事实上RSX /C1基本还是同档次的
作者: PS5    时间: 2006-11-13 19:58
原帖由 ayanamei 于 2006-11-13 19:56 发表

有一些
不严重
基本上游戏机平台这个不成问题 全都是软件可以小心回避掉的问题
关键是现在放出来的游戏看 这些厂商实在是没把RSX用好
事实上RSX /C1基本还是同档次的


同档次就好,只要同档次,MS就死定了
作者: xreal    时间: 2006-11-13 20:01
:unsure: ps3可是代表linux出战的,对抗垄断的ms windows.w00t)
作者: ayanamei    时间: 2006-11-13 20:01
原帖由 PS5 于 2006-11-13 19:58 发表


同档次就好,只要同档次,MS就死定了

为什么不是同档次了
:wacko:  
作者: PS5    时间: 2006-11-13 20:02
原帖由 ayanamei 于 2006-11-13 20:01 发表

为什么不是同档次了
:wacko:  


因为多数人都说C1强于RSX
作者: ayanamei    时间: 2006-11-13 20:05
原帖由 PS5 于 2006-11-13 20:02 发表


因为多数人都说C1强于RSX

构架上强一些 差距不大
事实上c1在PS性能上还干不过R5XX
r5xx又能比G7x先进多少
所以这个差距还是很有限的
作者: PS5    时间: 2006-11-13 20:06
原帖由 ayanamei 于 2006-11-13 20:05 发表

构架上强一些 差距不大
事实上c1在PS性能上还干不过R5XX
r5xx又能比G7x先进多少
所以这个差距还是很有限的


c1肯定干不过具有48PS的R5XX啦!
作者: 1天    时间: 2006-11-13 20:08
原帖由 PS5 于 2006-11-13 20:06 发表


c1肯定干不过具有48PS的R5XX啦!

ayanamei指的是单位PS性能
作者: ayanamei    时间: 2006-11-13 20:08
原帖由 PS5 于 2006-11-13 20:06 发表


c1肯定干不过具有48PS的R5XX啦!

C1也是48shader 就算3bank全跑PS 也干不过R580..
作者: PS5    时间: 2006-11-13 20:09
原帖由 ayanamei 于 2006-11-13 20:08 发表

C1也是48shader 就算3bank全跑PS 也干不过R580..


C1是US,不可能全做PS,怎么可能干得过48固定PS的R5XX
作者: ibelieveicandie    时间: 2006-11-13 20:10
原帖由 Edison 于 2006-11-13 19:50 发表
我想如果是多个的话,可以采用类似BOX的方式,一个粗糙的box代表一群NPC,0.5秒间隔渲染一次,消耗的内存资源应该不大。


关键是没必要啊 #这种计算方式比普通的碰撞检测没有什么特别的优势。如果可以每隔0.5秒才去测一次碰撞的话,传统方式一样没有任何效率问题,何必要用这种暴力解法呢 #
另外消耗内存是和渲染分辨率相关的。如果想做全角度渲染的话,基本上4个渲染目标是至少的。哪怕只是渲染90度视锥,起码也得有300x200的分辨率才能基本保证检测的精确度吧。也许framebuffer 1byte/pixel就足够,但是z buffer最低也得有16bit精度,这样180K内存就去掉了。还有待渲染物体的几何模型也是必要的 #这样算下来local memory根本就不可能够。
作者: ayanamei    时间: 2006-11-13 20:15
原帖由 PS5 于 2006-11-13 20:09 发表


C1是US,不可能全做PS,怎么可能干得过48固定PS的R5XX

:funk: 我说就算全跑 也跑不过 #
:wacko:
算了 既然你一口咬定C1比RSX强很多。。
作者: ximimi    时间: 2006-11-13 22:40
原文很明白

图形系统用批量处理

搜索用树算法
作者: Ayanaomi    时间: 2006-11-13 23:01
rsx cant run hdr +aa :)
作者: popwangyuII    时间: 2006-11-14 08:51
原帖由 Edison 于 2006-11-13 14:21 发表
关于在CELL上消除分支的方法:
http://www.cellperformance.com/a ... elimination_pa.html

其实上次我就问过你说的AI到底是指哪种?专家系统还是图形分析系统,如果是专家系统 ...



:lol: 了解了。
作者: popwangyuII    时间: 2006-11-14 08:54
原帖由 ibelieveicandie 于 2006-11-13 20:10 发表


关键是没必要啊 #这种计算方式比普通的碰撞检测没有什么特别的优势。如果可以每隔0.5秒才去测一次碰撞的话,传统方式一样没有任何效率问题,何必要用这种暴力解法呢 #
另外消耗内存是和渲染分辨率相关 ...



这个期待SONY能给个解释
作者: Edison    时间: 2006-11-14 10:00
128x96应该也足够了,而且可以使用filtering。

这里有Intel的ocv:
http://www.intel.com/technology/computing/opencv/overview.htm

美军的Target Tracking Filter:
http://usl.sis.pitt.edu/wjj/otbsaf/libctdb.html

render target可以用GPU来渲染,然后SPE作分析。

[attach]644382[/attach]
[attach]644377[/attach]
[attach]644378[/attach]
作者: RacingPHT    时间: 2006-11-14 10:07
提示: 作者被禁止或删除 内容自动屏蔽
作者: ibelieveicandie    时间: 2006-11-14 10:18
原帖由 Edison 于 2006-11-14 10:00 发表
128x96应该也足够了,而且可以使用filtering。

这里有Intel的ocv:
http://www.intel.com/technology/computing/opencv/overview.htm

美军的Target Tracking Filter:
http://usl.sis.pitt.edu/wjj/otb ...


有趣的文档。回头研究一下。
oblivion这种游戏其实很特殊,基本上只需要判断敌人是否在主角视野内可见。基于rendering的可见性测试很直观。但如果需要判断每个NPC是否能看到其他的一样东西,从每个NPC的视角去渲染一遍场景就太没必要了。而且很多时候,需要判断自己和背后的物体之间是否有遮挡,这样就不能用单一的render target来解决。
用RSX作渲染然后把结果回传SPE也是可以的,但这样变成RSX承担绝大多数的运算工作。本来RSX就肯定比SPE要忙,还要再做更多的事 #如果内存问题能解决,单靠SPE应该就足够负担这种程度的运算。
作者: popwangyuII    时间: 2006-11-14 10:24
原帖由 ibelieveicandie 于 2006-11-14 10:18 发表


有趣的文档。回头研究一下。
oblivion这种游戏其实很特殊,基本上只需要判断敌人是否在主角视野内可见。基于rendering的可见性测试很直观。但如果需要判断每个NPC是否能看到其他的一样东西,从每个NPC的视 ...



我只是不明白,有必要搞得这么复杂吗?
作者: Edison    时间: 2006-11-14 11:13
这里的渲染方式其实是可以有很多种优化方式的,例如角色B或者A是必定位于中心的,这样如果只是为了知道是否A能看到B或者B能看到A的话,我们只渲染中央(20%?)的区域就足够了。
作者: SnowSun    时间: 2006-11-14 20:11
原帖由 RacingPHT 于 2006-11-13 11:50 发表


x86, PPU, SPU, VS, PS, VU, EE 一台机器有七种指令集在跑:wub: , 对了还有一堆MFC指令什么的...

这个也许是今后的发展方向,兼容所有的指令开发平台,习惯用什么平台开发的游戏厂商就使用什么平台和指令集来开发:wub: w00t)
作者: ayanamei    时间: 2006-11-14 20:39
原帖由 SnowSun 于 2006-11-14 20:11 发表

这个也许是今后的发展方向,兼容所有的指令开发平台,习惯用什么平台开发的游戏厂商就使用什么平台和指令集来开发:wub: w00t)

可惜每种指令都是不同的设备在使用 #你就准备抓狂吧
作者: 催化剂    时间: 2006-11-14 20:41
估计Sony PS3会死在Cell上面,就Sony那点软件人员,比较够呛




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4