POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Prescott
打印 上一主题 下一主题

Linux下Cell 3.2G vs. PPC G5 1.6G对比测试出炉

[复制链接]
61#
发表于 2006-11-23 15:00 | 只看该作者
原帖由 HardCoded 于 2006-11-23 14:53 发表
:loveliness: 玩笑了玩笑了,你这里的整数性能应该是指纯数学运算加减乘除的性能吧?这个真的就没意义了.

SPE的整数操作除了你说的算术指令外,还有字符串操作、分支操作等其他所有处理器都具备的整数指令能力。
回复 支持 反对

使用道具 举报

62#
发表于 2006-11-23 15:03 | 只看该作者
原帖由 Edison 于 2006-11-23 15:00 发表

SPE的整数操作除了你说的算术指令外,还有字符串操作、分支操作等其他所有处理器都具备的整数指令能力。


每个SPE单独算,然后乘8??
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
63#
发表于 2006-11-23 15:05 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

64#
发表于 2006-11-23 15:07 | 只看该作者
原帖由 HardCoded 于 2006-11-23 15:03 发表


每个SPE单独算,然后乘8??

理论值么,其他对比的CPU一样也是简单的加乘得到的,看看就好。
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
65#
发表于 2006-11-23 15:07 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

66#
发表于 2006-11-23 15:07 | 只看该作者
原帖由 HardCoded 于 2006-11-23 15:03 发表
每个SPE单独算,然后乘8??

物理、AI、音频都是有大量可以并行化处理的地方,是可以达到很高的并行度的。
回复 支持 反对

使用道具 举报

67#
发表于 2006-11-23 15:12 | 只看该作者
原帖由 RacingPHT 于 2006-11-23 15:07 发表
Cell是在图像类应用中现在是没有对手的。
但是作为游戏机的主CPU, 我觉得Cho有些神化Cell了。PS3的内存分级太多, 异构处理器也太多, 想起来就很麻烦。
题外话, PC只需要一个Pentium3 + G80就可以获得数百G fl ...

我想我没有神话Cell,上述的发言,更多的是看到一些只是抓住Cell的某几个可以克服的弱点就几乎完全把Cell否定的说法。

G80跑整数操作可能比较呛,CUDA公布后就可以大致了解了。
回复 支持 反对

使用道具 举报

68#
发表于 2006-11-23 15:16 | 只看该作者
原帖由 Prescott 于 2006-11-23 14:41 发表

非常正确,要纯浮点性能是最简单的事情,显卡和ClearSpeed就是典型的例子。如果需要,Conroe再加浮点单元就是,或者SIMD再作长点,搞个512bit的寄存器,这种事情又不是没人做过,有什么意思?

问题是这种浮 ...



呵呵,就是嘛.

软件本来就是个复杂的东西, 我真的很难想象CELL程序员疲与应付各种CELL处理单元会是个什么状态.

抛开所谓的理论性能不谈,其实CELL本身就是违背软件大环境的东西,如果硬件不能为开发者提供简单易行的环境,其带来的问题:bug数量,软件工期,开发成本......足以杀死任何一个优秀的软件团队.
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
69#
发表于 2006-11-23 15:21 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
70#
发表于 2006-11-23 15:22 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

xiaxiaf 该用户已被删除
71#
发表于 2006-11-23 15:22 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

72#
发表于 2006-11-23 15:24 | 只看该作者
最简单的方式就是用CPU完成所有的游戏处理,3D图形渲染、音频处理、游戏逻辑、物理计算,这样游戏开发人员只需要掌握一个ISA即可,准备一格画面等半天吧。
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
73#
发表于 2006-11-23 15:25 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

74#
 楼主| 发表于 2006-11-23 15:25 | 只看该作者
和一个非程序员讨论程序编写的难度是一件没有意义的事情。
回复 支持 反对

使用道具 举报

75#
发表于 2006-11-23 15:26 | 只看该作者
原帖由 Edison 于 2006-11-23 14:57 发表
这还不容易,拿类似3DMARK06那样的CPU test场景跑跑看就知道了,你可以去看看PD 945和K8 2GHz的3DMAR06 CPU Mark差距是多少。

使用SPE来做物理、AI、音频、加密/解密处理,要比分离的多片PPU、AISeek、声卡、 ...



呵呵,3DMARK06那样的CPU test场景??我怀疑那个测试项目是纯粹为了提高多核心CPU成绩而写的.和你所说的"基于图象分析的AI"应该完全是两回事.

那个CPU test大概就是: 一个bot一个线程,以一块共享的内存数据作为地图,n个bot都会单独地进行碰撞检测运算.所以才会导致那个场景运行如此之慢.
回复 支持 反对

使用道具 举报

76#
发表于 2006-11-23 15:27 | 只看该作者
80%的预测率所有CPU都可以死掉了,幸好CELL还有XDR,不知道Conroe会如何。
回复 支持 反对

使用道具 举报

77#
 楼主| 发表于 2006-11-23 15:29 | 只看该作者
原帖由 Edison 于 2006-11-23 15:27 发表
80%的预测率所有CPU都可以死掉了,幸好CELL还有XDR,不知道Conroe会如何。

是啊,不知道SPE是怎么读到XDR里边的数据的。麻烦Edson大大给大家描绘一下。

至于分支预测的成功率,如果Cornoe能做到99%,不知道PPE有没有80%,这个测试中Emulate 就是典型的分支多的例子了。看看差距吧。

[ 本帖最后由 Prescott 于 2006-11-23 15:31 编辑 ]
回复 支持 反对

使用道具 举报

78#
发表于 2006-11-23 15:47 | 只看该作者
原帖由 potomac 于 2006-11-23 15:21 发表

说的很有道理。

麻烦解释下Xenon中PPU和CELL中PPE的差别。:huh:


http://game.pchome.net/00/05/24/30/?292,,
回复 支持 反对

使用道具 举报

79#
发表于 2006-11-23 15:58 | 只看该作者
原帖由 Edison 于 2006-11-23 14:27 发表
从一开始大家都知道SPE是不具备动态分支预测的吧,但是同时也都应该知道SPE是具备128个寄存器以及能够从分支目标开始预取32条指令的branch hint能力。

你这里的branch hint是依靠软件来提供静态指示, 又不是能够 同时取分支的两个方向。 取错了,一样是损失很大。
而且, 即使对了也有几个周期的延迟。
回复 支持 反对

使用道具 举报

80#
发表于 2006-11-23 15:59 | 只看该作者
SPE对XDR的存储大家都知道是DMA方式,在流式应用中,DMA方式相当好。

CELL的PPE和XCPU的PPE都是一样的动态分支预测机制,在运行这个测试的时候,XCPU的PPE在这里的仿真器性能表现也是和CELL一样的。

PPE就是一个2 issue、in-order的设计,你给它搭配强大的动态分支预测能力不浪费吗?当年类似架构的Pentium才75%的预测率呢。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-4-17 03:42

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表