POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Prescott
打印 上一主题 下一主题

Linux下Cell 3.2G vs. PPC G5 1.6G对比测试出炉

[复制链接]
potomac 该用户已被删除
21#
发表于 2006-11-23 13:19 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

22#
发表于 2006-11-23 13:23 | 只看该作者
yellow dog出来也不代表什么,我认为要体现CELL的应用特点,必须用EEMBC的Telemark测试才有意义。
回复 支持 反对

使用道具 举报

23#
 楼主| 发表于 2006-11-23 13:26 | 只看该作者
原帖由 Edison 于 2006-11-23 13:16 发表

你要忽略VMX、PPE的话,为什么不把SSE也忽略掉呢?

区别在于,VMX并不能帮到PPE,PPC中浮点指令已经相当的强悍。而X87太弱,SSE3在浮点性能方面提升巨大。

SPE如果你能用起来,我也不反对拿出来测试阿。我倒是要看看Linux也有了,所谓的开发环境也有了,到底第一款用到SPE的软件什么时候出来。

转这个测试只是用来证明我的预言,Cell整数性能极弱,无法应对主流游戏的高要求。想象一下,一颗比C4还要差一截的主处理器,无论显卡多好,玩游戏是什么感觉。Cell最合适的用途是在蓝光播放机里做解码器,可惜功耗又太高了些。Sony这次绝对要输给MS,光开发的难易程度,两者根本不可同日而语,必然造成游戏资源上的差异。3个PPC核心,无论如何要比一个PPE加7个SPE好用的多得多,真实游戏性能上也决不差于Cell。

[ 本帖最后由 Prescott 于 2006-11-23 13:32 编辑 ]
回复 支持 反对

使用道具 举报

24#
 楼主| 发表于 2006-11-23 13:33 | 只看该作者
原帖由 Edison 于 2006-11-23 13:23 发表
yellow dog出来也不代表什么,我认为要体现CELL的应用特点,必须用EEMBC的Telemark测试才有意义。

呵呵,EEMBC的telemark又怎么样,Cell照样垫底,不要忘了,EEMBC不许修改源代码的。SPE还是用不上。哈哈
回复 支持 反对

使用道具 举报

25#
发表于 2006-11-23 13:37 | 只看该作者
PPE 是 2-issue,FPU+VMX可以做到12 FLOPS per cycle,P4的两个SSE单元都挂在同一个issue port上,无论怎么撑都是有架构上的缺陷。

这个测试丝毫不能怎么你所谓的CELL整数性能极弱的观点,顶多只能说明CELL其中1/8的PPE如此,试问这里的那个测试是不能改写成适 合 于 SPE跑的?
回复 支持 反对

使用道具 举报

26#
发表于 2006-11-23 13:41 | 只看该作者
原帖由 Prescott 于 2006-11-23 13:33 发表
呵呵,EEMBC的telemark又怎么样,Cell照样垫底,不要忘了,EEMBC不许修改源代码的。SPE还是用不上。哈哈


谁告诉你EEMBC不能修改代码的,你当是SEPC CPU?
单个SPE@3.2GHz的telemark是770,你看看需要多少个Conroe凑一个晶体管数量相当的Cell吧。
回复 支持 反对

使用道具 举报

27#
 楼主| 发表于 2006-11-23 13:42 | 只看该作者
原帖由 Edison 于 2006-11-23 13:37 发表
PPE 是 2-issue,FPU+VMX可以做到12 FLOPS per cycle,P4的两个SSE单元都挂在同一个issue port上,无论怎么撑都是有架构上的缺陷。

这个测试丝毫不能怎么你所谓的CELL整数性能极弱的观点,顶多只能说明CELL其 ...

那你去改写吧 :lol:

指望SPE提供额外的非多媒体整数能力那完全是在痴人说梦。
回复 支持 反对

使用道具 举报

28#
发表于 2006-11-23 13:46 | 只看该作者
SPE本身就具备native的INT16/INT32整数指令执行能力,说SPE不具备整数指令并且把AI看作只能在PPE上跑本身就是错误的。
回复 支持 反对

使用道具 举报

29#
发表于 2006-11-23 13:57 | 只看该作者
呵呵,说到底CELL就是个专用处理器嘛
回复 支持 反对

使用道具 举报

30#
发表于 2006-11-23 14:00 | 只看该作者
原帖由 HardCoded 于 2006-11-23 13:57 发表
呵呵,说到底CELL就是个专用处理器嘛

在娱乐平台上难道用通吃型的好吗?
回复 支持 反对

使用道具 举报

31#
发表于 2006-11-23 14:00 | 只看该作者
原帖由 Edison 于 2006-11-23 13:46 发表
SPE本身就具备native的INT16/INT32整数指令执行能力,说SPE不具备整数指令并且把AI看作只能在PPE上跑本身就是错误的。

SPE说不定连像样的动态分支预测都没有!
回复 支持 反对

使用道具 举报

32#
发表于 2006-11-23 14:01 | 只看该作者
原帖由 hopetoknow2 于 2006-11-23 14:00 发表

SPE说不定连像样的动态分支预测都没有!



:lol: 哪来的啊
回复 支持 反对

使用道具 举报

33#
发表于 2006-11-23 14:03 | 只看该作者
原帖由 FENG950 于 2006-11-23 14:00 发表

在娱乐平台上难道用通吃型的好吗?



呵呵,Conroe怎么样?效能比CELL好,价格比CELL便宜,货源充足.
回复 支持 反对

使用道具 举报

34#
发表于 2006-11-23 14:04 | 只看该作者
原帖由 Edison 于 2006-11-23 13:37 发表
PPE 是 2-issue,FPU+VMX可以做到12 FLOPS per cycle

VMX是128bit寄存器, 一MAC指令充其量4个FLOPX2, 2-issue如何12 FLOPS的?

PPE的通用性能就是不行
回复 支持 反对

使用道具 举报

35#
发表于 2006-11-23 14:06 | 只看该作者
似乎这回脸丢大了~~~
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
36#
发表于 2006-11-23 14:09 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

37#
发表于 2006-11-23 14:10 | 只看该作者
原帖由 HardCoded 于 2006-11-23 14:03 发表



呵呵,Conroe怎么样?效能比CELL好,价格比CELL便宜,货源充足.

你从哪方面可以认为Conroe比Cell样样好?比多媒体应用?或是多线程应用?

[ 本帖最后由 FENG950 于 2006-11-23 14:14 编辑 ]
回复 支持 反对

使用道具 举报

38#
发表于 2006-11-23 14:15 | 只看该作者
原帖由 hopetoknow2 于 2006-11-23 14:04 发表
VMX是128bit寄存器, 一MAC指令充其量4个FLOPX2, 2-issue如何12 FLOPS的?
PPE的通用性能就是不行

PPE的FPU在执行单精度算法的时候,可以做到2D FMA,加上4D的VMX FMA,就是12 FLOPS。

NGC时代的Geeko FPU设计和PPE的FPU是类似的,RTW的David T. Wang对此当初也是迷惑不解。
回复 支持 反对

使用道具 举报

39#
发表于 2006-11-23 14:19 | 只看该作者
原帖由 FENG950 于 2006-11-23 14:10 发表

你从哪方面可以认为Conroe比Cell好?比多媒体应用?或是多线程应用?



:lol: 呵呵,不排除CELL那种古怪架构在某方面大翻身的可能.

但就指令性能来讲,Conroe可以把他扔出地球.
回复 支持 反对

使用道具 举报

40#
发表于 2006-11-23 14:21 | 只看该作者
原帖由 Edison 于 2006-11-23 14:15 发表

PPE的FPU在执行单精度算法的时候,可以做到2D FMA,加上4D的VMX FMA,就是12 FLOPS。

个人的观点:
SPE根本就算不上具有分支预测能力,基本是靠软件静态指定的。只是填入BTB。 至于预测功能,搞不好是静态的,单纯的Not Taken或Taken。

而且就算预测对了,也是有3个周期的延迟。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-4-17 03:42

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表