POPPUR爱换

标题: Cell Computing Board的SIGGRAPH07參展詳情 [打印本页]

作者: Eji    时间: 2007-8-27 04:10
标题: Cell Computing Board的SIGGRAPH07參展詳情
http://journal.mycom.co.jp/artic ... ggraph08/index.html
西川善司的SIGGRAPH07專題,下篇的開頭是CELL computing Board。

雖然採用完全一樣的晶片組,但結構的部分有非常大的特色:
RSX完全沒有記憶體,以FlexIO和CELL形成UMA。

系統方塊圖:


而在會場的demo使用RSX輔助作合成的部分看來非常有效率。

比方說,過去CELL剛發表的時候toshiba做了一個48個SD解析度MPEG2影片合成到1080p畫面的demo,裡面使用到6個SPE來解碼、1個負責合成與縮放。

但是在RSX加速的狀況下,這回CELL跑了一千個SD解析度MPEG2影片解碼,由RSX合成到4096x2160解析度的畫面上。(然後RSX完全只讀寫XDR,沒有自己的GDDR3)

這次的demo最大的意義,或許是證明RSX存取XDR的能力是可以倚重的。

[ 本帖最后由 Eji 于 2007-8-27 04:12 编辑 ]
作者: 阿萨斯    时间: 2007-8-27 09:35
PS3硬件还没完全发挥吧:wacko:
作者: potomac    时间: 2007-8-27 09:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: RacingPHT    时间: 2007-8-27 09:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: Prescott    时间: 2007-8-27 13:05
一个Cell到了发布几年之后还在考虑怎么用的问题,说明设计的时候根本就没有考虑过这些问题,脱离软件环境闭门造车单纯追求理论性能的产物。这点上,MS要老道得多。

失败,真是太失败了。
作者: potomac    时间: 2007-8-27 13:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2007-8-27 13:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: Eji    时间: 2007-8-27 16:43
原帖由 RacingPHT 于 2007-8-27 09:41 发表
RSX存取XDR的性能是不错, 如果XDR够的话, PS3去掉GDDR3, 然后加宽XDR/FlexIO部分可能是更好的选择。


他們當初沒有時間做eDRAM,如果RSX有eDRAM的話,今天應該真的是只靠XDR、CELL+ RSX的UMA。
作者: 八泉苍月    时间: 2007-8-27 17:05
在此严重BS PS3的功耗....
作者: Prescott    时间: 2007-8-27 23:49
原帖由 potomac 于 2007-8-27 13:22 发表

老P就喜欢打击IBM。:p

CELL的产品周期和PC不一样。
在偶看来,PS3还是要赢过XO的。(不谈小日本问题,只说产品。)
PS3有些外设在逐步发布,比如电视录像等。(大概和APPLE TV类似功能吧。)

怎么会是打击IBM?Xbox360的处理器也是IBM产的啊。:unsure:
我明明是看不起Sony。

BTW: 不带Cache Cohorence的UMAw00t)  不过无所谓啦,反正Cell那几个SPE就够让程序员跳楼自杀了,再跳一次其实也无妨。

[ 本帖最后由 Prescott 于 2007-8-28 01:56 编辑 ]
作者: Edison    时间: 2007-8-28 03:18
CELL BE跑AI(语音识别):
http://researchweb.watson.ibm.com/journal/rd/515/liu.pdf
作者: Ricepig    时间: 2007-8-28 04:11
原帖由 Prescott 于 2007-8-27 13:05 发表
一个Cell到了发布几年之后还在考虑怎么用的问题,说明设计的时候根本就没有考虑过这些问题,脱离软件环境闭门造车单纯追求理论性能的产物。这点上,MS要老道得多。

失败,真是太失败了。


有Sony买单给IBM做实验有啥不好
作者: RacingPHT    时间: 2007-8-28 09:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: Prescott    时间: 2007-8-28 10:14
原帖由 Edison 于 2007-8-28 03:18 发表
CELL BE跑AI(语音识别):
http://researchweb.watson.ibm.com/journal/rd/515/liu.pdf

纠正一个常识性错误,模式识别基本上不能算作AI的范畴。
作者: Prescott    时间: 2007-8-28 10:17
原帖由 RacingPHT 于 2007-8-28 09:58 发表


嗯...这个月终于要被调进到跳楼圈里了, 45楼啊, :P
自己做做看究竟跳不跳楼吧。

回来写感想啊。:lol:
作者: Edison    时间: 2007-8-28 10:33
原帖由 Prescott 于 2007-8-28 10:14 发表

纠正一个常识性错误,模式识别基本上不能算作AI的范畴。


AI的类型不只是通用CPU才能跑得快的专家系统。

http://www.chinaann.cn/plus/list.php?tid=6

http://www.intel.com/technology/computing/opencv/
作者: Prescott    时间: 2007-8-28 10:40
原帖由 Edison 于 2007-8-28 10:33 发表


AI的类型不只是通用CPU才能跑得快的专家系统。

http://www.chinaann.cn/plus/list.php?tid=6

http://www.intel.com/technology/computing/opencv/

不想和你争这个啦,总之模式识别很难得算到AI里边,最多是联系比较紧密而已。你非要扯上模式识别然后说Cell很适合处理AI,那我也无话可说啦。:p

你也知道我说的AI是什么,所以,没必要玩文字游戏。

[ 本帖最后由 Prescott 于 2007-8-28 10:45 编辑 ]
作者: Edison    时间: 2007-8-28 10:45
反正在你看来只要是通用CPU的AI弱项当然就不算是AI了。
作者: 九泉苍月    时间: 2007-8-28 10:55
继续保持观望态度
Edision和Prescott的技术口水又开始了
作者: Prescott    时间: 2007-8-28 10:56
原帖由 Edison 于 2007-8-28 10:45 发表
反正在你看来只要是通用CPU的AI弱项当然就不算是AI了。

通用CPU的弱项?就算是Cell唯一能够拿出来说的单精度浮点理论值,一个Q6600也不比Cell低多少吧。除了这个之外,Q6600哪一个不是比Cell高出一大截?以Cell的效率,除了非常极端的能够把Cell单精度发挥到极致的极少数代码之外,Cell已经远不是现在的Q6600的对手了。

认清楚形式吧,Cell这种东西没有前途的,等到它退出市场的时候,各位大佬在接受采访的时候大概还是只能假装客气地说:Cell真是潜力无限啊,我等才疏学浅,实在没有办法发挥Cell的全部实力。:lol:

[ 本帖最后由 Prescott 于 2007-8-28 10:58 编辑 ]
作者: Edison    时间: 2007-8-28 11:11
8 SPU@3.2GHz的peak FP32 FLOPS是204+GFLOPS,Q6600的peak FP32 FLOPS是68.54GFLOPS,1/3 CELL的水平就是你说的低不了多少,再来个Double才能说低不了多少吧。

在我看来类似定位的Intel Larrabee还是是沿用Tera Chip的架构,这样的架构没有前途Intel弄来干啥,在这几年的IDF和其他场合Intel都大力宣传special function unit相对通用单元的能耗/性能、发展前景你也不会不知道的。

4-way的super scalar架构才是永远不可能实现4-way execution的架构,连1-way都未必能在所有的程序中实现呢。
作者: Prescott    时间: 2007-8-28 11:31
Q6600的单精度浮点68.54不知道你怎么算出来的。:funk:

Larrabee这个东西,在搞清楚这个项目的来龙去脉之前还是不要妄下结论的好,我可从来没说过它的什么好话,也没有拿他和Cell对比过。不多说了,总之,当你以为看到Larrabee的时候,其实也不见得就是。:lol:

至于处理器效率的问题吗,哈哈,你也知道4-issue其实到最后IPC低于1是很正常的事情啊,那我告诉你,那个in-order的PPE跑同样的代码IPC能到0.1就谢天谢地了。忍不住进来再修改一下:0.1大概都是大大的高估了。:a)

[ 本帖最后由 Prescott 于 2007-8-28 11:37 编辑 ]
作者: 九泉苍月    时间: 2007-8-28 11:35
原帖由 <i>Prescott</i> 于 2007-8-28 11:31 发表 <a href="http://we.pcinlife.com/redirect.php?goto=findpost&pid=15269876&ptid=814039" target="_blank"><img src="http://we.pcinlife.com/images/common/back.gif" border="0" onload="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new windownCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new windownCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://we.pcinlife.com/images/common/back.gif');}" onmousewheel="return imgzoom(this);" alt="" /></a><br />
Q6600的单精度浮点68.54不知道你怎么算出来的。<img src="images/smilies/funk.gif" smilieid="61" border="0" alt="" /> <br />
<br />
Larrabee这个东西,在搞清楚这个项目的来龙去脉之前还是不要妄下结论的好,我可从来没说过它的什么好话,也没有拿他和Cell对比过。不多说了,总之,当 ...
<br />
PPE还是PPU?ms一样的意思?:unsure:
作者: Prescott    时间: 2007-8-28 11:38
原帖由 九泉苍月 于 2007-8-28 11:35 发表

PPE还是PPU?ms一样的意思?:unsure:

PPE :a) 两个是不一样的东西
作者: Edison    时间: 2007-8-28 12:52
68.54是笔误,应该是76.8GFLOPS,不过这并不影响否定你说的Q6600和CELL在单精度上相差不多的说法。

我一直以来的观点都是Cell在运行不少代码的时候比同质多内核会慢,但是也有不少代码能比这类内核快得多。

在Cell的架构中PPU是指PPE的执行单元或者说PPU 不包括L1/L2 cache/BIU的部分。
作者: RacingPHT    时间: 2007-8-28 14:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-8-28 14:31
MUL+ADD也不是没有问题的亚,在跑MAD的时候精度就可能会有问题。
作者: potomac    时间: 2007-8-28 14:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-8-28 14:34
我觉得讨论的主要是CELL是否代表了未来的发展方向,或者至少是未来的一个重要发展方向,这方面Fusion、Power7、Larabee都是代表。
作者: hdfeel    时间: 2007-8-28 17:03
发展方向看上去是表面上, cell 介于 cpu 和 gpu 之间, 和 gpu 比图形处理效率差远了, 和 cpu 比通用处理效率 也差远了。 用cell的cpu 特性 和 gpu 的通用处理能力比, cell 会强很多。   用 cell的 gpu 特性 和 cpu的 图形处理能力比, cell 也会强一些。  

可是这样并不代表cell 很强。  也违背了软件和硬件的发展方向。   将来的cpu 发展方向还是 对称多核。 用几十个相同的通用小核心来组成 一个cpu。 而不会像cell 这样的结构。  

个人认为,未来满足 低端用户的需求, 把cpu 和 gpu 集成在一起, 是必然出现的。普通 办公电脑 不需要很强的机能。 不过 cpu 和 gpu 组合 也不会是 cell 这种结构。
作者: hdfeel    时间: 2007-8-28 17:09
将来的技术发展难题应该是,怎么样协调和调用好 几十个相同小核心组成的cpu。 个人认为这种技术的发展会导致,电脑智力的产生。




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4