POPPUR爱换

标题: IBM将在GDC上对PS3 CELL进行技术演示!(CELL独自演算300W多边形的城市) [打印本页]

作者: codxk    时间: 2007-3-8 23:26
标题: IBM将在GDC上对PS3 CELL进行技术演示!(CELL独自演算300W多边形的城市)
http://gametomorrow.com/blog/ind ... -power-at-gdc-2007/

This week at Game Developers Conference IBM will show a Linux based PS3 real-time rendering a complex (3 million triangle) urban landscape, at 1080p resolution, using only software rendering techniques (iRT).

Even though the PS3’s RSX is inaccessible under Linux the smart little system will reach out across the network and leverage multiple IBM QS20 blades to render the complex model, in real-time, with software based ray-tracing. Using IBM’s scalable iRT rendering technology, the PS3 is able to decompose each frame into manageable work regions and dynamically distribute them to blades or other PS3s for rendering. These regions are then further decomposed into sub-regions by the blade’s Cell processors and dynamically dispatched to the heavy lifting SPEs for rendering and image compression. Finished encoded regions are then sent back to the PS3 for Cell accelerated decompression, compositing, and display.


Here is a resolution reduced (30MB) Quicktime movie of the demo.
<!--[if !supportLineBreakNewLine]-->
<!--[endif]-->

Myself, Mark Nutter, and Joaquin Madruga will be on hand in the IBM booth to run the demonstration so stop by, introduce yourself, and swap some Cell programming stories. Even though much has been made in the press about how difficult the Cell processors is to program, our team of three started with a couple white papers and in only three months created this renderer, the 3dsMax to BVH tree output tool chain, the display client, and the blade distribution framework using only the tools provided in the Cell SDK. Actually we spent as much time trying to figure out how to preserve our 3dsMax models during export and create a good BVH tree as we did writing the Cell code.




本周在游戏开发者论坛上IBM将展示一个LINUX基于PS3实时绘制一个复杂的城市景观(3000000多边形), 使用1080P协议,只使用软件描绘报文交换集中技术

PS3 在LINUX下,RSX不用,用CELL软RENDERING

1080p,300万TRIANGLE



CELL的潜力渐渐明朗!!
作者: 请问你凭啥    时间: 2007-3-8 23:35
提示: 作者被禁止或删除 内容自动屏蔽
作者: iiiiuuuu    时间: 2007-3-8 23:36
怪不得当年sony没有一开始就把RSX加到ps3上,只是后来匆匆加上去的。原来是这样啊w00t)
作者: graphiccard    时间: 2007-3-8 23:39
INTEL的80cores一出
CELL也不算什么鸟
作者: iiiiuuuu    时间: 2007-3-8 23:52
http://www.gametomorrow.com/minor/barry/city_iRT.mov
作者: potomac    时间: 2007-3-9 00:13
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-3-9 00:32
一个3M三角形的场景对G80等级的GPU来说是小菜一碟。
作者: 来不及思考    时间: 2007-3-9 00:38
提示: 作者被禁止或删除 内容自动屏蔽
作者: aeondxf    时间: 2007-3-9 00:42
:huh: 某人说,如果PS3像当初那样纯CELL的话,开发难度会比现在低,但性能未必比现在好。
作者: Edison    时间: 2007-3-9 00:46
开发难度不见得会降低,但是性能上的表现会如何倒是很有趣的事情,例如CELL版RSX采用了CELL+3D eDRAM的设计的话,性能应该是蛮值得期待的^^/
作者: aeondxf    时间: 2007-3-9 00:52
当时他说的前提是两块CELL,而且不是那种将一半SPE换成PS ENGINE改造过的半CELL:wacko: ……
作者: Edison    时间: 2007-3-9 00:54
我说的当然不是pixelshaderizon的Cell。
作者: aeondxf    时间: 2007-3-9 01:02
:lol: 纯软件……太和谐了~
作者: codxk    时间: 2007-3-9 08:45
原帖由 aeondxf 于 2007-3-9 00:52 发表
当时他说的前提是两块CELL,而且不是那种将一半SPE换成PS ENGINE改造过的半CELL:wacko: ……



什么意思?     难道这个场景  不是由PS3的CPU-CELL   独占演算的吗?
作者: PS5    时间: 2007-3-9 09:20
原帖由 Edison 于 2007-3-9 00:32 发表
一个3M三角形的场景对G80等级的GPU来说是小菜一碟。


对RSX也是小菜一碟吗?:blink:
作者: codxk    时间: 2007-3-9 09:23
原帖由 PS5 于 2007-3-9 09:20 发表


对RSX也是小菜一碟吗?:blink:



3M的三角形对RSX来说 的确是小菜一碟

[ 本帖最后由 codxk 于 2007-3-9 10:20 编辑 ]
作者: colo    时间: 2007-3-9 09:29
貌似连PS2都远远不如:funk: ,sony不是号称PS3性能是前代的1000倍么?w00t)
  
"Emotion Engine"基本数据:
  CPU核心:128位RISC
  时钟频率:300MHZ
  整数演算器:64位(2通道)
  多媒体扩张指令:128位X107个
  GPR(整数寄存器):128位X32个
  TLB:48 DOUBLE ENTRY
  命令高速缓存:16KB(两片)
  数据高速缓存:8KB(两片)
  高速暂态存储器:16KB(双口)
  主内存:32MB(RDRAM x 2)
  内存总线带宽:3.2GB/秒
  DMA:10通道
  协处理器1:FPU(FMAC x 1、FDIV x 1)
  协处理器2:VU0(FMAC x 4、FDIV x 1)
  MICRO命令专用内存:(L:16KB/D:16KB)
  浮点运算性能:6.2GFLOPS
  坐标变换+透视变换:6600万个多边形/秒
  +光源计算:3800万个多边形/秒
  +雾化效果:3600万个多边形/秒
  +曲面生成:1600万个多边形/秒
  IPU:MPEG2 MACRO BLOCK LAYER DECODE
  画像处理速度:15000万PIX/秒
  制造工艺:0.18微米
  核心电压:1.8V
  功率:15W


  协处理器1:FPU(FMAC x 1、FDIV x 1)
  协处理器2:VU0(FMAC x 4、FDIV x 1)
  MICRO命令专用内存:(L:16KB/D:16KB)
  浮点运算性能:6.2GFLOPS
  坐标变换+透视变换:6600万个多边形/秒
  坐标变换+透视变换:6600万个多边形/秒
  +光源计算:3800万个多边形/秒
  +雾化效果:3600万个多边形/秒
  +曲面生成:1600万个多边形/秒
作者: codxk    时间: 2007-3-9 10:56
原帖由 colo 于 2007-3-9 09:29 发表
貌似连PS2都远远不如:funk: ,sony不是号称PS3性能是前代的1000倍么?w00t)
  
"Emotion Engine"基本数据:
  CPU核心:128位RISC
  时钟频率:300MHZ
  整数演算器:64位(2通道)
   ...






:( :( :( :( :(
作者: potomac    时间: 2007-3-9 13:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: RacingPHT    时间: 2007-3-9 13:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: shike_cuke    时间: 2007-3-9 15:22
看来PS3是个好东西哦....................
作者: RacingPHT    时间: 2007-3-9 15:29
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-3-9 15:46
原文的第一句话不就说了是一台Linux PS3渲染的吗?接下来的那段内容只是说PS3还能作为一个渲染控制中枢,把frame拆解若干个block给Cell blade来完成。

RSX的GFLOPS含金量应该比Cell低不少才是,所以我觉得CELL+3D eDRAM的CELL GPU版是相当有意思的组合。
作者: codxk    时间: 2007-3-9 15:55
原帖由 Edison 于 2007-3-9 15:46 发表
原文的第一句话不就说了是一台Linux PS3渲染的吗?接下来的那段内容只是说PS3还能作为一个渲染控制中枢,把frame拆解若干个block给Cell blade来完成。

RSX的GFLOPS含金量应该比Cell低不少才是,所以我觉得CE ...




有不止一个人 认为 PS3-CELL只是起到了视频解压的功能(_(
作者: RacingPHT    时间: 2007-3-9 16:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: 神的马甲    时间: 2007-3-9 16:31
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-3-9 16:33
原帖由 RacingPHT 于 2007-3-9 16:22 发表
什么地方说到是1台PS3渲染的?


IBM will show a Linux based PS3 real-time rendering a complex (3 million triangle) urban landscape, at 1080p resolution, using only software rendering techniques (iRT).
作者: RacingPHT    时间: 2007-3-9 16:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-3-9 17:18
ray tracing的特点之一是可以剔除掉大量的不可见多边形,从这个场景来看,应该是存在着大量的不可见多边形,因此3M多边形的场景在渲染的时候,可能也就是1/10不到是需要作实时渲染的。其实在mhouston的I3D2007论文中已经可以看到Robot场景是11万三角形,conference room是28.2万三角形,但是实际渲染的时候(采用RX1900XTX),conference room的FPS并不亚于Robot场景,甚至在packet后速度更快一些。

之前IBM的那辆车子有1.8百万多边形,渲染的时候整辆车子位于一个viewport内,假设至少有1/3的多边形是必须渲染的,那就是每frame 60万多边形,1080p下,一台2Cell的Cell blade可以达到10fps,相当于每个Cell完成了5fps。
作者: potomac    时间: 2007-3-9 17:38
提示: 作者被禁止或删除 内容自动屏蔽
作者: codxk    时间: 2007-3-9 17:44
原帖由 potomac 于 2007-3-9 17:38 发表
还有个问题需要考虑。

那辆车Raytrace完全说得过去。
而这个场景除了玻璃,绝大多数不需要做Raytrace。
并且玻璃都是平面的。

如果IBM希望,这个场景,单台PS3完全是可能跑的了的。



你说的是不用RSX的情况下吗?
作者: RacingPHT    时间: 2007-3-9 17:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: potomac    时间: 2007-3-9 18:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: lptt3    时间: 2007-3-9 18:07
标题党........
作者: aeondxf    时间: 2007-3-9 19:43
原帖由 colo 于 2007-3-9 09:29 发表
貌似连PS2都远远不如:funk: ,sony不是号称PS3性能是前代的1000倍么?w00t)
  
"Emotion Engine"基本数据:
  CPU核心:128位RISC
  时钟频率:300MHZ
  整数演算器:64位(2通道)
   ...

MIPS III+几条MIPS IV的指令,然后DOUBLE WORD,再然后宣扬PS2是128BIT……太囧了……
作者: codxk    时间: 2007-3-9 21:30
原帖由 Edison 于 2007-3-9 17:18 发表
ray tracing的特点之一是可以剔除掉大量的不可见多边形,从这个场景来看,应该是存在着大量的不可见多边形,因此3M多边形的场景在渲染的时候,可能也就是1/10不到是需要作实时渲染的。其实在mhouston的I3D2007论 ...





你的意思    PS3的CELL 完成这些没有问题?
作者: PS5    时间: 2007-3-9 22:12
原帖由 codxk 于 2007-3-9 21:30 发表





你的意思    PS3的CELL 完成这些没有问题?



肯定没G80完成的好:loveliness:
作者: potomac    时间: 2007-3-9 22:27
提示: 作者被禁止或删除 内容自动屏蔽
作者: HardCoded    时间: 2007-3-10 09:13
3M/s,可以和9550比比了。
作者: Eji    时间: 2007-3-10 12:49
原帖由 potomac 于 2007-3-9 22:27 发表

如果CELL有7亿个晶体管,
G80就可以改名叫G0.8了。:loveliness:


等到G9x要用1G晶體管的時候,去和 32SPE CELL比比看好像也蠻有趣的。

----
實話是,這篇應該還是在講PS3 Cell + QS20 Cell-Blade的合作成果。
這篇應該是在講 iRT本身的scalable能力,只要SPE的數量夠多,即使是透過LAN連接,也是可以達到良好的延展性。
所以你可以用Cell-blade,也可以用一堆PS3連在一起;不然應該有不少人預期它會stall在某些地方....

其次,今天 iRT 是刻意使用SW rendering,如果一開始就把GPU的使用考慮進去,應該會出現更多可怕的成果。
比方說Real time的Radiosity。現在PS3就已經做得到合作的Ambient Occlusion了。

而且基本上我是已經覺得這相當驚人了:它的連結看起來是幾乎完全線性成長的。
也就是說我的確可以透過更多Cell(包含網路上的),幫GPU做掉不少工作,只剩下Rasterizer相關的簡易、適合GPU、可高速化的工作。

[ 本帖最后由 Eji 于 2007-3-10 13:02 编辑 ]
作者: RacingPHT    时间: 2007-3-10 14:44
提示: 作者被禁止或删除 内容自动屏蔽
作者: R620    时间: 2007-3-10 14:50
原帖由 Eji 于 2007-3-10 12:49 发表


等到G9x要用1G晶體管的時候,去和 32SPE CELL比比看好像也蠻有趣的。

----
實話是,這篇應該還是在講PS3 Cell + QS20 Cell-Blade的合作成果。
這篇應該是在講 iRT本身的scalable能力,只要SPE的數量夠 ...


32SPE 全部换成SHADER出显卡,NV也就可以倒闭了:lol:

[ 本帖最后由 R620 于 2007-3-10 15:06 编辑 ]
作者: RacingPHT    时间: 2007-3-10 15:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: R620    时间: 2007-3-10 15:14
原帖由 PS5 于 2007-3-9 22:12 发表



肯定没G80完成的好:loveliness:


不需要G80,RSX完成得都比Cell好
作者: G81    时间: 2007-3-10 17:17
原帖由 Eji 于 2007-3-10 12:49 发表


等到G9x要用1G晶體管的時候


65nm技术能做到1G的晶体管么?
作者: RacingPHT    时间: 2007-3-10 19:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: aeondxf    时间: 2007-3-12 18:35
原帖由 Edison 于 2007-3-9 00:46 发表
开发难度不见得会降低,但是性能上的表现会如何倒是很有趣的事情,例如CELL版RSX采用了CELL+3D eDRAM的设计的话,性能应该是蛮值得期待的^^/

请教下,EDRAM现在的频率可以上多少?频率太低的话会不会由于延迟原因让CELL版RSX提前完蛋:o ?
作者: colo    时间: 2007-3-12 21:06
原帖由 HardCoded 于 2007-3-10 09:13 发表
3M/s,可以和9550比比了。


每秒1桢的幻灯片?w00t)
作者: hdfeel    时间: 2007-3-13 07:03
原帖由 R620 于 2007-3-10 14:50 发表


32SPE 全部换成SHADER出显卡,NV也就可以倒闭了:lol:



ibm 以前测试过,cell在4个spe后性能就上不去了,可是32个spe的性能加起来 也只有 1个spe的150%,可能因为ppe性能太弱和环形总线冲突和延迟太多的缘故,cell加了32个spe,全部开启的话,性能反而连一个486都不如。  cell其实是 ibm来宰sony的产品。虽然吹起来很美,实际上有无法解决的硬件冲突和硬件缺陷。 所有的宣传无非就是为了更好的宰sony罢了。
作者: littlebird    时间: 2007-3-13 12:38
原帖由 hdfeel 于 2007-3-13 07:03 发表



ibm 以前测试过,cell在4个spe后性能就上不去了,可是32个spe的性能加起来 也只有 1个spe的150%,可能因为ppe性能太弱和环形总线冲突和延迟太多的 ...

那为啥ps3的spe有8个之多?
作者: potomac    时间: 2007-3-13 12:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: Eji    时间: 2007-3-13 13:02
原帖由 RacingPHT 于 2007-3-10 19:04 发表
发表者Barry Minor在底下的Comment:
一颗CELL渲染这个画面(设定未知)的速度为2 FPS。


我想是同設定才有比較意義吧。
不同設定的話,看不出他發言的含意。
作者: Eji    时间: 2007-3-13 13:02
原帖由 colo 于 2007-3-12 21:06 发表
每秒1桢的幻灯片?w00t)


那還算快的呢。別忘了這是Ray-tracer。
作者: Eji    时间: 2007-3-13 13:08
原帖由 hdfeel 于 2007-3-13 07:03 发表



ibm 以前测试过,cell在4个spe后性能就上不去了,可是32个spe的性能加起来 也只有 1个spe的150%,可能因为ppe性能太弱和环形总线冲突和延迟太多的 ...


基本上不同工作的性質不同,所以視種類有其他工作在更多SPE上可以得到線性提升。
而且可以同時安排許多類型的工作分配給各個SPE執行,如有個工作吃2個SPE、有個工作吃3個SPE....等等。

有很多performance tool 可以做評估,PPE本身也有其適當的工作應該執行,光工作資料同步的頻率設定就可以影響PPE的loading非常明顯。

----
我覺得,CELL是要讓programmer檢討自己的怠惰損耗掉的效率到底有多嚴重的處理器。:loveliness:
作者: the_god_of_pig    时间: 2007-3-13 19:39



咳~

cell这样也没生么奇怪的,SPE数/性能成了线性性能也就那么回子事,比桌面U好不了多少:unsure:
作者: hdfeel    时间: 2007-3-14 18:47
原帖由 Eji 于 2007-3-13 13:08 发表


基本上不同工作的性質不同,所以視種類有其他工作在更多SPE上可以得到線性提升。
而且可以同時安排許多類型的工作分配給各個SPE執行,如有個工作吃2個SPE、有個工作吃3個SPE....等等。

有很多performan ...


我觉得如果不是环形总线的话,怎么分配都好办。是环形总线的话,会有很多问题。

不知道cell 那条环形总线是怎么传输的。

比如,  在spe0 对spe1 传输数据的时候,ppe 可不可以跨过 spe0 和spe1 直接同时对 spe2进行数据传输。
作者: RacingPHT    时间: 2007-3-14 20:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: potomac    时间: 2007-3-14 21:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: potomac    时间: 2007-3-14 21:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: hdfeel    时间: 2007-3-15 07:40
原帖由 RacingPHT 于 2007-3-14 20:25 发表


视算法关联性, 带宽, 延迟的情况, 并行的效率会很不一样。IBM和Sony的研发人员都不是傻子, 至少肯定不是连环形总线和并行理论都一无所知的您, 可以否定得了的。

光线跟踪是扩展性最好的算法之一。所以不 ...


在it界,技术是飞速发展。 处理速度是3年两倍的发展。 ps3 晚发售一年。在价格更高的情况,画面落败,这不是正常的情况。 ibm 是赚钱的一方,就算给sony 一个废物,他都是赚钱,说傻子怎么样都论不到ibm。ibm 把越渣的东西,价格卖的越高, 那么说明在商业上就会越成功,利润也会越丰富。  当然sony 就是被宰的一方。 sony 被宰的越多,被ibm宰的越恨,越能突出ibm的出色。
对ibm来说最完美的交易,就是把一个渣高价卖给sony, 然后sony 来吹。出了问题, ibm还收安慰费。ibm 可以获得最大的利润,也不损名声。

既然是环形,就不是并行了。不是并行,才会有集成运算效率的问题。我是觉得,ibm 在环形总线上算计了sony。 因为所有的spe,ppe,内存控制器都挂在一条 环形总线上。    很难避免冲突。

比如 环形总线的带宽 是200G, 如果是一对一, 是200G。那么ppe 对8个 spe 就是 200/8,而 8个spe 还要对内存控制器。 就是 200/16。 加上 spe 对spe, 被分割后, 每个spe 带宽,就很少了。 这种复杂的传输,还带来非常高的监控损耗和冲突。
作者: RacingPHT    时间: 2007-3-15 09:43
提示: 作者被禁止或删除 内容自动屏蔽
作者: Eji    时间: 2007-3-15 12:10
原帖由 hdfeel 于 2007-3-15 07:40 发表


在it界,技术是飞速发展。 处理速度是3年两倍的发展。 ps3 晚发售一年。在价格更高的情况,画面落败,这不是正常的情况。 ibm 是赚钱的一方,就算给sony 一个废物,他都是赚钱,说傻子怎么样都论不到ibm。i ...


連 IBM 在業界最重視的東西是什麼都不知道的您,貼出來的東西又會有多少人認真回應呢?
少浪費論壇資源了吧。
作者: eeerrr    时间: 2007-3-15 12:27
最多DX7的效果而以
作者: hdfeel    时间: 2007-3-15 12:55
ibm 是业界的技术领袖企业,最重要的是技术形象吧。

象 ps3这种晚出一年,画面比xo更差,价格更高。来代表ibm的技术的话,ibm 的技术形象也完了。 用ps3代表 nv的技术的话,nv的技术形象也完蛋。

如果ibm 自己用的cell没有问题,用ps3的cell 来代表ibm的cell。cell 的颜面也完蛋。
作者: eeerrr    时间: 2007-3-15 14:08
标题: 回复 #67 hdfeel 的帖子
当初IBM搞Cell到底是干啥用的?
作者: 我系高手!    时间: 2007-3-15 14:11
目前好像看不到cell的优势:unsure:
作者: iloveskay    时间: 2015-8-22 13:58
历史已经证明了,此U想当的不靠谱。
作者: stephenzrt    时间: 2015-8-22 22:05
这坟挖得,,,,




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4