|
其实Cell
主要还是要有好编译器和开发运行库才行
PC上程序 可以用Intel Compiler自动向量化+多线程化
物理运算和图像运算并行度都是很高的,我编计算物理程序,体会颇深
PD 820 512M DDR2 533内存
同一个程序(GSAW-自规避随机行走,1000个粒子2000*2000网格)用VC6编译出来,跑10分钟
用Intel c++ compiler跑1分钟20秒,加速比就是这么高
关键就是IBM能不能开发出强大的编译器来。Cell的编译器开发应该比Intel双核难。
下面内容有争议:
而且Cell犯了和安腾一样的错,只不过没有鹌鹑那么深:把很多不该由编译器干的活交给了编译器。编译器毕竟是死板的东西啊
还有就是楼上人提到的SPE分支预测差,这个我倒觉得无所谓,毕竟对8条线程进行分别的分支预测是很耗晶体管的
软件写BPB?不太可能吧?
是本地内存,程序员可以访问的快速内存
如果以后显示芯片和CPU集成了,显示芯片还支持多线程,那个CPU的浮点速度一定非常快,可是毕竟Cell是第一个,第一个经常做的很幼稚。
[ 本帖最后由 Tanknet 于 2006-11-23 18:09 编辑 ] |
|