|
虽然目前阶段曙光宣传的重点还是在于龙芯架构的服务器,但其在幕后已经花费相当多的精力在GPU通用计算的超级计算机上。本文将会整理一些曙光GPU通用计算系统超算的有关情报,虽然不一定完全准确,但力求让读者有个大致的了解。
传言曙光的GPGPU系统将采用5000颗NVIDIA Fermi架构的Tesla C2050,单颗Tesla C2050双精度浮点运算能力为515 Gigaflops,则整体理论运算能力则为2.5PFlops左右,目前传言曙光和NVIDIA人员正对系统进行优化,提升效能,目前Linpark性能约为1.27PFlops,GPU部分效率为42%。此外曙光系统还有500TFlops的CPU运算能力,这部分效率按70%的保守估算,运算能力也有350Tflops,因此曙光整体系统实际Linpark运算性能预计可以到1.6PFlops。并且对于Xeon 5500/5600这样类型的系统,处理器部分有80%效能应该很正常,而GPU的效能提升依然有很大的空间。曙光理论性能则为2.5+0.5为3PFlops的样子,整体效能最为保守的估计也会高于1.6/3=53%,而比较正常的效率则会为(1.27+0.4)/3=55.7%。1.6PFlops的性能现在在超算排名大概可以排到第二,逊于Jaguar的1.759,但优于IBM的ROAdRunner。不过当曙光这台正式完工时,类似橡树岭更为强大的系统也会加入,因此这并不意味着曙光的系统可以到TOP2的位置。
而之前国防科技大的天河一号理论峰值运算能力为1.206Pflops,而实际运行性能为563Tflops,在考虑CPU运算能力的情况下整体效率为46.7%。看来曙光的GPGPU超算无论在理论性能、实际性能还是效率方面都会明显优于天河一号。
此外曙光所采用的Tesla C2050是基于Fermi架构,Fermi的存储架构做了一系列的改进,如加入更大容量的存储空间和带ECC校验的缓存,这方面的改进大大提升了Fermi架构相比之前的GT200架构Tesla,性能和稳定性都大大提升。
5月19日的猜测,还是高估了一点,但是潜力还是很大的。 |
|