GK110提供了高达7.1亿晶体管的GPU..
特斯拉K20拥有2496个CUDA核心,706MHz核心和5GB在5.2GHz的GDDR5内存,最大内存带宽为208GB / s.此卡是专为服务器和工作站,它提供了1.17万亿次浮点运算的单精度和双精度计算能力.3.52万亿次浮点运算。
K20X有2688个CUDA核心,732MHz核心时钟频率,6GB GDDR5..主频在5.2GHz,250GB / s 的内存带宽,拥有1.31万亿次浮点运算单精度和双精度计算能力3.95万亿次浮点运算。K20功耗 225W TDP,K20X 在功耗 235W左右 .
Tesla K20又放弃了一组SMX和一个显存控制器,因此有2496个流处理器、320-bit位宽,显存容量5GB GDDR5,二级缓存也对应地减少到1.25MB。核心频率也略降至706MHz,因此浮点性能减少为单精度3.52TFlops、双精度1.17TFlops,而显存频率仍然是5.2GHz,带宽为208GB/s。 Tesla K20X的热设计功耗为235W,Tesla K20则降低到225W——别小看了这区区10W,225W正是绝大多数服务器和机柜所允许的扩展卡最大TDP,再高就需要定制了,AMD 375W的双芯型FirePro S10000就比较麻烦。二者都提供主动和被动散热,供客户选择。 相比之下,上一代费米架构的Tesla M2090/M2070Q只有30亿个晶体管、最多512个流处理器、384-bit 3.7GHz 6GB GDDR5显存,浮点性能最高单精度1.33TFlops、双精度655GFlops,热设计功耗最高250W。AMD FirePro S10000单精度高达5.91TFlops,双精度也有1.48TFlops,比之Tesla K20X分别高出50%、13%,但到了实际生态里显然还是Tesla更有优势。 Tesla K20的建议零售价为3199美元,Tesla K20X则未公布,估计4000-5000美元范围。二者均已开始大规模出货了,客户包括Appro、华硕、Cray、Eurotech、富士通、惠普、IBM、广达、SGI、Supermicro、T-Platforms、泰安。 除了橡树岭,其它采纳Tesla K20系列的机构还有:美国克莱姆森大学、印第安纳大学、南加州大学(USC)、托马斯·杰斐逊国家加速器实验室、国家超级计算应用中心(NCSA)、国家海洋和大气管理局(NOAA);沙特阿拉伯阿卜杜拉国王科技大学(KAUST);中国上海交大。 NVIDIA宣称,Tesla K20X搭配Intel Sandy Bridge处理器,可以将大量高性能计算应用的性能提升十倍乃至更多,包括: - MATLAB(工程):18.1倍
- Chroma(物理):17.9倍
- SPECFEM3D(地球科学):10.5倍
- AMBER(分子动力学):8.2倍 NVIDIA还表示,Tesla K20X/K20在过去三十天内就累计出货提供了超过30PFlops的浮点性能,相当于过去时间最快超级计算机的总和!
|