全新 C2050 C2070 C2075 M2090 K10 K20 现货 供应 提供测试环境 GPU 加速器
| NVIDIA Tesla K20 | [url=]NVIDIA Tesla C2075[/url] | [url=]NVIDIA CUDA[/url] 核心数量 | 2496 | 448 | 显存 | 5GB GDDR5 | 6GB GDDR5 存储器 | 存储器带宽 (ECC 关闭)1 | 208 GB/秒 | 144 GB/秒 | 峰值双精度浮点性能
性能 (板卡) | 1.17 Tflops | 515 Gflops | 峰值单精度浮点性能 (板卡) | 3.52 Tflops | 1030 Gflops |
![]()
提供 NVIDIA 高性能运算解决方案 实物图: 同时支持4块 NV C2050 C2070 C2075 K20 GPU 运算卡 可加图形显卡 定制渲染工作站 实物图二 同时支持4块 M2050 M2070 M2090 K10
实物图三 同时支持8块 C2050 C2070 C2075 K20
更多解决方案 请咨询 18911607203 刘立辉 SiTon 思腾系列定制服务器 工作站 JCNET 私有云解决方案 NEXENTA 存储解决方案 NVIDIA /AMD 高性能运算解决方案 新一届超级计算大会SC12今天开幕了,除了公布新的TOP500超算榜单,各大相关厂商也是一股脑地发布或者宣布了多款高性能计算产品。先来看NVIDIA这边,基于开普勒大核心GK110、拥有71亿个晶体管的Tesla K20终于正式发布了,而且还有更高端的Tesla K20X。
Tesla K20X拥有十四组SMX、2688个流处理器,屏蔽了一组192个,但同时启用完整的384-bit显存位宽和1.5MB二级缓存,搭配6GB GDDR5。频率方面核心定在732MHz,浮点性能为单精度FP32 3.95TFlops、双精度FP64 1.31TFlops(这代3:1上代费米2:1),显存频率则是5.2GHz,带宽达249.6GB/s。
事实上,美国橡树岭国家实验室的新一代超级计算机“泰坦”里配备的就是Tesla K20X,而不是Tesla K20,只不过之前双方都口风甚紧,谁也没有明说。泰坦此番不仅成功登顶超算王者,拿下世界性能第一,还在能效上超越了半年前的绿色超算第一名。
Tesla K20又放弃了一组SMX和一个显存控制器,因此有2496个流处理器、320-bit位宽,显存容量5GB GDDR5,二级缓存也对应地减少到1.25MB。核心频率也略降至706MHz,因此浮点性能减少为单精度3.52TFlops、双精度1.17TFlops,而显存频率仍然是5.2GHz,带宽为208GB/s。
Tesla K20X的热设计功耗为235W,Tesla K20则降低到225W——别小看了这区区10W,225W正是绝大多数服务器和机柜所允许的扩展卡最大TDP,再高就需要定制了,AMD 375W的双芯型FirePro S10000就比较麻烦。二者都提供主动和被动散热,供客户选择。
相比之下,上一代费米架构的Tesla M2090/M2070Q只有30亿个晶体管、最多512个流处理器、384-bit 3.7GHz 6GB GDDR5显存,浮点性能最高单精度1.33TFlops、双精度655GFlops,热设计功耗最高250W。AMD FirePro S10000单精度高达5.91TFlops,双精度也有1.48TFlops,比之Tesla K20X分别高出50%、13%,但到了实际生态里显然还是Tesla更有优势。
Tesla K20的建议零售价为3199美元,Tesla K20X则未公布,估计4000-5000美元范围。二者均已开始大规模出货了,客户包括Appro、华硕、Cray、Eurotech、富士通、惠普、IBM、广达、SGI、Supermicro、T-Platforms、泰安。
除了橡树岭,其它采纳Tesla K20系列的机构还有:美国克莱姆森大学、印第安纳大学、南加州大学(USC)、托马斯·杰斐逊国家加速器实验室、国家超级计算应用中心(NCSA)、国家海洋和大气管理局(NOAA);沙特阿拉伯阿卜杜拉国王科技大学(KAUST);中国上海交大。
NVIDIA宣称,Tesla K20X搭配Intel Sandy Bridge处理器,可以将大量高性能计算应用的性能提升十倍乃至更多,包括:
- MATLAB(工程):18.1倍
- Chroma(物理):17.9倍
- SPECFEM3D(地球科学):10.5倍
- AMBER(分子动力学):8.2倍
NVIDIA还表示,Tesla K20X/K20在过去三十天内就累计出货提供了超过30PFlops的浮点性能,相当于过去时间最快超级计算机的总和!
此前发布的双GK104核心的Tesla K10并不会被取代和淘汰,而是将与Tesla K20系列并存。事实上,Tesla K20的单精度浮点性能还更高呢,达到了4.5TFlops,只是没有SRAM ECC、HyperQ、Dynamic Parallelism等高端技术。 Tesla K20X高清实物照 Tesla K20高清实物照 GK110核心架构图(完整的2880个流处理器) GK110 SMX阵列架构图 Tesla K20/2000系列规格对比 开普勒、费米核心规格对比 双精度浮点效率:上代只有65%,现在提高到了惊人的93%,Intel Xeon也才不过86% HyperQ、Dynamic Parallism技术 之前说的Tesla K20价格和出货时间,实际上提前了 泰坦超级计算机的计算板:四颗十六核心Opteron、四块Tesla K20X(左侧)
![]()
|