POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 5994|回复: 5
打印 上一主题 下一主题

[显卡] 丽台 英伟达原厂 Tesla K20 GPU加速卡 运算卡 可提供测试欢迎

[复制链接]
跳转到指定楼层
1#
发表于 2013-1-29 11:45 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
C2050 C2070 C2075 M2090 K10 K20 现货 供应  提供测试环境
GPU 加速器

NVIDIA Tesla K20[url=]NVIDIA Tesla C2075[/url]
[url=]NVIDIA CUDA[/url] 核心数量2496448
显存5GB GDDR56GB GDDR5 存储器
存储器带宽 (ECC 关闭)1208 GB/秒144 GB/秒
峰值双精度浮点性能
性能 (板卡)
1.17 Tflops515 Gflops
峰值单精度浮点性能 (板卡)3.52 Tflops1030 Gflops

提供 NVIDIA 高性能运算解决方案
实物图:
同时支持4块 NV C2050 C2070 C2075 K20 GPU 运算卡
可加图形显卡 定制渲染工作站
实物图二
同时支持4块 M2050 M2070 M2090 K10

实物图三
同时支持8块 C2050 C2070 C2075 K20

更多解决方案 请咨询旺旺: 服务器88885

     新一届超级计算大会SC12今天开幕了,除了公布新的TOP500超算榜单,各大相关厂商也是一股脑地发布或者宣布了多款高性能计算产品。先来看NVIDIA这边,基于开普勒大核心GK110、拥有71亿个晶体管的Tesla K20终于正式发布了,而且还有更高端的Tesla K20X。
Tesla K20X拥有十四组SMX、2688个流处理器,屏蔽了一组192个,但同时启用完整的384-bit显存位宽和1.5MB二级缓存,搭配6GB GDDR5。频率方面核心定在732MHz,浮点性能为单精度FP32 3.95TFlops、双精度FP64 1.31TFlops(这代3:1上代费米2:1),显存频率则是5.2GHz,带宽达249.6GB/s。
事实上,美国橡树岭国家实验室的新一代超级计算机“泰坦”里配备的就是Tesla K20X,而不是Tesla K20,只不过之前双方都口风甚紧,谁也没有明说。泰坦此番不仅成功登顶超算王者,拿下世界性能第一,还在能效上超越了半年前的绿色超算第一名。
Tesla K20又放弃了一组SMX和一个显存控制器,因此有2496个流处理器、320-bit位宽,显存容量5GB GDDR5,二级缓存也对应地减少到1.25MB。核心频率也略降至706MHz,因此浮点性能减少为单精度3.52TFlops、双精度1.17TFlops,而显存频率仍然是5.2GHz,带宽为208GB/s。
Tesla K20X的热设计功耗为235W,Tesla K20则降低到225W——别小看了这区区10W,225W正是绝大多数服务器和机柜所允许的扩展卡最大TDP,再高就需要定制了,AMD 375W的双芯型FirePro S10000就比较麻烦。二者都提供主动和被动散热,供客户选择。
相比之下,上一代费米架构的Tesla M2090/M2070Q只有30亿个晶体管、最多512个流处理器、384-bit 3.7GHz 6GB GDDR5显存,浮点性能最高单精度1.33TFlops、双精度655GFlops,热设计功耗最高250W。AMD FirePro S10000单精度高达5.91TFlops,双精度也有1.48TFlops,比之Tesla K20X分别高出50%、13%,但到了实际生态里显然还是Tesla更有优势。
Tesla K20的建议零售价为3199美元,Tesla K20X则未公布,估计4000-5000美元范围。二者均已开始大规模出货了,客户包括Appro、华硕、Cray、Eurotech、富士通、惠普、IBM、广达、SGI、Supermicro、T-Platforms、泰安。
除了橡树岭,其它采纳Tesla K20系列的机构还有:美国克莱姆森大学、印第安纳大学、南加州大学(USC)、托马斯·杰斐逊国家加速器实验室、国家超级计算应用中心(NCSA)、国家海洋和大气管理局(NOAA);沙特阿拉伯阿卜杜拉国王科技大学(KAUST);中国上海交大。
NVIDIA宣称,Tesla K20X搭配Intel Sandy Bridge处理器,可以将大量高性能计算应用的性能提升十倍乃至更多,包括:
- MATLAB(工程):18.1倍
- Chroma(物理):17.9倍
- SPECFEM3D(地球科学):10.5倍
- AMBER(分子动力学):8.2倍
NVIDIA还表示,Tesla K20X/K20在过去三十天内就累计出货提供了超过30PFlops的浮点性能,相当于过去时间最快超级计算机的总和!
此前发布的双GK104核心的Tesla K10并不会被取代和淘汰,而是将与Tesla K20系列并存。事实上,Tesla K20的单精度浮点性能还更高呢,达到了4.5TFlops,只是没有SRAM ECC、HyperQ、Dynamic Parallelism等高端技术。
Tesla K20X高清实物照
Tesla K20高清实物照
GK110核心架构图(完整的2880个流处理器)
GK110 SMX阵列架构图
Tesla K20/2000系列规格对比
开普勒、费米核心规格对比
双精度浮点效率:上代只有65%,现在提高到了惊人的93%,Intel Xeon也才不过86%
HyperQ、Dynamic Parallism技术
之前说的Tesla K20价格和出货时间,实际上提前了
泰坦超级计算机的计算板:四颗十六核心Opteron、四块Tesla K20X(左侧)

2#
 楼主| 发表于 2013-1-29 11:48 | 只看该作者
丽台 英伟达原厂 Tesla  C2050 C2070 C2075 M2090 K10 K20  M2050 M2070 M2090 GPU加速卡 提供桌面级 集群 解决方案
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2013-1-29 11:50 | 只看该作者

什么是 GPU 计算?
GPU 计算就是运用 GPU (图形处理器) 搭配 CPU 来加速通用科学和工程应用程序。GPU 计算于五年前由 NVIDIA® 公司率先提出,之后迅速成为一种行业标准,在全世界范围内拥有数以百万计的用户,几乎所有的计算供应商均采用 GPU 计算。

GPU 计算通过将应用程序中计算量繁重的部分交给 GPU 处理,程序的剩余部分依然在 CPU 上运行,从而可实现前所未有的应用程序性能。 从用户的角度而言,应用程序只是运行速度比从前快了很多。

CPU + GPU 是一个强大的组合,因为 CPU 包含几个专为串行处理而优化的核心,而 GPU 则由数以千计更小、更节能的核心组成,这些核心专为提供强劲的并行性能而设计。 程序的串行部分在 CPU 上运行,而并行部分则在 GPU 上运行。

通过运用我们目录中所列的任意 GPU 加速应用程序,大多数客户能够立即享受到 GPU 计算的优势。 该目录重点列举了一百多款行业领先的应用程序。对开发者来说,GPU 计算拥有由各大软件开发商旗下工具和库所组成的巨大生态系统。

更快地运行你的 GPU 加速代码
试用 Tesla K20 GPU 加速器。
了解更多信息
GPU 计算的历史
图形芯片最开始被用作固定函数的图形流水线。经过多年的发展,这些图形芯片的可编程性逐渐增强,从而使第一颗 NVIDIA® GPU 得以问世。 在 1999-2000 年间,计算机科学家和医学成像以及电磁学领域中的研究者开始使用 GPU 来加速一系列的科学应用。这就是所谓的「GPGPU」或 GPU 通用计算运动

虽然用户取得了前所未有的性能 (在某些情形中实现了比 CPU 高 100 倍的性能),然而难题是 GPGPU 需要使用 OpenGL 和 Cg 等图形编程 API 来对 GPU 进行编程。 这样便限制了人们利用 GPU 的强大处理能力来为科学加速。

所有 NVIDIA® GPU GeForce、 NVIDIA® Quadro 以及 NVIDIA® Tesla) 均支持 GPU 计算和 CUDA® 并行编程模型。开发者几乎在任意平台上均可运用 NVIDIA® GPU,这些平台包括最新的苹果 MacBook Pro。 然而,我们建议使用 NVIDIA® Tesla GPU 来处理那些强调可靠性与整体性能的工作。 如需了解更多细节,敬请参阅「为什么选择 NVIDIA® Tesla」。

NVIDIA® Tesla GPU 完全专为加速科学技术计算工作而设计。最新的 NVIDIA® Tesla GPU 基于「Kepler 架构」中的诸多创新特性,与上一代架构相比,可提供三倍的性能,双精度浮点性能高达 1 Teraflops 以上,同时还大幅提升了可编程性和效率。Kepler 是世界上最快、最节能的高性能计算 (HPC) 架构。

NVIDIA® 意识到了将这种性能提供给更广阔的科学界的潜力,因此投入力量修改 GPU,让开发者能够对 GPU 充分编程,使其能够无缝地运用 C、C++ 以及 Fortran 等熟悉的语言。

GPU 计算的发展势头比以往任何时候都更加迅猛。现在,世界上一些最快的超级计算机仰仗 GPU 来加快科学探索,全球有 600 所大学已开设 NVIDIA® GPU 并行计算课程,积极运用 GPU 的开发者人数已达数十万计。
「GPU 已经发展到成熟阶段,可轻松执行现实生活中的各种应用程序,而且程序运行速度已远远超过使用多核系统时的情形。 未来计算架构将是并行核心 GPU 与多核 CPU 共同运行的混合型系统。」
Jack Dongarra 教授
田纳西大学创新计算实验室主任


回复 支持 反对

使用道具 举报

4#
发表于 2013-1-29 19:10 | 只看该作者
很强大
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2013-1-30 14:59 | 只看该作者
thewife 发表于 2013-1-29 19:10
很强大[tongue>

加速您的科研进程  我们搭建平台 ,选择合适您的解决方案
回复 支持 反对

使用道具 举报

6#
发表于 2013-1-30 21:47 | 只看该作者
很强大,见识了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-1-17 07:51

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表