POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 1079|回复: 0
打印 上一主题 下一主题

[显卡] nvidia tesla M2070 M2090 现货

[复制链接]
跳转到指定楼层
1#
发表于 2014-6-3 13:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
北京思腾创新科技发展有限公司
联系人 温巍
联系电话 13301397412
QQ 499686668


Tesla M2050与M2070计算模块基于代号为“Fermi”的下一代CUDA架构,能够实现GPU计算与主系统之间的无缝集成,从而可满足高性能计算与大型数据中心以及横向扩展等部署需求。20系列Tesla GPU是首款双精度性能超过四核x86 CPU十倍的GPU,同时也是首款拥有ECC存储器的GPU。Tesla M2050与M2070模块能够实现GPU计算的所有标准优势,同时还能够实现最高可靠性并紧密集成了系统监控与管理工具。这些特性让数据中心的IT人员在部署GPU时能够拥有更大的选择空间,其中包括各种各样的架上型与刀片式系统。此外,这些系统还包含了用户所需的远程监控与远程管理功能。

与纯CPU系统相比,配备Tesla 20系列GPU计算模块的服务器以十分之一的成本与二十分之一的功耗即可实现超级计算能力,同时还能够提供最高计算密度。

更多详情可向OEM经销商咨询。

特性

基于新一代Fermi CUDA架构的GPU
与基于最新四核CPU的纯CPU系统相比,该GPU以十分之一的成本和二十分之一的功耗即可实现集群性能。
448个CUDA核心
每颗GPU最高可实现515 Gigaflop双精度峰值性能,从而让一线OEM厂商的服务器能够在1 RU空间内实现1 Teraflop甚至更高的双精度性能。每颗GPU的单精度峰值性能超过1 Teraflop。
ECC存储器
能够满足数据中心与超级计算中心在计算精度与可靠性方面的关键需求。能够为存储器中的数据提供保护功能,从而为应用程序增强数据完整性和可靠性。寄存器文件、L1/L2高速缓存、共享存储器以及DRAM均受ECC的保护。
每颗GPU最多配备6GB GDDR5存储器
更大的数据集能够保存在直接附属于GPU的本地存储器上,从而实现了性能的最大化并减少了数据传输的情况。
系统监控特性
在GPU子系统中集成了主系统的监控与管理功能。这意味着,IT人员能够通过IPMI或OEM专利工具等常用的管理界面来管理计算系统的所有关键部件。
专为最高可靠性而设计
被动式散热器的设计去除了运动零件与线缆。
NVIDIA®(英伟达™)并行DataCache™
能够为物理效果解算器、光线追踪以及稀疏矩阵乘法等诸多算法加速,在这些算法中,数据地址事先都是未知的。每个流式多处理器模块均包含一个可配置的L1高速缓存,所有处理器核心使用统一的L2高速缓存。
NVIDIA®(英伟达™)GigaThread™引擎
通过多项技术实现了吞吐量的最大化,其中包括10倍于上一代架构的高速上下文切换、并发内核执行以及改良的线程块调度。
异步传输
计算核心在处理其它数据的同时还能够在PCIe总线上传输数据,因而增强了系统性能。即便是地震处理这类需要大量数据传输的应用程序,也能够通过事先将数据传输至本地存储器的方法来最大限度提升计算效率。
CUDA编程环境受到各种编程语言与API的广泛支持
开发人员无论选择C语言、C++、OpenCL、DirectCompute还是选择Fortran语言,都能够实现应用程序的并行机制,进而利用创新的“Fermi”架构。
高速PCIe Gen 2.0数据传输率
实现了主系统与Tesla处理器之间带宽的最大化。让Tesla系统能够应用于几乎所有具备一条开放式PCIe插槽(x8或x16)且符合PCIe规范的主系统。


TESLA M2090

Fermi架构Tesla早在2009年就已经发布,不过由于供电、散热等方面的限制,当时面向工作站的Tesla C2070/C2050以及面向数据中心、超级计算机的Tesla M2070/M2050都对GPU进行了限制,屏蔽了两组SM仅启用448个CUDA核心。而今,游戏市场的GeForce GTX 580通过使用GF110改进核心已经开启了完整的512个CUDA核心,Tesla M2090就是它对应的高性能计算版本。

Tesla M2090提供512个并行处理核心双精度浮点峰值性能665GFlops,单精度浮点峰值性能1331GFlops。搭配6GB GDDR5缓存,关闭ECC校验状态下的显存带宽为177GB/s。由于是面向数据中心、超级计算机等用户,M2090和M2070/M2050一样,在散热设计上没有使用风扇,仅用热管散热器依靠机架内风扇进行散热。当然,显示输出接口在这样的通用计算卡上也肯定不会存在。

根据NVIDIA的官方测试,4块Tesla M2090加4颗CPU的系统可在AMBER 11分子模拟运算中,每天完成69纳秒的模拟。而之前仅使用CPU的超级计算机,最高记录也不过每天46纳秒。

目前,Tesla M2090已经被装配在惠普的HP ProLiant SL390 G7高性能计算4U服务器中,该机最高可搭载8块Tesla M2090以及两颗CPU。


您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-23 18:18

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表