规格名称 | 具体参数 | 产品名称 | NVIDIA Tesla K20X | GPU计算应用 | 地震处理,计算流体力学,计算机辅助工程,金融计算,计算化学与物理学,数据分析,卫星成像,天气建模 | GPU的数量和类型 | 1 Kepler GK110 | 尺寸规格 | 高4.376“长10.5”宽双槽位 | CUDA并行处理器核心 | 2688 | 峰值双精度浮点性能 | 1.31 Tflops | 峰值单精度浮点性能 | 3.95 Tflops | 内存容量 | 6 GB | 显存宽位 | 384-bit | 内存带宽 | 250 GB /秒 | 耗电量 | 235W | 需要辅助电源线 | 1根8针1根6针 | 保修政策 | 全国联保 | 质保时间 | 三年 | 详细内容 | 英伟达的售后服务由厂商提供,产品出现非人为故障,并且属于正常保修范围内的产品,可享受免费保修。如出现产品质量问题或故障,可查询最近的维修点,由厂商售后解决。未经授权渠道购得的产品;擅自改装,拆机造成的损坏与故障;未依操作手册操作及人为操作不当所造成的损坏不在保修范围内。 | 市场参考价(¥) | 35500 |
GPU并行软件开发工具 Allinea DDT/MAP 采购说明文件 1、关于并行软件开发工具 随着处理器由单核向多核的变迁,以及各种海量数据处理和更复杂计算需求的爆发,软 件开发由串行向并行(Parallel)已经成为必然。 和传统的单线程或单进程的串行软件相比,并行软件的开发更为复杂和困难,集中表现 在并行计算思维、并行算法、并行软件实现以及并行软件优化等多个方面。 程序调试是并行软件开发中最重要和最困难的环节之一。由于大量进程分布在不同的计 算核、处理器乃至计算节点,同时不同线程或进程间有着大量复杂的数据通讯,以往的串行程 序调试工具已经无法胜任这一重担,需要通过专业的并行软件调试工具辅助开发,以快速准确 的定位排查软件错误,大幅提高软件开发效率。 通常而言,并行软件调试工具需具备如下功能或特点: ?1?7 完备的基础调试功能 ?1?7 包括断点设置、函数或代码行步进、数据跟踪、故障处定位等 ?1?7 并行调试功能 ?1?7 多进程、线程的控制,包括对单个或多个进程/线程的暂停、执行等 ?1?7 进程间数据的查看、比对、跟踪和修改 ?1?7 进程或线程间通信状态检视 ?1?7 并行通讯死锁侦测 ?1?7 内存调试,通过不同线程/进程的分析比对定位内存泄漏等 ?1?7 丰富的支持和良好的适用性 ?1?7 C/C++/Fortran 等常用开发语言支持 ?1?7 GNU、Intel、PGI、PathScale 等主流编译器支持 ?1?7 MPI、OpenMP、pthread、OpenACC 以及各种混合并行编程模式的支持 ?1?7 单机、集群运行以及通过作业调度工具提交并行任务的支持 ?1?7 方便易用 采用并行编程最主要是为了提升程序性能,而和传统的串行程序相比,并行程序性能优 化尤为困难,最主要表现在负载均衡以及通讯性能优化。 通常而言,良好的并行程序性能优化分析工具需具备如下功能: ?1?7 完备的基础性能分析功能 ?1?7 函数、代码行性能数据分析 ?1?7 计算、内存耗量统计 ?1?7 代码导航 ?1?7 并行调优功能 ?1?7 多进程/线程性能数据分析 ?1?7 通讯分析 ?1?7 负载均衡分析 ?1?7 方便易用 2、关于Allinea DDT/MAP 并行程序调试优化工具 Allinea 公司是一家位于英国、源于牛津大学的高性能计算(HPC)软件开发工具提供 商,其开发的DDT(Distributed Debugger Tool)和MAP 分别是当前市场上功能最为完备和 强大的并行调试工具和MPI 程序性能分析优化工具。 DDT 最新的4.0 版本主要功能包括: ?1?7 多种运行方式支持 ?1?7 本地/远程/作业调度系统 ?1?7 通过DDT 启动/绑定已运行程序/core dump 文件启动 ?1?7 Windows/MAC 客户端调试远程并行程序 ?1?7 程序运行控制 ?1?7 进程分组 ?1?7 函数或代码行步进 ?1?7 各类断点设置 ?1?7 Watchpoints,Tracepoints ?1?7 Parallel stack view ?1?7 变量和数据控制 ?1?7 当前代码行变量,本地/局部变量 ?1?7 Fortran 数据支持,C++ STL 支持 ?1?7 (多维)数组查看,指针查看,线程和进程间数据、堆栈数据查看 ?1?7 对各类数据的更改 ?1?7 输入和输出 ?1?7 即时输出信息,指定单个或多个进程输出 ?1?7 即时响应程序输入请求 ?1?7 消息队列 ?1?7 队列查看 ?1?7 死锁检测 ?1?7 内存调试,包括内存统计、分析以及内存泄漏侦测 ?1?7 Checkpoints 以及程序故障重启支持 ?1?7?1?7?1?7?1?7CUDA/Intel Phi 支持 ?1?7?1?7?1?7?1?7 大规模并行支持,唯一高效支持数十万核并行规模调试工具 和传统的串行调试工具或方法(如GDB 或者常用的打印输出)相比,DDT 使得并行程序 调试成为可能,能大幅度提升程序开发效率。目前市场的同类产品主要有Intel 公司Parallel Studio XE 2011,微软公司Visual Studio 2010 以及美国Rogue Wave 公司的TotalView,它 们的主要功能和特点对比为: 和同类产品相比,DDT 的主要特点包括: ?1?7 专为当前主流的Linux 集群系统开发,更符合当前并行程序调试需求; ?1?7 创新的界面设计、便捷的各类数据展示以及丰富的调试向导指引使得DDT 是当前用户 体验最佳的并行调试工具,无论是并行开发的初学者(如本科生或研究生)还是经验 丰富的并行程序开发者,均能熟悉并掌握软件使用; ?1?7 独有的对超大规模并行程序调试的支持,可支持数十万核并行规模,是当前唯一能在千 万亿次系统(如天河一号A、曙光星云)正常使用的并行调试工具; ?1?7 独有的变化数据智能高亮、跟踪点(Tracepoint)等功能使得并行程序调试更为简单方 便。 Allinea MAP 是全新设计的并行程序分析优化工具,和现有的工具相比,MAP 的主要特 点包括: ?1?7 创新的用户界面设计,方便快捷的进行并行程序性能分析; ?1?7 无论并行规模大小,仅有不超过5%的性能分析开销; ?1?7 不同运行平台性能数据对比分析; ?1?7 独有的对超大规模并行程序调试的支持,可支持数十万核并行规模。 主要并行程序性能分析优化工具对比如下:
特性 | Tesla K20X | Tesla K20 | Tesla K10 | Tesla M2090 | Tesla M2075 | GPU 的数量和类型 | 1 Kepler GK110 | 2 Kepler GK104s | 1 Fermi GPU | 1 Fermi GPU | GPU 计算应用 | 地震处理, 计算流体力学, 计算机辅助工程, 金融计算, 计算化学与物理学, 数据分析, 卫星成像, 天气建模 | 地震处理, 信号与图像处理, 视频分析 | 地震处理, 计算流体力学, 计算机辅助工程, 金融计算, 计算化学与物理学, 数据分析, 卫星成像, 天气建模 | 峰值双精度浮点性能 | 1.31 Tflops | 1.17 Tflops | 190 Gigaflops
(每颗 GPU 95 Gflops) | 665 Gigaflops | 515 Gigaflops | 峰值单精度浮点性能 | 3.95 Tflops | 3.52 Tflops | 4577 Gigaflops
(每颗 GPU 2288 Gflops) | 1331 Gigaflops | 1030 Gigaflops | 存储器带宽 (ECC关闭) | 250 GB / 秒 | 208 GB / 秒 | 320 GB / 秒
(每颗 GPU 160 GB / 秒) | 177 GB / 秒 | 150 GB / 秒 | 存储器容量 (GDDR5) | 6 GB | 5 GB | 8 GB
(每颗 GPU 4GB) | 6 GB | 6 GB | CUDA 核心数量 | 2688 | 2496 | 3072
(每颗 GPU 1536 个) | 512 | 448 |
注: 在启用 ECC 的情况下,12.5%的 GPU 存储器用于 ECC 数据位。 例如,在启用 ECC 的情况下,如果总容量为 3 GB,那么用户可用存储器容量为 2.625 GB。
[url=]NVIDIA® GeForce®[/url]、[url=]NVIDIA Quadro®[/url]和 Tesla 系列产品均支持 NVIDIA®[url=]CUDA[/url]™ 并行计算平台。 然而 NVIDIA GeForce 和 NVIDIA Quadro 分别是为消费级图形处理和专业可视化而设计的,只有 Tesla 产品系列是完全针对并行计算而设计的,可提供独有的计算特性。
专为高性能计算而设计Tesla 系列产品在设计上具备独有的特性,可为计算专业人士提供最强劲的性能: 完整的双精度浮点性能 - 在 Tesla K20X 上的性能可达 1.31TFlops
- 与消费级产品相比,双精度更高
PCIe 通信速度更快 - 唯一一种具备双 DMA 引擎的 NVIDIA® 产品,可满足双向 PCIe 通信的需要
在具有更大数据集的技术类应用程序上可实现更高性能 - 板载存储器容量更大 (Tesla K20X 包含 6GB 存储器而 Tesla K10 GPU 包含 8GB 存储器)
利用 NVIDIA®[url=]GPUDirect™[/url],与 InfiniBand 之间的通信速度更快 - 专门的 Linux 补丁、InfiniBand 驱动程序以及 CUDA 驱动程序
针对 Windows 操作系统的 CUDA 驱动程序可实现更高性能 - TCC 驱动程序可减少 CUDA 内核的系统总开销并支持远程桌面 (Windows Remote Desktop) 以及 Windows 服务
专为数据可靠性而设计计算专业人士需要这些至关重要的应用程序能够稳定运行,不出现数据错误。 在最严苛的条件下,所有 Tesla 系列产品均已通过数百次零故障测试,测试时间比任何其它 NVIDIA 产品都长。Tesla 独有的特性包括: 支持数据可靠性极高的 ECC 保护 - 针对 GPU 内部存储器以及外部 GDDR5 存储器
零故障长时间测试 NVIDIA 制造,保证了最高品质 企业级技术支持 - 三年质保、Bug 修正与特性请求的优先级更高、寿命周期达 18-24 个月
ISV 认证 - HPC 软件供应商只在 Tesla 系列产品上认证自己的软件
专为 HPC 解决方案而打造HPC 用户具有独特的需求。 只有 Tesla 事业部才能够提供合适的产品与解决方案,满足这些特定需求: 集成 OEM 系统 - 专为 Tesla 系列产品而设计的创新 OEM 服务器、刀片服务器以及工作站
Tesla 系列产品稳定的供货以及市场供应 数据中心质保 - NVIDIA 以及 OEM 合作伙伴在 Tesla 系列产品上提供[url=]3 年质保[/url]
集群管理和 GPU 监控软件 - GPU 温度监控、风扇转速以及功率
- 可独占式访问集群中的 GPU
在售前、售后支持中提供 HPC 专业技术支持 - CUDA /[url=]OpenCL[/url]调谐工程师、解决方案架构师以及专门的销售团队可提供整套 HPC 解决方案的专业技术
TESLA 个人超级计算NVIDIA® Tesla® 加速器可将标准 PC 和工作站变为个人超级计算机。针对工作站的 Tesla GPU 加速器采用全球应用最广泛的并行计算模型 CUDA®,可在用户桌边实现集群级的性能。
面向服务器、基于 Kepler 架构的 Tesla GPU 加速器也已问世。
TESLA 软件与驱动程序NVIDIA 建议用户从系统 OEM 厂商处获得驱动程序。 如需下载最新的 NVIDIA Tesla 级驱动程序,敬请访问[url=]NVIDIA 驱动程序下载[/url]页面. 下列系统支持 Tesla 工作站产品 - Windows (Windows XP - 仅限C2075)、Windows Vista、
Windows 7 - 32-bit (仅限 C2075) and 64-bit - Linux 32 位以及 64 位
- Fedora 12
- RHEL 5.4 Desktop
- Ubuntu 9.10 Desktop
- RHEL 4.8 Desktop (仅 64位)
- RHEL 6
- OpenSUSE 11.2
- SLED 11
TESLA 硬件支持知识库
[url=]NVIDIA 知识库[/url]常年全天在线开放,其中包含了最常见问题的答案。 用户论坛
在[url=]CUDA 论坛[/url]上,用户可以讨论英伟达 Tesla 产品、探讨[url=]CUDA[/url]开发,还可以与其它 Tesla 用户分享有趣的话题、技巧和解决方案。 RMA需求
有关 NVIDIA 产品的 RMA 请求、更换以及保修问题,敬请联络 OEM 厂商或售出该产品的经销商。
部分适用平台
|