POPPUR爱换
标题: NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货 [打印本页]
作者: 京-AMD-刘辉 时间: 2014-4-21 09:32
标题: NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货
正视图
后视图:
Tesla K20X 标示
规格名称 | 具体参数 |
产品名称 | NVIDIA Tesla K20X |
GPU计算应用 | 地震处理,计算流体力学,计算机辅助工程,金融计算,计算化学与物理学,数据分析,卫星成像,天气建模 |
GPU的数量和类型 | 1 Kepler GK110 |
尺寸规格 | 高4.376“长10.5”宽双槽位 |
CUDA并行处理器核心 | 2688 |
峰值双精度浮点性能 | 1.31 Tflops |
峰值单精度浮点性能 | 3.95 Tflops |
内存容量 | 6 GB |
显存宽位 | 384-bit |
内存带宽 | 250 GB /秒 |
耗电量 | 235W |
需要辅助电源线 | 1根8针1根6针 |
保修政策 | 全国联保 |
质保时间 | 三年 |
详细内容 | 英伟达的售后服务由厂商提供,产品出现非人为故障,并且属于正常保修范围内的产品,可享受免费保修。如出现产品质量问题或故障,可查询最近的维修点,由厂商售后解决。未经授权渠道购得的产品;擅自改装,拆机造成的损坏与故障;未依操作手册操作及人为操作不当所造成的损坏不在保修范围内。 |
市场参考价(¥) | 35500 |
GPU并行软件开发工具 Allinea DDT/MAP
采购说明文件
1、关于并行软件开发工具
随着处理器由单核向多核的变迁,以及各种海量数据处理和更复杂计算需求的爆发,软
件开发由串行向并行(Parallel)已经成为必然。
和传统的单线程或单进程的串行软件相比,并行软件的开发更为复杂和困难,集中表现
在并行计算思维、并行算法、并行软件实现以及并行软件优化等多个方面。
程序调试是并行软件开发中最重要和最困难的环节之一。由于大量进程分布在不同的计
算核、处理器乃至计算节点,同时不同线程或进程间有着大量复杂的数据通讯,以往的串行程
序调试工具已经无法胜任这一重担,需要通过专业的并行软件调试工具辅助开发,以快速准确
的定位排查软件错误,大幅提高软件开发效率。
通常而言,并行软件调试工具需具备如下功能或特点:
�1�71�1�77 完备的基础调试功能
�1�71�1�77 包括断点设置、函数或代码行步进、数据跟踪、故障处定位等
�1�71�1�77 并行调试功能
�1�71�1�77 多进程、线程的控制,包括对单个或多个进程/线程的暂停、执行等
�1�71�1�77 进程间数据的查看、比对、跟踪和修改
�1�71�1�77 进程或线程间通信状态检视
�1�71�1�77 并行通讯死锁侦测
�1�71�1�77 内存调试,通过不同线程/进程的分析比对定位内存泄漏等
�1�71�1�77 丰富的支持和良好的适用性
�1�71�1�77 C/C++/Fortran 等常用开发语言支持
�1�71�1�77 GNU、Intel、PGI、PathScale 等主流编译器支持
�1�71�1�77 MPI、OpenMP、pthread、OpenACC 以及各种混合并行编程模式的支持
�1�71�1�77 单机、集群运行以及通过作业调度工具提交并行任务的支持
�1�71�1�77 方便易用
采用并行编程最主要是为了提升程序性能,而和传统的串行程序相比,并行程序性能优
化尤为困难,最主要表现在负载均衡以及通讯性能优化。
通常而言,良好的并行程序性能优化分析工具需具备如下功能:
�1�71�1�77 完备的基础性能分析功能
�1�71�1�77 函数、代码行性能数据分析
�1�71�1�77 计算、内存耗量统计
�1�71�1�77 代码导航
�1�71�1�77 并行调优功能
�1�71�1�77 多进程/线程性能数据分析
�1�71�1�77 通讯分析
�1�71�1�77 负载均衡分析
�1�71�1�77 方便易用
2、关于Allinea DDT/MAP 并行程序调试优化工具
Allinea 公司是一家位于英国、源于牛津大学的高性能计算(HPC)软件开发工具提供
商,其开发的DDT(Distributed Debugger Tool)和MAP 分别是当前市场上功能最为完备和
强大的并行调试工具和MPI 程序性能分析优化工具。
DDT 最新的4.0 版本主要功能包括:
�1�71�1�77 多种运行方式支持
�1�71�1�77 本地/远程/作业调度系统
�1�71�1�77 通过DDT 启动/绑定已运行程序/core dump 文件启动
�1�71�1�77 Windows/MAC 客户端调试远程并行程序
�1�71�1�77 程序运行控制
�1�71�1�77 进程分组
�1�71�1�77 函数或代码行步进
�1�71�1�77 各类断点设置
�1�71�1�77 Watchpoints,Tracepoints
�1�71�1�77 Parallel stack view
�1�71�1�77 变量和数据控制
�1�71�1�77 当前代码行变量,本地/局部变量
�1�71�1�77 Fortran 数据支持,C++ STL 支持
�1�71�1�77 (多维)数组查看,指针查看,线程和进程间数据、堆栈数据查看
�1�71�1�77 对各类数据的更改
�1�71�1�77 输入和输出
�1�71�1�77 即时输出信息,指定单个或多个进程输出
�1�71�1�77 即时响应程序输入请求
�1�71�1�77 消息队列
�1�71�1�77 队列查看
�1�71�1�77 死锁检测
�1�71�1�77 内存调试,包括内存统计、分析以及内存泄漏侦测
�1�71�1�77 Checkpoints 以及程序故障重启支持
�1�71�1�77�1�71�1�77�1�71�1�77�1�71�1�77CUDA/Intel Phi 支持
�1�71�1�77�1�71�1�77�1�71�1�77�1�71�1�77 大规模并行支持,唯一高效支持数十万核并行规模调试工具
和传统的串行调试工具或方法(如GDB 或者常用的打印输出)相比,DDT 使得并行程序
调试成为可能,能大幅度提升程序开发效率。目前市场的同类产品主要有Intel 公司Parallel
Studio XE 2011,微软公司Visual Studio 2010 以及美国Rogue Wave 公司的TotalView,它
们的主要功能和特点对比为:
和同类产品相比,DDT 的主要特点包括:
�1�71�1�77 专为当前主流的Linux 集群系统开发,更符合当前并行程序调试需求;
�1�71�1�77 创新的界面设计、便捷的各类数据展示以及丰富的调试向导指引使得DDT 是当前用户
体验最佳的并行调试工具,无论是并行开发的初学者(如本科生或研究生)还是经验
丰富的并行程序开发者,均能熟悉并掌握软件使用;
�1�71�1�77 独有的对超大规模并行程序调试的支持,可支持数十万核并行规模,是当前唯一能在千
万亿次系统(如天河一号A、曙光星云)正常使用的并行调试工具;
�1�71�1�77 独有的变化数据智能高亮、跟踪点(Tracepoint)等功能使得并行程序调试更为简单方
便。
Allinea MAP 是全新设计的并行程序分析优化工具,和现有的工具相比,MAP 的主要特
点包括:
�1�71�1�77 创新的用户界面设计,方便快捷的进行并行程序性能分析;
�1�71�1�77 无论并行规模大小,仅有不超过5%的性能分析开销;
�1�71�1�77 不同运行平台性能数据对比分析;
�1�71�1�77 独有的对超大规模并行程序调试的支持,可支持数十万核并行规模。
主要并行程序性能分析优化工具对比如下:
特性 | Tesla K20X | Tesla K20 | Tesla K10 | Tesla M2090 | Tesla M2075 |
GPU 的数量和类型 | 1 Kepler GK110 | 2 Kepler GK104s | 1 Fermi GPU | 1 Fermi GPU |
GPU 计算应用 | 地震处理, 计算流体力学, 计算机辅助工程, 金融计算, 计算化学与物理学, 数据分析, 卫星成像, 天气建模 | 地震处理, 信号与图像处理, 视频分析 | 地震处理, 计算流体力学, 计算机辅助工程, 金融计算, 计算化学与物理学, 数据分析, 卫星成像, 天气建模 |
峰值双精度浮点性能 | 1.31 Tflops | 1.17 Tflops | 190 Gigaflops
(每颗 GPU 95 Gflops) | 665 Gigaflops | 515 Gigaflops |
峰值单精度浮点性能 | 3.95 Tflops | 3.52 Tflops | 4577 Gigaflops
(每颗 GPU 2288 Gflops) | 1331 Gigaflops | 1030 Gigaflops |
存储器带宽 (ECC关闭) | 250 GB / 秒 | 208 GB / 秒 | 320 GB / 秒
(每颗 GPU 160 GB / 秒) | 177 GB / 秒 | 150 GB / 秒 |
存储器容量 (GDDR5) | 6 GB | 5 GB | 8 GB
(每颗 GPU 4GB) | 6 GB | 6 GB |
CUDA 核心数量 | 2688 | 2496 | 3072
(每颗 GPU 1536 个) | 512 | 448 |
注: 在启用 ECC 的情况下,12.5%的 GPU 存储器用于 ECC 数据位。 例如,在启用 ECC 的情况下,如果总容量为 3 GB,那么用户可用存储器容量为 2.625 GB。
[url=]NVIDIA® GeForce®[/url]、[url=]NVIDIA Quadro®[/url]和 Tesla 系列产品均支持 NVIDIA®[url=]CUDA[/url]™ 并行计算平台。 然而 NVIDIA GeForce 和 NVIDIA Quadro 分别是为消费级图形处理和专业可视化而设计的,只有 Tesla 产品系列是完全针对并行计算而设计的,可提供独有的计算特性。
NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货NVIDIA Tesla K20X 超 K20C K20M 追 K40C K40M 现货
部分适用平台
作者: 京-AMD-刘辉 时间: 2014-4-21 09:35
NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货 NVIDIA Tesla K20X 超 K20C K20M 追 K40C现货
刘立辉
销售经理
高性能服务器销售部
思腾(北京)科技发展有限公司
电话:010-5162-7561-804 手机:188-0119-0200/18911607203
传真:010-5162-6135 QQ:1455948719/452777466
网址:www.aiserver.cn
地址:北京市海淀区北三环西路48号
欢迎光临 POPPUR爱换 (https://we.poppur.com/) |
Powered by Discuz! X3.4 |