并行计算王者-Tesla个人超级计算机 配置: CPU:Xeon/至强 E3-1230 V2 3.3G 8ML3 四核八线程 正式版CPU 内存: 原厂 8G 纯ECC 2条 共16G Nvidia Tesla K40C | GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2880
双精度浮点性能:1.43 Tflops
单精度浮点性能:4.29 Tflops
专用存储器总容量:12GB 显存带宽: 288GB/s 支持PCI-E 3.0
功耗:235W热设计功耗 主动散热 |
系统盘: 64G SSD 固态硬盘 硬盘: 2T企业级
Tesla K20系列高性能计算卡能够在高性能计算领域大显身手,搭配Intel Sandy Bridge架构的处理器。 Tesla K20有2496个流处理器,核心频率定在706MHz,单精度浮点性能为FP32 3.52TFlops,双精度为FP64 1.17TFlops,拥有5GB GDDR5显存,显存频率5.2GHz,二级缓存为1.25MB,带宽为208GB/s。 规格名称 | 具体参数 | GPU计算应用 | 油藏模拟, CAE (结构分析),分子动力学,数值分析,计算可视化(光线追踪) | 尺寸规格 | 高4.376“长10.5 ”宽双槽位 | CUDA并行处理器核心 | 2496 | 峰值双精度浮点性能 | 1.17 Tflops | 峰值单精度浮点性能 | 3.52 Tflops | 内存容量 | 5GB GDDR5 | 显存宽位 | 320-bit | 内存带宽 | 208 GB/秒 | 耗电量 | 225W | 需要辅助电源线 | 1根8针1根6针 | 保修政策 | 全国联保 | 质保时间 | 三年 | 详细内容 | Leadtek丽台的售后服务由厂商提供,产品出现非人为故障,并且属于正常保修范围内的产品,可享受免费保修。如出现产品质量问题或故障,可查询最近的维修点,由厂商售后解决。未经授权渠道购得的产品;擅自改装,拆机造成的损坏与故障;未依操作手册操作及人为操作不当所造成的损坏不在保修范围内。 | |
|
| Tesla K20X | Tesla K20 | Tesla K10 | Tesla M2090 | Tesla M2075 | GPU 的数量和类型 | 1 Kepler GK110 | 2 Kepler GK104s | 1 Fermi GPU | 1 Fermi GPU | GPU 计算应用 | 地震处理, 计算流体力学, 计算机辅助工程, 金融计算, 计算化学与物理学, 数据分析, 卫星成像, 天气建模 | 地震处理, 信号与图像处理, 视频分析 | 地震处理, 计算流体力学, 计算机辅助工程, 金融计算, 计算化学与物理学, 数据分析, 卫星成像, 天气建模 | 峰值双精度浮点性能 | 1.31 Tflops | 1.17 Tflops | 190 Gigaflops
(每颗 GPU 95 Gflops) | 665 Gigaflops | 515 Gigaflops | 峰值单精度浮点性能 | 3.95 Tflops | 3.52 Tflops | 4577 Gigaflops
(每颗 GPU 2288 Gflops) | 1331 Gigaflops | 1030 Gigaflops | 存储器带宽 (ECC关闭) | 250 GB / 秒 | 208 GB / 秒 | 320 GB / 秒
(每颗 GPU 160 GB / 秒) | 177 GB / 秒 | 150 GB / 秒 | 存储器容量 (GDDR5) | 6 GB | 5 GB | 8 GB
(每颗 GPU 4GB) | 6 GB | 6 GB | CUDA 核心数量 | 2688 | 2496 | 3072
(每颗 GPU 1536 个) | 512 | 448 |
注: 在启用 ECC 的情况下,12.5%的 GPU 存储器用于 ECC 数据位。 例如,在启用 ECC 的情况下,如果总容量为 3 GB,那么用户可用存储器容量为 2.625 GB。 更多GPU解决方案
▲Hyper-Q
▲Dynamic-Parallelism(动态并行)
主要应用
l医学影像 l石油和天然气勘探 l计算金融 l天气预报建模 l药物设计 l计算流体动力学
最流行
| [url=]Abaqus/Standard[/url]
• 1.5 - 2.5 倍速度提升*
支持的特性
• 直接稀疏解算程序
[url=]计算结构力学[/url] | [url=]AMBER[/url]
• 89.44 纳秒/天 JAC NVE 速度提升*
支持的特性
• PMEMD: 显性与隐性溶剂
[url=]分子动力学[/url] | [url=]ANSYS Mechanical[/url]
• 2-3 倍速度提升*
支持的特性
• 直接与迭代解算程序
[url=]计算结构力学[/url] | [url=]Chroma[/url]
• 8-9 倍速度提升* 768 颗 GPU 对阵 768 颗 (16核) CPU
支持的特性
• Wilson-clover 费密子, Krylov 解算程序, 域分解 | [url=]GeoVation CGG/Veritas RTM[/url]
• 加速情况未公开
支持的特性
• RTM 算法 | [url=]GROMACS[/url]
• 165 纳秒/天 DHFR 速度提升*
支持的特性
• 隐性 (5 倍)
• 显性 (2 倍) 溶剂
[url=]分子动力学[/url] | [url=]Impetus Afea[/url]
• 10 倍 SPH, 2 倍总体速度提升*
支持的特性
• 线性方程解算程序
[url=]计算结构力学[/url] | [url=]LAMMPS[/url]
• 3.5 - 15 倍速度提升*
支持的特性
• Lennard-Jones
• Gay-Berne
[url=]分子动力学[/url] | [url=]MathWorks MATLAB[/url]
• 2-20 倍速度提升*
支持的特性
• 针对 200 多个常用 MATLAB 函数的 GPU 加速
[url=]计算金融[/url] | [url=]MSC Nastran[/url]
• 1.5 倍速度提升*
支持的特性
• 线性方程解算程序
[url=]计算结构力学[/url] | [url=]NAMD[/url]
• 6.44 纳秒/天 STMV 585倍 2050s 速度提升*
支持的特性
• 非键力运算
• 支持 1 亿个原子
[url=]分子动力学[/url] | [url=]NWChem[/url]
• 3-10 倍速度提升*
支持的特性
• Reg-CCSD(T) 的三合物部分
• CCSD 与 EOMCCSD 任务调度程序
• 开发之中
[url=]计算化学[/url] | [url=]Paradigm Echos RTM[/url]
• 14 倍速度提升*
支持的特性
• RTM 算法 | [url=]Schlumberger WesternGeco Omega2 RTM[/url]
• 未公开
支持的特性
• 多种算法 (RTM 等等) | [url=]Tsunami RTM[/url]
• 5 倍速度提升*
支持的特性
• RTM 算法 | [url=]VASP[/url]
• 2 倍速度提升* 2 颗 GPU 对阵 128 个 CPU 核心
支持的特性
• 包括确切汇率在内的混合型 Hartree-Fock DFT 泛函 |
|
伊利诺斯州立大学Urbana-Champaign校区高级研究程序员John Stone | “我们研究的许多分子结构太大,可能需要或花费数周的时间来处理运行它们的物理仿真计算” 伊利诺斯州立大学Urbana-Champaign校区高级研究程序员John Stone说,“GPU计算技术使一些程序的处理效率提高了100倍,这些进步使得我们可以将之前只能在集群服务器中处理的一些计算工作转移到桌面型计算机中进行!NVIDIATesla通过更灵活的计算解决方案为此领域带来巨大进步” |
Headwave公司的系统整合副总裁Steve Briggs | “过去,地理和地震分析曾经是一个需要花费很多时间的批处理过程。” 总部位于休斯顿的地理可视化公司——Headwave公司的系统整合副总裁Steve Briggs说,“如果没有GPU技术近期的进步,不可能出现类似在墨西哥湾的Jack Field27000英尺下勘测到大型储油田的重大发现。今天NVIDIA的新品发布将使此类、甚至更为惊人的发现成为可能。” |
Acceleware公司首席技术官Ryan Schneider | “使用NVIDIA的计算硬件加速电磁仿真处理时间达25倍甚至更多—该技术已应用到复杂的医药产品分析优化中,这在两年前不曾有人设想过。” Acceleware公司首席技术官Ryan Schneider说。“NVIDIA和Acceleware的解决方案为计算电磁学开辟了新的领域” |
|