POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 16973|回复: 0
打印 上一主题 下一主题

[显卡] NVIDIA Tesla M40 P40 P100 高性能运算GPU

[复制链接]
跳转到指定楼层
1#
发表于 2017-3-16 12:02 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式







【PConline 快讯】本周二(9月13日),在北京召开的GTC 2016技术大会上,NVIDIA CEO黄仁勋亲自发布了新一代高性能计算卡Tesla P40、Tesla P4,专为人工智能、深度学习、神经网络推演而生!
  
  这两款产品将取代上代麦克斯韦架构的Tesla M40/M4,当然用了最新的帕斯卡架构(你们看命名就知道了... P代表Pascal),16nm妥妥的。
  
  
  Tesla P40基于高端大核心GP100,并且开启全部 3840个流处理器(此前的Titan X只有3584个),核心频率1303-1531MHz,FP32单精度浮点计算能力12 TFlops,INT8(八位数据专用推理指令) 处理性能高达 47 TOPS,响应速度比CPU快45倍。
  该卡搭配384-bit 24GB GDDR5显存,等效显存频率为7.2Gbps,整卡功耗250W,采用被动式散热。(没错!真的是被动)值得一提的是,同是GP100大核心的Tesla P100也只开启了3584个流处理器,(比P40要少)。
  
  Tesla P4的核心则是GTX 1080/1070同款的GP104,全部2560个流处理器,核心频率只有810-1063MHz,单精度性能5.5TFlops,INT8 22TOPS,搭配256-bit 6Gbps 8GB GDDR5显存,功耗50-75W,半高被动散热。并且长度只有一根铅笔那么长!
  相比于前辈,P4/P40的计算性能分别提升了70%、1.5倍,INT8特性也是首次加入,但功耗维持不变。
  
  NVIDIA表示, Tesla P40可提供非常高的深度学习工作负载处理能力,一台配备八块Tesla P40加速器的服务器在性能上可媲美140多台CPU服务器,同时成本节省超过65万美元。
  Tesla P4则可为超大规模数据中心提供极高的能效, 一台配备单个Tesla P4的服务器可以取代13台CPU服务器,总体拥有成本可 节省超过800%
  
  同时,NVIDIA还发布了两款配套的开发工具:TensorRT是为优化将部署到生产环境的深度学习模型而创建的库,能即时响应极其复杂的网络;DeepStream SDK则利用帕斯卡务器的强大功能同时,对最多达93路的高清视频流进行实时解码和分析。









您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-4-26 14:14

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表