POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 1603|回复: 0
打印 上一主题 下一主题

[主板] nvidia tesla k80 实物图

  [复制链接]
跳转到指定楼层
1#
发表于 2015-2-10 09:21 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 eneiwstt 于 2015-2-10 09:22 编辑



北京思腾创新科技发展有限公司
联系人 温巍
电话 13301397412
QQ:499686668



NVIDIA要出Tesla K80的传闻之前就有了,8月份就有人从NVIDIA的驱动程序中发现了Tesla K80的蛛丝马迹,当时认为K80是基于双芯的GTX Titan Z,拥有5760个CUDA核心,显存容量甚至高达24GB,不过NVIDIA现在推出的Tesla K80有些奇怪,显存容量24GB倒是准了,但是核心并不是完整的GK110,而是全新的GK210,CUDA核心数量为2496个,不同于之前Titan显卡的2668个,也不同于GTX 780 Ti的2880个,也不是GTX 780的2304个。
从规格上来看,GK210核心的Tesla K80核心频率降低到了562MHz,加速频率875MHz,但性能要比之前的Tesla K40强,单精度浮点性能8.74TFLOPS,双精度浮点性能2.91FLOPS,即便是砍掉一半,GK210核心的性能看起来也要比GK110核心更强。

其他规格上,Tesla K80确实拥有2x12GB显存,位宽384bit,频率5GHz,带宽240GB/s,也有所降低,TDP功耗300W,被动散热,发布售价为5000美元,约合人民币30620元,比Tesla K40的5499美元还要便宜。

算上现在的这个GK210核心,NVIDIA在GK110家族中一共出了3个不同的GK110核心了,他们的完整版都是15组SMX单元,2880个CUDA核心,不过细节上有所不同,NVIDIA做了不同程度的调整。
andtech网站的GK110家族核心规格表
总的来说,NVIDIA并没有改变CUDA核心数或者CUDA的架构,他们改进的只是SMX单元之间的内存子系统,GK110(B)的SMX单元拥有256KB寄存器文件,64KB共享缓存,GK210的规模翻倍,拥有512KB寄存器文件,128KB共享缓存,因此它改进了SMX单元的数据吞吐量,提高了效率,确保CUDA核心的更容易频繁使用。


NVIDIA以前没有这么做过,这也是第一次看到GPU往这个方向改进。这也就是说,这反应了GPU市场的变化,而这也意味着Kepler在未来一段时间还会继续陪伴着我们。(Maxwell架构虽然高效,不过双精度设计上GK110还是更强,估计得到GM210之后再说更强的Tesla加速卡了。)

NVIDIA这么做是希望针对HPC市场改进他们的GPU,修正勘误表,降低功耗(同时也是提升性能),这也是他们为何能在300W TDP下作出双芯的Tesla K80(作为对比,GTX Titan Z使用的是完整版GK110核心,TDP为375W)。

还有一个问题就是GPU Boost技术,之前的Tesla K40加速卡上的GPU加速技术相比消费级GPU效果有限,严重受限于TDP,通常只有特定的3个加速频率,而Tesla K80上NVIDIA使用了与消费级GPU相同的GPU加速技术,只要TDP允许,K80会尽可能地加速。


Tesla K80是双芯设计,它的性能指标看起来比K40高得多,不过实际上不一定总是超过K40,因为单个GPU的规格比K40低,而且它的基础频率更低,不过K80主要的应用环境显然都是对多路GPU优化较好的,所以Tesla K80还是要快得多。


您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-4-28 03:11

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表