POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 1783|回复: 1
打印 上一主题 下一主题

3倍性能从哪里来,GK110的SMX单元升级3.5代

[复制链接]
跳转到指定楼层
1#
发表于 2012-5-17 13:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 gzeasy2006 于 2012-5-17 14:47 编辑

这两天时值GTC 2012大会,NVIDIA也在会上公布了一系列软硬件平台,既有涉及云计算的GeForce GRID、VPX GPU虚拟化技术,也有CUDA 5.0、GPU编程这样针对开发者的应用,当然最主要的是GK110架构的Tesla K20加速卡。
  虽然NVIDIA没有公布,但是我们可以猜测一下,GK110架构肯定也会有对应的显卡产品,只不过具体命名就有多种可能了,GTX 685还是更直接的下一代GTX 780?考虑到GK110要到第四季度才会发布,到时可能会直面AMD的海岛家族HD 8000系列了,估计命名为GTX 780的可能性更大。

  PCGH网站报道,两名Kepler开发人员Lars Nyland和Stephen Jones花了近一个小时的时间详细讨论了GK110的架构设计。GK110的SMX单元设计虽然跟GK104都是192个CUDA核心,但是GK104是第三代SMX架构(前两代是GF100的32个、GF104的48个),而GK110算是3.5代,其每组SMX单元增加了4个额外的16-block双精度浮点单元,大幅提升了GK110的双精度浮点运算能力,而DGEMM性能也因此增加,比上一代价格高出80%以上。

  第二个重要的改变是GK110核心中运行的每个线程现在可以分配多达255个(32bit)寄存器(register),而Fermi架构只有63个,即便寄存器的总数没有变化,双精度浮点运算也会因此受益。

  另外,NVIDIA官方资料上显示的GK110架构确实是15组SMX单元,但是围绕这个15组SMX的具体争论也没有停止,昨天的资料显示GK110只有15组SMX单元,但是实际启用的可能是14组,CUDA核心为2688个,不过今天Guru3D又称GK110实际上还是16组SMX单元,资料上15组是屏蔽后的结果,理论上是3072个CUDA核心,实际启用了2880个。(类似GTX 480时代那样)。
  






2#
发表于 2012-5-17 14:08 | 只看该作者
全挂了,重新贴图吧。。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-17 23:10

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表