POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 6477|回复: 4
打印 上一主题 下一主题

gtx 680的单精度浮点运算能力怎么算的?

[复制链接]
跳转到指定楼层
1#
发表于 2013-3-27 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
为什么是3009TFLOPS=1006MHz*1536cuda core*2FlOPS/core?

为什么最后有个*2? 每个cuda每周期最多能够做两次浮点运算, 这个是什么意思? (为什么不是每周期最多一次运算?) 这两次浮点运算是几个线程?
2#
发表于 2013-3-27 19:46 | 只看该作者
FMA 一乘一加
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2013-3-27 22:06 | 只看该作者
rSKip 发表于 2013-3-27 19:46
FMA 一乘一加

不好意思啊具体指令集我不懂.

这个 "FMA" 是不是就是个函数, 然后 FMA(a,b,c)=a*b+c
然后这本身算是一个线程. 但是这个线程执行完毕后是算了两次浮点运算的.
如果c=0或者a=1也就是相当于算了乘法或加法了吗?

------
总之就是说, 是不是 "线程还是一个, 但是这个线程执行的内容最多可以包含两个浮点运算"?
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2013-3-27 22:09 | 只看该作者
rSKip 发表于 2013-3-27 19:46
FMA 一乘一加

另外, 以前8800gtx的g80我看计算浮点性能的时候, 似乎1个shader可以每周期算5个浮点运算, 是不是和这个也类似?

那个5个浮点运算是不是都是一个指令里的? 要充分利用好每一次周期的工作, 就要让代码跑起来后尽量每次都把5个浮点运算塞满, 这是不是就叫做 "优化" 了?
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2013-3-30 14:25 | 只看该作者
自顶      
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-7-23 00:48

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表