POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3159|回复: 13
打印 上一主题 下一主题

[转]泰坦?

[复制链接]
跳转到指定楼层
1#
发表于 2013-2-12 02:22 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 aibo 于 2013-2-12 02:26 编辑

转一张图
原文 http://in.inpai.com.cn/thread-2427-1-1.html

节选
CL_DEVICE_GLOAL_MEN_SIZE   6442123264
CL_DEVICE_MAX_CLOCK_FREQUENCY  875
CL_DEVICE_MAX_COMPUTE_UNITS 14
CL_DEVICE_NAME GeForce GTX Titan

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
发表于 2013-2-12 02:46 | 只看该作者
看了一下复选GTX680,看来14SMX和384Bit是真的
回复 支持 反对

使用道具 举报

3#
发表于 2013-2-12 02:56 | 只看该作者
Windyson 发表于 2013-2-12 02:46
看了一下复选GTX680,看来14SMX和384Bit是真的

怎么看出来的?
回复 支持 反对

使用道具 举报

4#
发表于 2013-2-12 13:18 | 只看该作者
这么详细的数据都出来了啊,这货木有NDA?
回复 支持 反对

使用道具 举报

5#
发表于 2013-2-12 14:36 | 只看该作者
a9988a 发表于 2013-2-12 02:56
怎么看出来的?

对Kepler来说Compute Unit就是SMX;6G由24枚256M/16bit的显存实现,合计384bit……
回复 支持 反对

使用道具 举报

6#
发表于 2013-2-12 14:53 | 只看该作者
光从CL给出的数据,我们不比较7970和所谓的TITAN,比较680来说,7970在绝大多数的细分项目下都胜过680,而2项是输掉的,一项原子操作,一项双调排序,特别是原子操作中,输掉很多。总体来说,AMD的底层性能根本不差,甚至很多项目好过NV,但是介于目前的生态圈建设,使得这样正面的优势,变的几乎荡然无存,甚至很多实际应用落败,这不得不说是AMD在软件上的弱势,至今没有开发出一套有效针对性的驱动。
回复 支持 反对

使用道具 举报

7#
 楼主| 发表于 2013-2-12 15:25 | 只看该作者
本帖最后由 aibo 于 2013-2-12 15:25 编辑
NORAWITHMYCALL 发表于 2013-2-12 14:53
光从CL给出的数据,我们不比较7970和所谓的TITAN,比较680来说,7970在绝大多数的细分项目下都胜过680,而2 ...

nv的硬件架构延续性较好,而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd,硬件从vliw5到vliw4再到GCN。而且在软件基本没有投入过。或者说一直想依赖开源的opencl,但。。。。
回复 支持 反对

使用道具 举报

8#
发表于 2013-2-12 15:36 | 只看该作者
NORAWITHMYCALL 发表于 2013-2-12 14:53
光从CL给出的数据,我们不比较7970和所谓的TITAN,比较680来说,7970在绝大多数的细分项目下都胜过680,而2 ...

其实是NV一直没有拿出针对OPENCL的有效的驱动才对

NV不是靠OPENCL环境中的性能来打下通用计算的江山的
NV用自家的CUDA,再来和7970的OPENCL数据相比,7970恐怕没几项能胜了。
回复 支持 反对

使用道具 举报

9#
发表于 2013-2-12 16:01 | 只看该作者
jhj9 发表于 2013-2-12 15:36
其实是NV一直没有拿出针对OPENCL的有效的驱动才对

NV不是靠OPENCL环境中的性能来打下通用计算的江山的 ...

大家都是假设,个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较,所以再这里讨论也没有任何实际依据。
回复 支持 反对

使用道具 举报

10#
发表于 2013-2-12 16:20 | 只看该作者
NORAWITHMYCALL 发表于 2013-2-12 16:01
大家都是假设,个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较,所以再这里讨论也没有任何 ...

当然不止是假说
比如GTX680 CUDA跑n-body可以达到1.6TFlops
而DirectX SDK里面的Demo,680只能跑到666GFlops,7970跑601GFlops
OPENCL下印象中7970可以跑到1TFlops左右
回复 支持 反对

使用道具 举报

11#
发表于 2013-2-12 16:45 | 只看该作者
aibo 发表于 2013-2-12 15:25
nv的硬件架构延续性较好,而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd,硬 ...

确实……
回复 支持 反对

使用道具 举报

12#
发表于 2013-2-12 20:15 | 只看该作者
aibo 发表于 2013-2-12 15:25
nv的硬件架构延续性较好,而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd,硬 ...

GCN开始可能会改变这一情况,GCN的定位非常明确,就是为了大融合下的阶段产品。而NV如果不能在ARM助力完成GPU加速的话达到整体性能突飞猛进后,那么NV的未来不乐观。AMD和NV已经比拼不单是GPU,即使是INTEL都不能忽视AMD在这方面的巨大潜力,虽然他现在可以继续卖高价CPU。
回复 支持 反对

使用道具 举报

13#
发表于 2013-2-13 00:17 | 只看该作者
本帖最后由 Vendicare 于 2013-2-13 00:19 编辑
NORAWITHMYCALL 发表于 2013-2-12 16:01
大家都是假设,个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较,所以再这里讨论也没有任何 ...



都不了解,你还说啥呢?评论一个自己不懂的东西好玩不?

CUDA C最终编译生成的是ptx代码,而opencl最终编译生成的是API执行文件。前者可以直接在geforce上跑,而后者需要借助虚拟机。简单来说CUDA和OpenCL对于GPU就类似于C和C#对于CPU。两者效率有什么可比性?!

网上比较多了去了,结果一边倒只是你不愿意看而已。附件上传给你,爱看不看。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

14#
发表于 2013-2-13 00:25 | 只看该作者
看来14SMX,384bit 6G的规格是错不了的了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-3 10:04

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表