POPPUR爱换

标题: [转]泰坦? [打印本页]

作者: aibo    时间: 2013-2-12 02:22
标题: [转]泰坦?
本帖最后由 aibo 于 2013-2-12 02:26 编辑

转一张图
原文 http://in.inpai.com.cn/thread-2427-1-1.html
[attach]2166864[/attach]
节选
CL_DEVICE_GLOAL_MEN_SIZE   6442123264
CL_DEVICE_MAX_CLOCK_FREQUENCY  875
CL_DEVICE_MAX_COMPUTE_UNITS 14
CL_DEVICE_NAME GeForce GTX Titan
作者: Windyson    时间: 2013-2-12 02:46
看了一下复选GTX680,看来14SMX和384Bit是真的
作者: a9988a    时间: 2013-2-12 02:56
Windyson 发表于 2013-2-12 02:46
看了一下复选GTX680,看来14SMX和384Bit是真的

怎么看出来的?
作者: 2ndWeapon    时间: 2013-2-12 13:18
这么详细的数据都出来了啊,这货木有NDA?
作者: Xenomorph    时间: 2013-2-12 14:36
a9988a 发表于 2013-2-12 02:56
怎么看出来的?

对Kepler来说Compute Unit就是SMX;6G由24枚256M/16bit的显存实现,合计384bit……
作者: NORAWITHMYCALL    时间: 2013-2-12 14:53
光从CL给出的数据,我们不比较7970和所谓的TITAN,比较680来说,7970在绝大多数的细分项目下都胜过680,而2项是输掉的,一项原子操作,一项双调排序,特别是原子操作中,输掉很多。总体来说,AMD的底层性能根本不差,甚至很多项目好过NV,但是介于目前的生态圈建设,使得这样正面的优势,变的几乎荡然无存,甚至很多实际应用落败,这不得不说是AMD在软件上的弱势,至今没有开发出一套有效针对性的驱动。
作者: aibo    时间: 2013-2-12 15:25
本帖最后由 aibo 于 2013-2-12 15:25 编辑
NORAWITHMYCALL 发表于 2013-2-12 14:53
光从CL给出的数据,我们不比较7970和所谓的TITAN,比较680来说,7970在绝大多数的细分项目下都胜过680,而2 ...

nv的硬件架构延续性较好,而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd,硬件从vliw5到vliw4再到GCN。而且在软件基本没有投入过。或者说一直想依赖开源的opencl,但。。。。
作者: jhj9    时间: 2013-2-12 15:36
NORAWITHMYCALL 发表于 2013-2-12 14:53
光从CL给出的数据,我们不比较7970和所谓的TITAN,比较680来说,7970在绝大多数的细分项目下都胜过680,而2 ...

其实是NV一直没有拿出针对OPENCL的有效的驱动才对

NV不是靠OPENCL环境中的性能来打下通用计算的江山的
NV用自家的CUDA,再来和7970的OPENCL数据相比,7970恐怕没几项能胜了。

作者: NORAWITHMYCALL    时间: 2013-2-12 16:01
jhj9 发表于 2013-2-12 15:36
其实是NV一直没有拿出针对OPENCL的有效的驱动才对

NV不是靠OPENCL环境中的性能来打下通用计算的江山的 ...

大家都是假设,个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较,所以再这里讨论也没有任何实际依据。
作者: jhj9    时间: 2013-2-12 16:20
NORAWITHMYCALL 发表于 2013-2-12 16:01
大家都是假设,个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较,所以再这里讨论也没有任何 ...

当然不止是假说
比如GTX680 CUDA跑n-body可以达到1.6TFlops
而DirectX SDK里面的Demo,680只能跑到666GFlops,7970跑601GFlops
OPENCL下印象中7970可以跑到1TFlops左右

作者: Xenomorph    时间: 2013-2-12 16:45
aibo 发表于 2013-2-12 15:25
nv的硬件架构延续性较好,而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd,硬 ...

确实……
作者: NORAWITHMYCALL    时间: 2013-2-12 20:15
aibo 发表于 2013-2-12 15:25
nv的硬件架构延续性较好,而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd,硬 ...

GCN开始可能会改变这一情况,GCN的定位非常明确,就是为了大融合下的阶段产品。而NV如果不能在ARM助力完成GPU加速的话达到整体性能突飞猛进后,那么NV的未来不乐观。AMD和NV已经比拼不单是GPU,即使是INTEL都不能忽视AMD在这方面的巨大潜力,虽然他现在可以继续卖高价CPU。
作者: Vendicare    时间: 2013-2-13 00:17
本帖最后由 Vendicare 于 2013-2-13 00:19 编辑
NORAWITHMYCALL 发表于 2013-2-12 16:01
大家都是假设,个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较,所以再这里讨论也没有任何 ...



都不了解,你还说啥呢?评论一个自己不懂的东西好玩不?

CUDA C最终编译生成的是ptx代码,而opencl最终编译生成的是API执行文件。前者可以直接在geforce上跑,而后者需要借助虚拟机。简单来说CUDA和OpenCL对于GPU就类似于C和C#对于CPU。两者效率有什么可比性?!

网上比较多了去了,结果一边倒只是你不愿意看而已。附件上传给你,爱看不看。
[attach]2167024[/attach]



作者: clawhammer    时间: 2013-2-13 00:25
看来14SMX,384bit 6G的规格是错不了的了




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4