POPPUR爱换

标题: [转]泰坦? [打印本页]

作者: aibo 时间: 2013-2-12 02:22
标题: [转]泰坦?
本帖最后由 aibo 于 2013-2-12 02:26 编辑

转一张图
原文 http://in.inpai.com.cn/thread-2427-1-1.html
[attach]2166864[/attach]
节选
CL_DEVICE_GLOAL_MEN_SIZE 6442123264
CL_DEVICE_MAX_CLOCK_FREQUENCY 875
CL_DEVICE_MAX_COMPUTE_UNITS 14
CL_DEVICE_NAME GeForce GTX Titan

作者: Windyson 时间: 2013-2-12 02:46
看了一下复选GTX680，看来14SMX和384Bit是真的

作者: a9988a 时间: 2013-2-12 02:56

Windyson 发表于 2013-2-12 02:46
看了一下复选GTX680，看来14SMX和384Bit是真的

怎么看出来的？

作者: 2ndWeapon 时间: 2013-2-12 13:18
这么详细的数据都出来了啊，这货木有NDA？

作者: Xenomorph 时间: 2013-2-12 14:36

a9988a 发表于 2013-2-12 02:56
怎么看出来的？

对Kepler来说Compute Unit就是SMX；6G由24枚256M/16bit的显存实现，合计384bit……

作者: NORAWITHMYCALL 时间: 2013-2-12 14:53
光从CL给出的数据，我们不比较7970和所谓的TITAN，比较680来说，7970在绝大多数的细分项目下都胜过680，而2项是输掉的，一项原子操作，一项双调排序，特别是原子操作中，输掉很多。总体来说，AMD的底层性能根本不差，甚至很多项目好过NV，但是介于目前的生态圈建设，使得这样正面的优势，变的几乎荡然无存，甚至很多实际应用落败，这不得不说是AMD在软件上的弱势，至今没有开发出一套有效针对性的驱动。

作者: aibo 时间: 2013-2-12 15:25
本帖最后由 aibo 于 2013-2-12 15:25 编辑

NORAWITHMYCALL 发表于 2013-2-12 14:53
光从CL给出的数据，我们不比较7970和所谓的TITAN，比较680来说，7970在绝大多数的细分项目下都胜过680，而2 ...

nv的硬件架构延续性较好，而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd，硬件从vliw5到vliw4再到GCN。而且在软件基本没有投入过。或者说一直想依赖开源的opencl，但。。。。

作者: jhj9 时间: 2013-2-12 15:36

NORAWITHMYCALL 发表于 2013-2-12 14:53
光从CL给出的数据，我们不比较7970和所谓的TITAN，比较680来说，7970在绝大多数的细分项目下都胜过680，而2 ...

其实是NV一直没有拿出针对OPENCL的有效的驱动才对

NV不是靠OPENCL环境中的性能来打下通用计算的江山的
NV用自家的CUDA，再来和7970的OPENCL数据相比，7970恐怕没几项能胜了。

作者: NORAWITHMYCALL 时间: 2013-2-12 16:01

jhj9 发表于 2013-2-12 15:36
其实是NV一直没有拿出针对OPENCL的有效的驱动才对

NV不是靠OPENCL环境中的性能来打下通用计算的江山的 ...

大家都是假设，个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较，所以再这里讨论也没有任何实际依据。

作者: jhj9 时间: 2013-2-12 16:20

NORAWITHMYCALL 发表于 2013-2-12 16:01
大家都是假设，个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较，所以再这里讨论也没有任何 ...

当然不止是假说
比如GTX680 CUDA跑n-body可以达到1.6TFlops
而DirectX SDK里面的Demo，680只能跑到666GFlops，7970跑601GFlops
OPENCL下印象中7970可以跑到1TFlops左右

作者: Xenomorph 时间: 2013-2-12 16:45

aibo 发表于 2013-2-12 15:25
nv的硬件架构延续性较好，而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd，硬 ...

确实……

作者: NORAWITHMYCALL 时间: 2013-2-12 20:15

aibo 发表于 2013-2-12 15:25
nv的硬件架构延续性较好，而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd，硬 ...

GCN开始可能会改变这一情况，GCN的定位非常明确，就是为了大融合下的阶段产品。而NV如果不能在ARM助力完成GPU加速的话达到整体性能突飞猛进后，那么NV的未来不乐观。AMD和NV已经比拼不单是GPU，即使是INTEL都不能忽视AMD在这方面的巨大潜力，虽然他现在可以继续卖高价CPU。

作者: Vendicare 时间: 2013-2-13 00:17
本帖最后由 Vendicare 于 2013-2-13 00:19 编辑

NORAWITHMYCALL 发表于 2013-2-12 16:01
大家都是假设，个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较，所以再这里讨论也没有任何 ...

都不了解，你还说啥呢？评论一个自己不懂的东西好玩不？

CUDA C最终编译生成的是ptx代码，而opencl最终编译生成的是API执行文件。前者可以直接在geforce上跑，而后者需要借助虚拟机。简单来说CUDA和OpenCL对于GPU就类似于C和C#对于CPU。两者效率有什么可比性？！

网上比较多了去了，结果一边倒只是你不愿意看而已。附件上传给你，爱看不看。
[attach]2167024[/attach]

作者: clawhammer 时间: 2013-2-13 00:25

看来14SMX，384bit 6G的规格是错不了的了

欢迎光临 POPPUR爱换 (https://we.poppur.com/)