[转]泰坦?

aibo · 发表于 2013-2-12 02:22

本帖最后由 aibo 于 2013-2-12 02:26 编辑

转一张图
原文 http://in.inpai.com.cn/thread-2427-1-1.html

节选
CL_DEVICE_GLOAL_MEN_SIZE 6442123264
CL_DEVICE_MAX_CLOCK_FREQUENCY 875
CL_DEVICE_MAX_COMPUTE_UNITS 14
CL_DEVICE_NAME GeForce GTX Titan

Windyson · 发表于 2013-2-12 02:46

看了一下复选GTX680，看来14SMX和384Bit是真的

a9988a · 发表于 2013-2-12 02:56

Windyson 发表于 2013-2-12 02:46
看了一下复选GTX680，看来14SMX和384Bit是真的

怎么看出来的？

2ndWeapon · 发表于 2013-2-12 13:18

这么详细的数据都出来了啊，这货木有NDA？

Xenomorph · 发表于 2013-2-12 14:36

a9988a 发表于 2013-2-12 02:56
怎么看出来的？

对Kepler来说Compute Unit就是SMX；6G由24枚256M/16bit的显存实现，合计384bit……

NORAWITHMYCALL · 发表于 2013-2-12 14:53

光从CL给出的数据，我们不比较7970和所谓的TITAN，比较680来说，7970在绝大多数的细分项目下都胜过680，而2项是输掉的，一项原子操作，一项双调排序，特别是原子操作中，输掉很多。总体来说，AMD的底层性能根本不差，甚至很多项目好过NV，但是介于目前的生态圈建设，使得这样正面的优势，变的几乎荡然无存，甚至很多实际应用落败，这不得不说是AMD在软件上的弱势，至今没有开发出一套有效针对性的驱动。

aibo · 发表于 2013-2-12 15:25

本帖最后由 aibo 于 2013-2-12 15:25 编辑

NORAWITHMYCALL 发表于 2013-2-12 14:53
光从CL给出的数据，我们不比较7970和所谓的TITAN，比较680来说，7970在绝大多数的细分项目下都胜过680，而2 ...

nv的硬件架构延续性较好，而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd，硬件从vliw5到vliw4再到GCN。而且在软件基本没有投入过。或者说一直想依赖开源的opencl，但。。。。

jhj9 · 发表于 2013-2-12 15:36

NORAWITHMYCALL 发表于 2013-2-12 14:53
光从CL给出的数据，我们不比较7970和所谓的TITAN，比较680来说，7970在绝大多数的细分项目下都胜过680，而2 ...

其实是NV一直没有拿出针对OPENCL的有效的驱动才对

NV不是靠OPENCL环境中的性能来打下通用计算的江山的
NV用自家的CUDA，再来和7970的OPENCL数据相比，7970恐怕没几项能胜了。

NORAWITHMYCALL · 发表于 2013-2-12 16:01

jhj9 发表于 2013-2-12 15:36
其实是NV一直没有拿出针对OPENCL的有效的驱动才对

NV不是靠OPENCL环境中的性能来打下通用计算的江山的 ...

大家都是假设，个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较，所以再这里讨论也没有任何实际依据。

jhj9 · 发表于 2013-2-12 16:20

NORAWITHMYCALL 发表于 2013-2-12 16:01
大家都是假设，个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较，所以再这里讨论也没有任何 ...

当然不止是假说
比如GTX680 CUDA跑n-body可以达到1.6TFlops
而DirectX SDK里面的Demo，680只能跑到666GFlops，7970跑601GFlops
OPENCL下印象中7970可以跑到1TFlops左右

Xenomorph · 发表于 2013-2-12 16:45

aibo 发表于 2013-2-12 15:25
nv的硬件架构延续性较好，而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd，硬 ...

确实……

NORAWITHMYCALL · 发表于 2013-2-12 20:15

aibo 发表于 2013-2-12 15:25
nv的硬件架构延续性较好，而且这几年一直不遗余力支持通用计算的发展。生态圈子已经有雏形了
反观amd，硬 ...

GCN开始可能会改变这一情况，GCN的定位非常明确，就是为了大融合下的阶段产品。而NV如果不能在ARM助力完成GPU加速的话达到整体性能突飞猛进后，那么NV的未来不乐观。AMD和NV已经比拼不单是GPU，即使是INTEL都不能忽视AMD在这方面的巨大潜力，虽然他现在可以继续卖高价CPU。

Vendicare · 发表于 2013-2-13 00:17

本帖最后由 Vendicare 于 2013-2-13 00:19 编辑

NORAWITHMYCALL 发表于 2013-2-12 16:01
大家都是假设，个人认为CUDA真不见得比OPENCL更出色。因为没有这方面相关比较，所以再这里讨论也没有任何 ...

都不了解，你还说啥呢？评论一个自己不懂的东西好玩不？

CUDA C最终编译生成的是ptx代码，而opencl最终编译生成的是API执行文件。前者可以直接在geforce上跑，而后者需要借助虚拟机。简单来说CUDA和OpenCL对于GPU就类似于C和C#对于CPU。两者效率有什么可比性？！

网上比较多了去了，结果一边倒只是你不愿意看而已。附件上传给你，爱看不看。

clawhammer · 发表于 2013-2-13 00:25

看来14SMX，384bit 6G的规格是错不了的了

帐号		自动登录	找回密码
密码			注册

[转]泰坦?

本帖子中包含更多资源

本帖子中包含更多资源

浏览过的版块