POPPUR爱换

标题: INTEL MIC性能出来了 [打印本页]

作者: PRAM    时间: 2011-6-10 21:45
标题: INTEL MIC性能出来了
[attach]1551865[/attach]
作者: PRAM    时间: 2011-6-10 21:47
每个CORE 40GFLOS/DP,22NM 50C, 双精度FP就是2T,光比FP,intel不差的,差的是GPU的各种软件
作者: potomac    时间: 2011-6-10 22:50
提示: 作者被禁止或删除 内容自动屏蔽
作者: eGenius    时间: 2011-6-10 22:56
玩儿空档接龙太奢侈了吧
作者: disruptor    时间: 2011-6-10 23:10
990x的dp性能有这么高?不是峰值是100多g吗
作者: disruptor    时间: 2011-6-10 23:13
经证实lz给的不是dp性能,不要在这里yy了
作者: asdfjkl    时间: 2011-6-10 23:23
本帖最后由 asdfjkl 于 2011-6-10 23:23 编辑
disruptor 发表于 2011-6-10 23:13
经证实lz给的不是dp性能,不要在这里yy了


那是什么? 是sp的性能吗?

要是可以做到单卡2T的dp,那AMD和NV的加速卡与之相比真是差距巨大,大概是这个0.25 or 0.33。

作者: rickerlian    时间: 2011-6-10 23:49
1t dp,我很怀疑
作者: PRAM    时间: 2011-6-11 09:05
disruptor 发表于 2011-6-10 23:10
990x的dp性能有这么高?不是峰值是100多g吗

是2X990.12C

作者: PRAM    时间: 2011-6-11 09:06
snb 8C=256g  (dp)   6c=192G(DP),cpu的FP都是DP的
作者: PRAM    时间: 2011-6-11 09:15


作者: PRAM    时间: 2011-6-11 09:15
CPU的FP都是DP的
作者: SNB    时间: 2011-6-11 10:02
LZ这个ppt是哪里来的?
作者: PRAM    时间: 2011-6-11 10:18
SNB 发表于 2011-6-11 10:02
LZ这个ppt是哪里来的?

那一个?第一个是INTEL在斯坦福发表的,第二个是龙芯发表的

作者: samsunggram    时间: 2011-6-11 10:22
11楼的图让我无比泪目 瓷器的经费真这么好骗...
作者: the_god_of_pig    时间: 2011-6-11 10:46
啥玩艺?
LRB尸体?
作者: kretz    时间: 2011-6-11 14:06
       完全看不懂!

作者: disruptor    时间: 2011-6-11 15:03
两个u也顶多200g的水平,吹了50%的牛。另外以fermi为例,双精度达到1t也不是什么难事,基本上就是核心频率1ghz,shader2g左右。如果用intel的制造工艺在标称上达到死骑的水平没有任何问题,更何况fermi还有那么大的rop,更何况fermi这一代主要还是在完善功能,更何况fermi拥有20000+的线程执行能力。效率较死骑肯定高出不少,开普勒一出谁与争锋
作者: PRAM    时间: 2011-6-11 15:47
disruptor 发表于 2011-6-11 15:03
两个u也顶多200g的水平,吹了50%的牛。另外以fermi为例,双精度达到1t也不是什么难事,基本上就是核心频率1 ...

两个u也顶多200g的水平?你怎么知道,3.3的频率150G 没问题的,下一代MIC是2T,比所谓开普勒高一倍
作者: PRAM    时间: 2011-6-11 15:52
disruptor 发表于 2011-6-11 15:03
两个u也顶多200g的水平,吹了50%的牛。另外以fermi为例,双精度达到1t也不是什么难事,基本上就是核心频率1 ...

这么多“更何况”全部是更何况,更何况1T的龙芯都在搞呢,更何况fermi的功耗,更何况TSMC 28一拖再拖

作者: PRAM    时间: 2011-6-11 15:53
更何况KNF 在22,频率可以更高,更何况开普勒出来,KNF可以增加到64C
作者: asdfjkl    时间: 2011-6-11 16:21
PRAM 发表于 2011-6-11 09:06
snb 8C=256g  (dp)   6c=192G(DP),cpu的FP都是DP的

如果你用snb的性能,请也要用snb的功耗去估算;
这样的话,就不是那么容易做50core。

作者: PRAM    时间: 2011-6-11 16:23
asdfjkl 发表于 2011-6-11 16:21
如果你用snb的性能,请也要用snb的功耗去估算;
这样的话,就不是那么容易做50core。

50C是顺序的简单CORE
作者: asdfjkl    时间: 2011-6-11 16:48
PRAM 发表于 2011-6-11 16:23
50C是顺序的简单CORE

目前还没有上市的AMD推土机Interlogas的core, 单个core一个周期可以完成4次DP运算。
十核心/30MB缓存:Intel 32nm Xeon,推算先来单个core一个周期也是完成4次DP运算。

这两种core的架构应该是很先进的,比以前的x86的core在DP运算上的表现有很大的提升。
如果Intel的KNF也用这种core,50core+1G = 200G DP/s.

如果单个core有40G DP,意味着单个core一个周期可以完成40次DP运算;这和目前的x86核心已经完全不是一个档次了。
功耗上,50core < 300W,因此每个core <6W 提供40G DP能力。做到了只能说很牛!


作者: PRAM    时间: 2011-6-11 16:53
asdfjkl 发表于 2011-6-11 16:48
目前还没有上市的AMD推土机Interlogas的core, 单个core一个周期可以完成4次DP运算。
十核心/30MB缓存:I ...

SIMD加到了512BIT




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4