POPPUR爱换

标题: NVIDIA与AMD的悲剧!32核心!Intel MIC Knights Ferry首曝!CPU还是独立显卡? [打印本页]

作者: fbiciansa    时间: 2010-8-11 13:48
标题: NVIDIA与AMD的悲剧!32核心!Intel MIC Knights Ferry首曝!CPU还是独立显卡?
本帖最后由 fbiciansa 于 2010-8-11 14:26 编辑

Intel公司于日前正式公布了其面向服务器的MIC (many Intel cores)加速器的参数情况。其首款产品代号为Knights Ferry,与之前已经被Intel公司取消的图形处理器产品Larrabee十分相似。
      据Intel官方资料显示,Knights Ferry内置32颗X86处理器核心,频率为1.2GHz,支持quad-HyperThreading技术。相关产品将会基于PCI Express 2.0插槽,配备有最多2G GDDR5内存,处理器芯片内置8M L2缓存。这点让人觉得非常有趣,因为高度并行应用并不需要如此之大的缓存。Intel并没有透露Knights Ferry的计算性能到底达到了多少GigaFLOPS或TeraFLOPS。
     与NVIDIA的Tesla和AMD的FireStream类似,Intel的MIC也属于计算加速器,通过PCI Express 2.0插槽与主机进行沟通和工作。
     考虑到Knights Ferry并不是一款商业化产品,而是一个开发平台,因此目前还不清楚这款主要面向开发团队的芯片产品有何特别的性能。
     Intel公司一直坚持HPC应用兼容X86指令集将会获得益处。与此同时AMD和NVIDIA则向HPC客户出售着其独有的FireStream 和Tesla计算卡。
     MIC Knights Corner在应用方面主要面向勘探、科研、金融、气候模拟等高性能计算(HPC)领域。但从目前情况来看,尚不知其性能到底如何。MIC架构和Xeon处理器之间的Intel通用软件工具和优化技术会支持多种不同形式的编程模型(支持C/C++/Fortran),在兼容性方面Intel显得信心十足。


                            Aubrey isle处理器内核照片



                       从研究项目到实际产品:Intel MIC架构

                         Intel MIC是一个加速协处理器架构

                            MIC架构编程特点

                               IA架构编程弹性

                           Knights Ferry开发卡性能概要

                            Knights Ferry 22nm工艺

    Intel副总裁兼数据中心事业部总经理Kirk Skaugen在ISC大会上演讲



                    Kirk Skaugen手持22nm SRAM测试晶圆

                    Kirk Skaugen手持Knights Ferry开发卡
作者: luckissy    时间: 2010-8-11 13:51
能揭开看看就好了
作者: fuxingchina    时间: 2010-8-11 13:53
提示: 作者被禁止或删除 内容自动屏蔽
作者: asdf666    时间: 2010-8-11 14:05
其实现在看来INTEL的显卡性能也不是想象中那么差
我的笔记本4820t     i5 450m的集成显卡  
12流处理器  4ROP  频率不清楚  貌似是500

跑06能有2100     玩WOW  中低特效  在沙城   有20多帧
跑06和WOW分辨率都是1366*768

桌面版的相信性能还能多至少百分之十吧。。
作者: royalss0    时间: 2010-8-11 14:11
quad-HyperThreading?4路HT?128线程,相当于128SP?这规模应该不是今年的显卡水平
作者: 河蟹万岁    时间: 2010-8-11 14:12
不当显卡卖还能卖贵点
作者: royalss0    时间: 2010-8-11 14:32
不当显卡卖还能卖贵点
河蟹万岁 发表于 2010-8-11 14:12



    所以蜡笔没掉了,INTEL还是有自知之明的

不然32X4    128SP    刚刚G80/RV740的水平情何以堪啊
作者: Q神    时间: 2010-8-11 14:49
做图形和高并发浮点运算,intel还得练练




作者: earcandy    时间: 2010-8-11 15:06
Larrabee原地满状态复活
作者: the_god_of_pig    时间: 2010-8-11 15:09
貌似那个是二世?
作者: itany    时间: 2010-8-11 15:23
其实现在看来INTEL的显卡性能也不是想象中那么差
我的笔记本4820t     i5 450m的集成显卡  
12流处理器   ...
asdf666 发表于 2010-8-11 14:05


不是一个架构的,不能比
作者: Edison    时间: 2010-8-11 15:26
几个月前的文字和图片还好意思说首爆。
作者: itany    时间: 2010-8-11 15:28
quad-HyperThreading?4路HT?128线程,相当于128SP?这规模应该不是今年的显卡水平
royalss0 发表于 2010-8-11 14:11


能这么比么?
Intel用的是16路SIMD指令,按照AMD的说法,相当于32x16=512SP
而且Intel这个能跑2GHz
作者: patrick47    时间: 2010-8-11 15:28
还是不差啊。
作者: itany    时间: 2010-8-11 15:29
本坛的SNB大仙一经拿到了实物,还是两片……
要小道消息的找他就行了
作者: gzpony    时间: 2010-8-11 15:37
能这么比么?
Intel用的是16路SIMD指令,按照AMD的说法,相当于32x16=512SP
而且Intel这个能跑2GHz
itany 发表于 2010-8-11 15:28



    不是同一种结构,无法这样对比。
等intel的实物出来,跑一下测试程序才能说明和NV,AMD相比如何。
作者: Edison    时间: 2010-8-11 15:38
能这么比么?
Intel用的是16路SIMD指令,按照AMD的说法,相当于32x16=512SP
而且Intel这个能跑2GHz
itany 发表于 2010-8-11 15:28


Intel 现在提供给院校的 Larrabee 是 1.2 TFLOPS 单精度,双精度 150GFLOPS,最大 2GB,256-bit,功耗 300 瓦,没有片上 ECC,没有 D3D 驱动。
作者: itany    时间: 2010-8-11 15:38
不是同一种结构,无法这样对比。
等intel的实物出来,跑一下测试程序才能说明和NV,AMD相比如何 ...
gzpony 发表于 2010-8-11 15:37


Intel实物一经出来了
作者: itany    时间: 2010-8-11 15:40
Intel 现在提供给院校的 Larrabee 是 1.2 TFLOPS 单精度,双精度 150GFLOPS,最大 2GB,256-bit,功耗  ...
Edison 发表于 2010-8-11 15:38


为什么双精度才150G啊?
和之前的理论数据差距这么多?
作者: frankincense    时间: 2010-8-11 15:58
32nm的300W,和Fermi相比在可编程性上有优势,但是功耗,性能,和一些基本的支持与已经比较悲剧的 ...
darkstorm 发表于 2010-8-11 15:47



   
Larrabee的300W似乎是45nm工艺的
作者: royalss0    时间: 2010-8-11 16:01
本帖最后由 royalss0 于 2010-8-11 16:05 编辑
能这么比么?
Intel用的是16路SIMD指令,按照AMD的说法,相当于32x16=512SP
而且Intel这个能跑2GHz
itany 发表于 2010-8-11 15:28



    这么算的话SP数量上能与TESLA2持平,但是那个QHT怎么理解?

    NV SM好像是相当于8路SIMD?
作者: hadeszhang    时间: 2010-8-11 16:05
这个东西基本上就是英特尔信奉春哥以后,Larrabee满血满状态复活的一个东西,而且还是处于验证阶段,离费米的实际运用,特别是效能上还有比较大的差距,所以NV表示蛋定,而且还比较鄙视,但是以英特尔的研发能力来看,以后NV在HPC市场上不会太寂寞。
至于AMD,还是先去玩完OPENCL再说。
作者: hadeszhang    时间: 2010-8-11 16:06
不过楼主这个消息的确是有点落伍了
作者: Edison    时间: 2010-8-11 16:12
为什么双精度才150G啊?
和之前的理论数据差距这么多?
itany 发表于 2010-8-11 15:40


Intel 选择了 1/8 比例。

目前版本的 LRB 双精度性能差其实之前 Prescott 也都说过一下。
作者: PaulWong    时间: 2010-8-11 16:15
我是来看楼主的假首爆的。
作者: 380    时间: 2010-8-11 17:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2010-8-11 18:45
Intel 选择了 1/8 比例。

目前版本的 LRB 双精度性能差其实之前 Prescott 也都说过一下。
Edison 发表于 2010-8-11 16:12


靠,真没意思,还以为和普通CPU一样是1/2呢
作者: itany    时间: 2010-8-11 18:47
这么算的话SP数量上能与TESLA2持平,但是那个QHT怎么理解?

    NV SM好像是相当于8路 ...
royalss0 发表于 2010-8-11 16:01


这个和LGPU并发线程不是一个道理么
好像这四个线程是FGMT的,不是SMT的,也就是类似安腾在不同周期轮换执行的
作者: Edison    时间: 2010-8-11 19:17
LRB 的线程机制和 Fermi 非常类似,你可以把 Fermi 看作是 2-way SMT per SM,而 LRB 是 4-way SMT。
作者: pennywise    时间: 2010-8-11 21:29
看着比板砖顺手
作者: itany    时间: 2010-8-11 22:22
LRB 的线程机制和 Fermi 非常类似,你可以把 Fermi 看作是 2-way SMT per SM,而 LRB 是 4-way SMT。
Edison 发表于 2010-8-11 19:17


站长确定Larrabee是SMT么? 那就是我搞错了
作者: LockheedMartin    时间: 2010-8-12 11:44
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4