POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 12751|回复: 93
打印 上一主题 下一主题

NV肝胆俱裂 天河2采用Phi 预示着tesla的完蛋 NV的完蛋

[复制链接]
跳转到指定楼层
1#
发表于 2013-6-3 15:30 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 cloudol 于 2013-6-3 15:32 编辑

直指超算TOP1 天河2号超级计算机解读
http://www.enet.com.cn/article/2013/0603/A20130603288413.shtml

xeon phi 和 tesla 是生死之斗 都等着TG的大单

天河2采用xeon phi 就代表tesla的完蛋 nv的完蛋

黄世仁在tesla上投入大量资源 但在以天河2为代表的核心项目的失利 就代表tesla策略的彻底完蛋

多可怜的黄世仁啊

tegra 4也完蛋了 我觉得nv可以考虑后事了

2#
发表于 2013-6-3 15:31 | 只看该作者
来顶雷云
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2013-6-3 15:43 | 只看该作者
其实tesla完蛋 对于nfan来说是好事情 tesla卖不出去 nv可以把这些gk110做tt 780了


回复 支持 反对

使用道具 举报

4#
发表于 2013-6-3 15:44 | 只看该作者
雷云的帖子一定要顶.
回复 支持 反对

使用道具 举报

5#
发表于 2013-6-3 15:46 来自手机 | 只看该作者
本帖最后由 R620 于 2013-6-3 16:21 编辑

tesla完蛋了nv就没有大核心了
回复 支持 反对

使用道具 举报

6#
发表于 2013-6-3 16:00 | 只看该作者
48000个xeon phi,换成48000个K20黄老板也供不上货啊
回复 支持 反对

使用道具 举报

7#
发表于 2013-6-3 16:09 | 只看该作者
57cores 是3100系列,2000刀一片。一下贡献了1亿刀啊。
回复 支持 反对

使用道具 举报

8#
发表于 2013-6-3 16:10 | 只看该作者
天河2可以说基本是最早采用英特尔Xeon Phi的超级计算机,其意义不仅在于登顶超算排放TOP1,相比天河1和其他基于GPU的异构超级计算机,其在应用范围上更广、整体效率更高,相比在浮点计算精度、分支预测存在天生缺陷的GPU异构计算有更大的实用价值。天河2采用Xeon Phi,可以说代表HPC并行计算到达新的层次,迎来Xeon Phi并行计算的新时代,同时也预示着以NVIDIA Tesla为代表的GPU异构超算逐渐走向死路末路。
回复 支持 反对

使用道具 举报

9#
发表于 2013-6-3 16:10 | 只看该作者
著名N黑啊
回复 支持 反对

使用道具 举报

10#
发表于 2013-6-3 16:24 来自手机 | 只看该作者
本帖最后由 R620 于 2013-6-3 16:25 编辑

就看Maxwell是否能够扭转颓势了
回复 支持 反对

使用道具 举报

11#
发表于 2013-6-3 16:32 | 只看该作者
这是产能原因吧,当然 phi这玩意相当逆天。
回复 支持 反对

使用道具 举报

12#
发表于 2013-6-3 16:48 | 只看该作者
Xeon phi的优势在于编译器,性能来源其实还是处理器内部的SIMD阵列,英特尔的编译器能够让一般为多核心优化的程序不怎么需要改动就能在Xeon Phi上获取性能提升。NV做不到这一点的。所以软件强大才是王道。
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2013-6-3 16:55 | 只看该作者
coollab 发表于 2013-6-3 16:48
Xeon phi的优势在于编译器,性能来源其实还是处理器内部的SIMD阵列,英特尔的编译器能够让一般为多核心优化 ...

intel才是真正的软件公司
回复 支持 反对

使用道具 举报

14#
发表于 2013-6-3 17:02 来自手机 | 只看该作者
期待老黄把卖不出去的k20x做成titan卖2999
回复 支持 反对

使用道具 举报

15#
发表于 2013-6-3 17:17 | 只看该作者
不清楚Xeon phi居然计算能力那么强......一点心理准备都没啊.我不信.百度去.
回复 支持 反对

使用道具 举报

16#
发表于 2013-6-3 17:47 | 只看该作者
XEON PHI配合XEON这是INTEL自拉拉比死掉后,就开始走的棋,前面的代号叫骑士角和骑士渡船。好处就是可以有效提升浮点运算能力并且兼容性比异构来的高,效率也比异构高,更接近传统CPU阵列,目前不足是单元性能比TESLA还低些,但是如果是集团战,那么TELSA未必比XEON PHI有优势。
回复 支持 反对

使用道具 举报

17#
发表于 2013-6-3 17:49 | 只看该作者
skywing 发表于 2013-6-3 17:17
不清楚Xeon phi居然计算能力那么强......一点心理准备都没啊.我不信.百度去.

http://www.mcplive.cn/index.php/article/index/id/12533

Xeon Phi的x86核心内部实际上是双发射设计,这一点也是完全继承Larrabee的。指令经过解码单元解码后会进入0号管线或者1号管线,接下来会被送入指令所需要的单元进行处理。Xeon Phi虽然使用了多个x86核心并行计算,但是其强大的浮点性能并非来自于x86核心,而是来自于英特尔为Larrabee准备的、在x86核心中新加入的512bit SIMD阵列。这在图中被称为VPU(Vector Processing Unit)矢量处理单元。如果看过本刊对AMD RadeonHD7970的评测也就是对GCN架详细分析的读者应该会知道,MD的GCN架构的每个CU就内含了4组16-wide的SIMD单元,这也是GCN的最小执行单元。英特尔的V PU和AMD的CU从性能角度可以简单认为,两者在相对应的计算架构体系中都处于类似的地位。在Larrabee中,VPU和与之相配的寄存器虽然在图中只占据了一小部分,但在实际生产中至少占据了Larrabee晶圆1/3的面积。在Xeon Phi上,这个数据会由于缓存的增加而略有减小,但不会缩减太多,粗略估计至少有1/4的Xeon Phi核心都纯粹被SIMD阵列和寄存器使用。

Xeon Phi的VPU中包含的矢量ALU可以高效率地执行16wide×32bit的数据或者执行8wide×64bit的数据。在数据类型上,VPU可以支持Int32(单精度整数)、FP32(单精度浮点)和F P6 (双精度浮点)的计算。此外,VPU还支持load/store指令,能够对一些复杂或者少见数据格式进行颇有效率的转换。之前英特尔曾经为Larrabee的VPU开发了新的指令集,名为LNI。在Xeon Phi上,应该也会支持类似或者基本相同的指令集来加强计算效能。

在Xeon Phi上市之前,英特尔就开始利用Knights Ferry让程序员熟悉在众核架构上编译程序的一些特点。在Xeon Phi正式上市后,英特尔推出了大量能够降低程序员工作、简化代码编译操作的编译器系列产品。Xeon Phi这时的优势在于:那些使用x8 6架构的现有并行计算软件不需要太大的改动,仅仅需要在编译器和Rntime上进行一些调整就可以使用Xeon Phi进行加速。其中包含了最常用的C语言、C++语言和F ortran语言的相关产品,还有比较成熟的Debug、Profiling软件。根据英特尔的说明,对传统多核心优化过的软件,可以不需要太多改进,经过英特尔编译器的处理后就可以直接在Xeon Phi上运行。不仅如此,由于软件环境几乎没有改变,程序员不需要太多的学习就能够直接对程序进行Debug、并行化优化等操作,非常方便、简单。相比之下,NVIDIA方面,编程人员需要对CUDA本身的编程方法、并行方法进行一定程度的学习。且CUDA编程后的一些如Debug等操作依旧不够完善。

回复 支持 反对

使用道具 举报

头像被屏蔽
18#
发表于 2013-6-3 18:08 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
19#
发表于 2013-6-3 18:24 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
20#
发表于 2013-6-3 18:27 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-4-25 13:50

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表