NV肝胆俱裂天河2采用Phi 预示着tesla的完蛋 NV的完蛋

cloudol · 发表于 2013-6-3 15:30

本帖最后由 cloudol 于 2013-6-3 15:32 编辑

直指超算TOP1 天河2号超级计算机解读
http://www.enet.com.cn/article/2013/0603/A20130603288413.shtml

xeon phi 和 tesla 是生死之斗都等着TG的大单

天河2采用xeon phi 就代表tesla的完蛋 nv的完蛋

黄世仁在tesla上投入大量资源但在以天河2为代表的核心项目的失利就代表tesla策略的彻底完蛋

多可怜的黄世仁啊

tegra 4也完蛋了我觉得nv可以考虑后事了

明镜止水 · 发表于 2013-6-3 15:31

来顶雷云

cloudol · 发表于 2013-6-3 15:43

其实tesla完蛋对于nfan来说是好事情 tesla卖不出去 nv可以把这些gk110做tt 780了

bull · 发表于 2013-6-3 15:44

雷云的帖子一定要顶.

R620 · 发表于 2013-6-3 15:46

本帖最后由 R620 于 2013-6-3 16:21 编辑

tesla完蛋了nv就没有大核心了

xx88xx88 · 发表于 2013-6-3 16:00

48000个xeon phi，换成48000个K20黄老板也供不上货啊

我说的是事实 · 发表于 2013-6-3 16:09

57cores 是3100系列，2000刀一片。一下贡献了1亿刀啊。

xx88xx88 · 发表于 2013-6-3 16:10

天河2可以说基本是最早采用英特尔Xeon Phi的超级计算机，其意义不仅在于登顶超算排放TOP1，相比天河1和其他基于GPU的异构超级计算机，其在应用范围上更广、整体效率更高，相比在浮点计算精度、分支预测存在天生缺陷的GPU异构计算有更大的实用价值。天河2采用Xeon Phi,可以说代表HPC并行计算到达新的层次，迎来Xeon Phi并行计算的新时代，同时也预示着以NVIDIA Tesla为代表的GPU异构超算逐渐走向死路末路。

coollab · 发表于 2013-6-3 16:10

著名N黑啊

R620 · 发表于 2013-6-3 16:24

本帖最后由 R620 于 2013-6-3 16:25 编辑

就看Maxwell是否能够扭转颓势了

taizer · 发表于 2013-6-3 16:32

这是产能原因吧，当然 phi这玩意相当逆天。

coollab · 发表于 2013-6-3 16:48

Xeon phi的优势在于编译器，性能来源其实还是处理器内部的SIMD阵列，英特尔的编译器能够让一般为多核心优化的程序不怎么需要改动就能在Xeon Phi上获取性能提升。NV做不到这一点的。所以软件强大才是王道。

cloudol · 发表于 2013-6-3 16:55

coollab 发表于 2013-6-3 16:48
Xeon phi的优势在于编译器，性能来源其实还是处理器内部的SIMD阵列，英特尔的编译器能够让一般为多核心优化 ...

intel才是真正的软件公司

qwased · 发表于 2013-6-3 17:02

期待老黄把卖不出去的k20x做成titan卖2999

skywing · 发表于 2013-6-3 17:17

不清楚Xeon phi居然计算能力那么强......一点心理准备都没啊.我不信.百度去.

NORAWITHMYCALL · 发表于 2013-6-3 17:47

XEON PHI配合XEON这是INTEL自拉拉比死掉后，就开始走的棋，前面的代号叫骑士角和骑士渡船。好处就是可以有效提升浮点运算能力并且兼容性比异构来的高，效率也比异构高，更接近传统CPU阵列，目前不足是单元性能比TESLA还低些，但是如果是集团战，那么TELSA未必比XEON PHI有优势。

coollab · 发表于 2013-6-3 17:49

skywing 发表于 2013-6-3 17:17
不清楚Xeon phi居然计算能力那么强......一点心理准备都没啊.我不信.百度去.

http://www.mcplive.cn/index.php/article/index/id/12533

Xeon Phi的x86核心内部实际上是双发射设计，这一点也是完全继承Larrabee的。指令经过解码单元解码后会进入0号管线或者1号管线，接下来会被送入指令所需要的单元进行处理。Xeon Phi虽然使用了多个x86核心并行计算，但是其强大的浮点性能并非来自于x86核心，而是来自于英特尔为Larrabee准备的、在x86核心中新加入的512bit SIMD阵列。这在图中被称为VPU（Vector Processing Unit）矢量处理单元。如果看过本刊对AMD RadeonHD7970的评测也就是对GCN架详细分析的读者应该会知道，MD的GCN架构的每个CU就内含了4组16-wide的SIMD单元，这也是GCN的最小执行单元。英特尔的V PU和AMD的CU从性能角度可以简单认为，两者在相对应的计算架构体系中都处于类似的地位。在Larrabee中，VPU和与之相配的寄存器虽然在图中只占据了一小部分，但在实际生产中至少占据了Larrabee晶圆1/3的面积。在Xeon Phi上，这个数据会由于缓存的增加而略有减小，但不会缩减太多，粗略估计至少有1/4的Xeon Phi核心都纯粹被SIMD阵列和寄存器使用。

Xeon Phi的VPU中包含的矢量ALU可以高效率地执行16wide×32bit的数据或者执行8wide×64bit的数据。在数据类型上，VPU可以支持Int32（单精度整数）、FP32（单精度浮点）和F P6 （双精度浮点）的计算。此外，VPU还支持load/store指令，能够对一些复杂或者少见数据格式进行颇有效率的转换。之前英特尔曾经为Larrabee的VPU开发了新的指令集，名为LNI。在Xeon Phi上，应该也会支持类似或者基本相同的指令集来加强计算效能。

在Xeon Phi上市之前，英特尔就开始利用Knights Ferry让程序员熟悉在众核架构上编译程序的一些特点。在Xeon Phi正式上市后，英特尔推出了大量能够降低程序员工作、简化代码编译操作的编译器系列产品。Xeon Phi这时的优势在于：那些使用x8 6架构的现有并行计算软件不需要太大的改动，仅仅需要在编译器和Rntime上进行一些调整就可以使用Xeon Phi进行加速。其中包含了最常用的C语言、C++语言和F ortran语言的相关产品，还有比较成熟的Debug、Profiling软件。根据英特尔的说明，对传统多核心优化过的软件，可以不需要太多改进，经过英特尔编译器的处理后就可以直接在Xeon Phi上运行。不仅如此，由于软件环境几乎没有改变，程序员不需要太多的学习就能够直接对程序进行Debug、并行化优化等操作，非常方便、简单。相比之下，NVIDIA方面，编程人员需要对CUDA本身的编程方法、并行方法进行一定程度的学习。且CUDA编程后的一些如Debug等操作依旧不够完善。

wzglwoc · 发表于 2013-6-3 18:08

提示: 作者被禁止或删除内容自动屏蔽

只看该作者 · 发表于 2013-6-3 18:24

提示: 作者被禁止或删除内容自动屏蔽

只看该作者 · 发表于 2013-6-3 18:27

提示: 作者被禁止或删除内容自动屏蔽

帐号		自动登录	找回密码
密码			注册

wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽	18^# 发表于 2013-6-3 18:08 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

westlee 该用户已被删除	19^# 发表于 2013-6-3 18:24 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
westlee 该用户已被删除
	回复支持反对使用道具举报显身卡

westlee 该用户已被删除	20^# 发表于 2013-6-3 18:27 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
westlee 该用户已被删除
	回复支持反对使用道具举报显身卡

NV肝胆俱裂 天河2采用Phi 预示着tesla的完蛋 NV的完蛋

浏览过的版块

NV肝胆俱裂天河2采用Phi 预示着tesla的完蛋 NV的完蛋