POPPUR爱换

标题: NV肝胆俱裂天河2采用Phi 预示着tesla的完蛋 NV的完蛋 [打印本页]

作者: cloudol 时间: 2013-6-3 15:30
标题: NV肝胆俱裂天河2采用Phi 预示着tesla的完蛋 NV的完蛋
本帖最后由 cloudol 于 2013-6-3 15:32 编辑

直指超算TOP1 天河2号超级计算机解读
http://www.enet.com.cn/article/2013/0603/A20130603288413.shtml

xeon phi 和 tesla 是生死之斗都等着TG的大单

天河2采用xeon phi 就代表tesla的完蛋 nv的完蛋

黄世仁在tesla上投入大量资源但在以天河2为代表的核心项目的失利就代表tesla策略的彻底完蛋

多可怜的黄世仁啊

tegra 4也完蛋了我觉得nv可以考虑后事了

作者: 明镜止水 时间: 2013-6-3 15:31
来顶雷云

作者: cloudol 时间: 2013-6-3 15:43
其实tesla完蛋对于nfan来说是好事情 tesla卖不出去 nv可以把这些gk110做tt 780了

作者: bull 时间: 2013-6-3 15:44
雷云的帖子一定要顶.

作者: R620 时间: 2013-6-3 15:46
本帖最后由 R620 于 2013-6-3 16:21 编辑

tesla完蛋了nv就没有大核心了

作者: xx88xx88 时间: 2013-6-3 16:00
48000个xeon phi，换成48000个K20黄老板也供不上货啊

作者: 我说的是事实 时间: 2013-6-3 16:09
57cores 是3100系列，2000刀一片。一下贡献了1亿刀啊。

作者: xx88xx88 时间: 2013-6-3 16:10
天河2可以说基本是最早采用英特尔Xeon Phi的超级计算机，其意义不仅在于登顶超算排放TOP1，相比天河1和其他基于GPU的异构超级计算机，其在应用范围上更广、整体效率更高，相比在浮点计算精度、分支预测存在天生缺陷的GPU异构计算有更大的实用价值。天河2采用Xeon Phi,可以说代表HPC并行计算到达新的层次，迎来Xeon Phi并行计算的新时代，同时也预示着以NVIDIA Tesla为代表的GPU异构超算逐渐走向死路末路。

作者: coollab 时间: 2013-6-3 16:10
著名N黑啊

作者: R620 时间: 2013-6-3 16:24
本帖最后由 R620 于 2013-6-3 16:25 编辑

就看Maxwell是否能够扭转颓势了

作者: taizer 时间: 2013-6-3 16:32
这是产能原因吧，当然 phi这玩意相当逆天。

作者: coollab 时间: 2013-6-3 16:48
Xeon phi的优势在于编译器，性能来源其实还是处理器内部的SIMD阵列，英特尔的编译器能够让一般为多核心优化的程序不怎么需要改动就能在Xeon Phi上获取性能提升。NV做不到这一点的。所以软件强大才是王道。

作者: cloudol 时间: 2013-6-3 16:55

coollab 发表于 2013-6-3 16:48
Xeon phi的优势在于编译器，性能来源其实还是处理器内部的SIMD阵列，英特尔的编译器能够让一般为多核心优化 ...

intel才是真正的软件公司

作者: qwased 时间: 2013-6-3 17:02
期待老黄把卖不出去的k20x做成titan卖2999

作者: skywing 时间: 2013-6-3 17:17
不清楚Xeon phi居然计算能力那么强......一点心理准备都没啊.我不信.百度去.

作者: NORAWITHMYCALL 时间: 2013-6-3 17:47
XEON PHI配合XEON这是INTEL自拉拉比死掉后，就开始走的棋，前面的代号叫骑士角和骑士渡船。好处就是可以有效提升浮点运算能力并且兼容性比异构来的高，效率也比异构高，更接近传统CPU阵列，目前不足是单元性能比TESLA还低些，但是如果是集团战，那么TELSA未必比XEON PHI有优势。

作者: coollab 时间: 2013-6-3 17:49

skywing 发表于 2013-6-3 17:17
不清楚Xeon phi居然计算能力那么强......一点心理准备都没啊.我不信.百度去.

http://www.mcplive.cn/index.php/article/index/id/12533

Xeon Phi的x86核心内部实际上是双发射设计，这一点也是完全继承Larrabee的。指令经过解码单元解码后会进入0号管线或者1号管线，接下来会被送入指令所需要的单元进行处理。Xeon Phi虽然使用了多个x86核心并行计算，但是其强大的浮点性能并非来自于x86核心，而是来自于英特尔为Larrabee准备的、在x86核心中新加入的512bit SIMD阵列。这在图中被称为VPU（Vector Processing Unit）矢量处理单元。如果看过本刊对AMD RadeonHD7970的评测也就是对GCN架详细分析的读者应该会知道，MD的GCN架构的每个CU就内含了4组16-wide的SIMD单元，这也是GCN的最小执行单元。英特尔的V PU和AMD的CU从性能角度可以简单认为，两者在相对应的计算架构体系中都处于类似的地位。在Larrabee中，VPU和与之相配的寄存器虽然在图中只占据了一小部分，但在实际生产中至少占据了Larrabee晶圆1/3的面积。在Xeon Phi上，这个数据会由于缓存的增加而略有减小，但不会缩减太多，粗略估计至少有1/4的Xeon Phi核心都纯粹被SIMD阵列和寄存器使用。

Xeon Phi的VPU中包含的矢量ALU可以高效率地执行16wide×32bit的数据或者执行8wide×64bit的数据。在数据类型上，VPU可以支持Int32（单精度整数）、FP32（单精度浮点）和F P6 （双精度浮点）的计算。此外，VPU还支持load/store指令，能够对一些复杂或者少见数据格式进行颇有效率的转换。之前英特尔曾经为Larrabee的VPU开发了新的指令集，名为LNI。在Xeon Phi上，应该也会支持类似或者基本相同的指令集来加强计算效能。

在Xeon Phi上市之前，英特尔就开始利用Knights Ferry让程序员熟悉在众核架构上编译程序的一些特点。在Xeon Phi正式上市后，英特尔推出了大量能够降低程序员工作、简化代码编译操作的编译器系列产品。Xeon Phi这时的优势在于：那些使用x8 6架构的现有并行计算软件不需要太大的改动，仅仅需要在编译器和Rntime上进行一些调整就可以使用Xeon Phi进行加速。其中包含了最常用的C语言、C++语言和F ortran语言的相关产品，还有比较成熟的Debug、Profiling软件。根据英特尔的说明，对传统多核心优化过的软件，可以不需要太多改进，经过英特尔编译器的处理后就可以直接在Xeon Phi上运行。不仅如此，由于软件环境几乎没有改变，程序员不需要太多的学习就能够直接对程序进行Debug、并行化优化等操作，非常方便、简单。相比之下，NVIDIA方面，编程人员需要对CUDA本身的编程方法、并行方法进行一定程度的学习。且CUDA编程后的一些如Debug等操作依旧不够完善。

作者: wzglwoc 时间: 2013-6-3 18:08
提示: 作者被禁止或删除内容自动屏蔽

作者: westlee 时间: 2013-6-3 18:24
提示: 作者被禁止或删除内容自动屏蔽

作者: westlee 时间: 2013-6-3 18:27
提示: 作者被禁止或删除内容自动屏蔽

作者: xreal 时间: 2013-6-3 18:45

老黄卖烤串

作者: the_god_of_pig 时间: 2013-6-3 18:58
NV全身爆裂

作者: cloudol 时间: 2013-6-3 19:02

westlee 发表于 2013-6-3 18:27
不一定吧，nv屯了5w片gk110常备不时之需？

你认为下单了叫tmsc加班生产来得及么？

作者: westlee 时间: 2013-6-3 19:10
提示: 作者被禁止或删除内容自动屏蔽

作者: goldman948 时间: 2013-6-3 19:19
就算是intel,也是收到订单确认交易内容后工厂才会开始生产
交货也不会一定是一次交足,也许分个几批次
来的及与否其实就是楼上说的,要看客户要求的时程是否能配合
不是在这边用yy就可以得到答案

作者: Vendicare 时间: 2013-6-3 19:34

cloudol 发表于 2013-6-3 19:02
你认为下单了叫tmsc加班生产来得及么？

骚年，你这不是恶狠狠地喷其他厂商木有远见么？按摩店、英特尔集体汗颜无地啊。

老黄做个计算卡还要加上大量的TMU、ROP、ramdac，专门预备着万一计算卡市场失利立刻转战其他行业。你看看，老黄tesla战线守不住立刻溃退到quadro市场上，quadro又守不住立刻战geforce高端，高端被7990端了立刻杀主流。一招鲜，吃遍天么。哇咔咔咔咔。看我大农企tahiti就没想那么多吧，结果输的裸奔了吧？

作者: Xenomorph 时间: 2013-6-3 20:00

Vendicare 发表于 2013-6-3 19:34
骚年，你这不是恶狠狠地喷其他厂商木有远见么？按摩店、英特尔集体汗颜无地啊。

老黄做个计算卡还要加 ...

上次您说GTC2013上发布Quadro K6000，输掉了哦~话说GCN的文章呢？

作者: jhj9 时间: 2013-6-3 20:02
天河一号一开始还用4870x2呢，结果呢？

作者: xreal 时间: 2013-6-3 20:04

4870x2挖矿

作者: BDFMK4 时间: 2013-6-3 20:08

jhj9 发表于 2013-6-3 20:02
天河一号一开始还用4870x2呢，结果呢？

是啊，你主子家Tesla和4870x2一样的命运

作者: jhj9 时间: 2013-6-3 20:19

BDFMK4 发表于 2013-6-3 20:08
是啊，你主子家Tesla和4870x2一样的命运

你这选择性失忆已经没救了，别忘了4870x2是先上的，其下场……这次轮到xeon phi先上
你连个类比都无能，还能做什么？

作者: cloudol 时间: 2013-6-3 20:23

goldman948 发表于 2013-6-3 19:19
就算是intel,也是收到订单确认交易内容后工厂才会开始生产
交货也不会一定是一次交足,也许分个几批次
来的 ...

现在至少已经交付14xxx片phi在跑调试了

作者: BDFMK4 时间: 2013-6-3 20:30

jhj9 发表于 2013-6-3 20:19
你这选择性失忆已经没救了，别忘了4870x2是先上的，其下场……这次轮到xeon phi先上
你连个类比都无能， ...

你还真阿Q，都是被抛弃的货，你还分这分那，知道阿Q最后死的那段么？啧啧啧

作者: Nv-fans 时间: 2013-6-3 20:41
提示: 作者被禁止或删除内容自动屏蔽

作者: wangcs3416 时间: 2013-6-3 20:55
人家ＮＶ看不上ＸＢＯＸ、ＰＳ，更看不上天河２了，ＮＶ就看得上这儿的几个大神。

作者: Windyson 时间: 2013-6-3 21:05
i3默秒全

作者: R620 时间: 2013-6-3 21:12

Vendicare 发表于 2013-6-3 19:34
骚年，你这不是恶狠狠地喷其他厂商木有远见么？按摩店、英特尔集体汗颜无地啊。

老黄做个计算卡还要加 ...

问题是NV在计算卡市场失利后还会不会继续搞大核心哦？

作者: cloudol 时间: 2013-6-3 21:14

wangcs3416 发表于 2013-6-3 20:55
人家ＮＶ看不上ＸＢＯＸ、ＰＳ，更看不上天河２了，ＮＶ就看得上这儿的几个大神。

我觉得也快看不上手机平板了

作者: Vendicare 时间: 2013-6-3 21:22

Xenomorph 发表于 2013-6-3 20:00
上次您说GTC2013上发布Quadro K6000，输掉了哦~话说GCN的文章呢？

还有些东西没搞明白，专门淘了个二手7970还没到货。

作者: Nv-fans 时间: 2013-6-3 21:35
提示: 作者被禁止或删除内容自动屏蔽

作者: coollab 时间: 2013-6-3 21:51
本帖最后由 coollab 于 2013-6-3 21:52 编辑

BDFMK4 发表于 2013-6-3 20:30
你还真阿Q，都是被抛弃的货，你还分这分那，知道阿Q最后死的那段么？啧啧啧

这次天河2号上Xeon Phi一点也不意外。国内超算本来就在发展阶段，各家方案都会尝试一下。天河1号AMD，天河1A用NV，天河2号英特尔，轮着来，再说之前军方的超算全部都是自产的加速处理器。

Xeon Phi的优势在于英特尔能给出一整套解决方案，不用去分两家找。这次也是Xeon Phi大规模上超算的又一次尝试而已。

并行计算不是天生就可以做好的。虽然Xeon Phi已经在软件上有一定优势了，不过老黄肯定不会轻松放手这个大肥肉，Tesla本身的理论每瓦特性能还要好很多。并行计算特别是这种超大规模的，软件方面各家都是大难题，不存在Xeon Phi上的程序就自动并行化了。

超算还在继续发展中，Xeon Phi的硬伤也不是没有，Tesla也不是彻底失败，不过反倒是AMD一点希望都没了……

作者: xiaxin222a 时间: 2013-6-3 23:26

coollab 发表于 2013-6-3 21:51
这次天河2号上Xeon Phi一点也不意外。国内超算本来就在发展阶段，各家方案都会尝试一下。天河1号AMD，天河 ...

据说Phi的单卡效率值在80%UP，这么算的话每瓦有效性能相当恐怖

作者: coollab 时间: 2013-6-3 23:33

xiaxin222a 发表于 2013-6-3 23:26
据说Phi的单卡效率值在80%UP，这么算的话每瓦有效性能相当恐怖

考虑基准性能和功耗呢？

作者: jhj9 时间: 2013-6-3 23:40

BDFMK4 发表于 2013-6-3 20:30
你还真阿Q，都是被抛弃的货，你还分这分那，知道阿Q最后死的那段么？啧啧啧

也不睁大眼睛看看先后，4870x2这个先上然后被抛弃的纯垃圾，在HPC领域完全没人用，笑死人了
xeon phi不过先上，到时候走着瞧呗
K20上来就装在Cray的Titan里面卖了2万多块，相比之下A家的垃圾货卖给HPC卖了几块？
哈哈哈哈，你果然够阿Q，压根已经对GCN这个被抛弃的纯垃圾掩耳盗铃了

作者: asdfjkl 时间: 2013-6-4 00:00
在目标1000PB的超级计算机上，各家的方案只是不同的实现途径，一个方案取得了某个超算的支持，就表明其他家的失败，这种观点是在可笑之至~~~
看的出，你特别希望Tesla，只可惜呀！会倒的，不黑也会倒；不会到的，黑也黑不倒！

从文章中 Xeon phi的指标上看，并无对阵Tesla有啥优势的地方。低速的PCIE 2.0接口，更低的双精度浮点，更小容量的加速卡自带的显存，更低速的显存速度等等等等。。。
或许，唯一领先的就是价格。在米国，Intel为了拿下某些订单，499美金一块的价格也买~~~

呵呵呵，只可惜Intel已经22nm了，未来ＮＶ的ＧＰＵ迈向２０ｎｍ的时候。。。

作者: asdfjkl 时间: 2013-6-4 00:02

R620 发表于 2013-6-3 21:12
问题是NV在计算卡市场失利后还会不会继续搞大核心哦？

放心，ＡＭＤ放弃大核心了，ＮＶ都不会放弃的～～～

作者: NORAWITHMYCALL 时间: 2013-6-4 07:28
不能说nv现在会败，不过从趋势来看败的可能性在增大。

作者: cloudol 时间: 2013-6-4 07:43

asdfjkl 发表于 2013-6-4 00:00
在目标1000PB的超级计算机上，各家的方案只是不同的实现途径，一个方案取得了某个超算的支持，就表明其他家 ...

pcie带宽显存容量这些问题都好解决

不过tesla在适用性、分支预测方面就天生残废没得救

这个就是差别

另外你敢指望tmsc的20nm? 我很佩服你的想象力和勇气

作者: asdfjkl 时间: 2013-6-4 08:06

cloudol 发表于 2013-6-4 07:43
pcie带宽显存容量这些问题都好解决

不过tesla在适用性、分支预测方面就天生残废没得救

算了吧，像适用性、分支预测方面这些个和技术有关的你还是闭嘴的好，你真心不懂～～～
PCIE的速度，显存速度怎么就不是技术范畴了？？？
Intel是凭借着工艺的优势下，但在各项指标还是输于对手；一旦工艺接近极限，Intel必定完蛋。

作者: cloudol 时间: 2013-6-4 08:24

asdfjkl 发表于 2013-6-4 08:06
算了吧，像适用性、分支预测方面这些个和技术有关的你还是闭嘴的好，你真心不懂～～～
PCIE的速度，显存 ...

恩我是不懂

但我至少大概知道mimd和simd不同架构对分支和并行度的影响

知道x86和cuda在适用难度上谁优谁劣

pcie带宽显存容量这些问题肯定比上面的问题好解决，不要忘记pcie的规范是谁规定的

工艺问题 intel就拿工艺问题欺负你咋了？即使tmsc可以在短时间兑现20nm缩短差距甚至赶上(需要等到明年maxwell?)，但又会很快被intel 14nm远远抛离，在大部分时间都大幅落后的。

或者你还等着tmsc 16nm放卫星？我建议你还是不用等了，你可以看看tmsc现在实际比之前的roadmap慢多少，ARM A50、SGX6都必然被tmsc坑,nv也一样。

作者: cloudol 时间: 2013-6-4 14:24
tsmc 我错了好吧

作者: R620 时间: 2013-6-4 15:46

asdfjkl 发表于 2013-6-4 00:02
放心，ＡＭＤ放弃大核心了，ＮＶ都不会放弃的～～～

没计算卡市场我看不出上大核心有何用？

作者: xreal 时间: 2013-6-4 16:35

形象工程。

作者: disruptor 时间: 2013-6-4 16:58
maxwell应该可以更好的提升分支预测的性能。毕竟装了cpu进去，而且nv的目标是三倍于kepler的每瓦特性能。

作者: R620 时间: 2013-6-4 17:06

disruptor 发表于 2013-6-4 16:58
maxwell应该可以更好的提升分支预测的性能。毕竟装了cpu进去，而且nv的目标是三倍于kepler的每瓦特性能。

提升分支预测对游戏有什么帮助没？

作者: disruptor 时间: 2013-6-4 17:17

R620 发表于 2013-6-4 17:06
提升分支预测对游戏有什么帮助没？

shader越复杂效果肯定越明显。其实edison微博之前转过k20和phi的性能对比，如果除去制程上的优势的话，tesla的每瓦特性能还是能达到phi的3-4倍的

作者: jhj9 时间: 2013-6-4 17:28

cloudol 发表于 2013-6-4 08:24
恩我是不懂

但我至少大概知道mimd和simd不同架构对分支和并行度的影响

x86和CUDA都有C/C++编译器，又不用写汇编，能有多少适用难度差异？
而且xeon phi不支持MMX、XMM、YMM指令集，跟MMX、SSE、AVX存在很大的不兼容问题，用了这些指令的代码必须要重新编写
要在xeon phi上开发的难度一点也不比用cuda/opencl要小。

作者: R620 时间: 2013-6-4 17:30
本帖最后由 R620 于 2013-6-4 17:31 编辑

disruptor 发表于 2013-6-4 17:17
shader越复杂效果肯定越明显。其实edison微博之前转过k20和phi的性能对比，如果除去制程上的优势的话，te ...

那也不能说明是提高分支预测带来的提升啊？

作者: xaaaaaaaaaaaaaa 时间: 2013-6-4 18:07
xeon e5 2692 是IVB？
不应该是SNB-EP么？！

作者: the_god_of_pig 时间: 2013-6-4 19:49
本帖最后由 the_god_of_pig 于 2013-6-4 20:00 编辑

disruptor 发表于 2013-6-4 17:17
shader越复杂效果肯定越明显。其实edison微博之前转过k20和phi的性能对比，如果除去制程上的优势的话，te ...

3-4倍？Phi 225瓦DP 1Tflops，titan250瓦DP 1.3Tflops，Intel 22nm工艺比TSMC 28nm HP省电3倍？？？

作者: jhj9 时间: 2013-6-4 19:59

the_god_of_pig 发表于 2013-6-4 19:49
3-4倍？Phi 225瓦DP 1Tflops，titan250瓦DP 1.4Tflops，Intel 22nm工艺比TSMC 28nm HP省电3倍？？？[w00t ...

SP呢？科学计算又不是只有DP的计算需求，当初Tesla K10大卖，用来跑AMBER、LAMMPS的时候，xeon phi在哪里？

作者: the_god_of_pig 时间: 2013-6-4 20:04

jhj9 发表于 2013-6-4 19:59
SP呢？科学计算又不是只有DP的计算需求，当初Tesla K10大卖，用来跑AMBER、LAMMPS的时候，xeon phi在哪里 ...

Top 500只承认DP运算能力

作者: Nv-fans 时间: 2013-6-4 20:05
提示: 作者被禁止或删除内容自动屏蔽

作者: jhj9 时间: 2013-6-4 20:25

the_god_of_pig 发表于 2013-6-4 20:04
Top 500只承认DP运算能力

Telsa和Xeon phi的存在意义只有TOP 500？

作者: jhj9 时间: 2013-6-4 20:27

Nv-fans 发表于 2013-6-4 20:05
Intel在生产CPU的时候，你主子活在哪都不知道呢...还在别人平台讨饭吃就自个要有点脸。

你主子都已经穷途末路了，送平台给别人，别人都嫌太垃圾的货色，你还扯淡个鬼啊

要按你的逻辑，莫非所有生产汽车都是在跟石油公司讨饭吃的？果然够扭曲畸形，哈哈

作者: the_god_of_pig 时间: 2013-6-4 20:37

jhj9 发表于 2013-6-4 20:25
Telsa和Xeon phi的存在意义只有TOP 500？

你也不想想为什么Top500只承认DP

作者: xiaxin222a 时间: 2013-6-4 22:45

jhj9 发表于 2013-6-4 19:59
SP呢？科学计算又不是只有DP的计算需求，当初Tesla K10大卖，用来跑AMBER、LAMMPS的时候，xeon phi在哪里 ...

怎么一下子DP又比SP重要了？

作者: coollab 时间: 2013-6-4 23:37

xiaxin222a 发表于 2013-6-4 22:45
怎么一下子DP又比SP重要了？

他啥时候说DP比SP重要了？你的语文能力……

作者: disruptor 时间: 2013-6-5 08:44

the_god_of_pig 发表于 2013-6-4 19:49
3-4倍？Phi 225瓦DP 1Tflops，titan250瓦DP 1.3Tflops，Intel 22nm工艺比TSMC 28nm HP省电3倍？？？[w00t ...

基于DGEMM测试的结果是phi se10x 2.78GFlops/W, tesla k20x 5.19GFlops/W

作者: the_god_of_pig 时间: 2013-6-5 10:29

disruptor 发表于 2013-6-5 08:44
基于DGEMM测试的结果是phi se10x 2.78GFlops/W, tesla k20x 5.19GFlops/W

为什么不和10p比

[attach]2278565[/attach]

作者: the_god_of_pig 时间: 2013-6-5 11:08
抛开ppt看第三方实测；都是225瓦，linpack k20是832Gflops，phi 5110p是763Gflops，tesla能效高9%，不知道那个3-4倍是什么先进算法算出来的

[attach]2278619[/attach]

作者: asdfjkl 时间: 2013-6-5 11:35

the_god_of_pig 发表于 2013-6-5 11:08
抛开ppt看第三方实测；都是225瓦，linpack k20是832Gflops，phi 5110p是763Gflops，tesla能效高9%，不知道那 ...

老黄用落后的工艺，取得了领先，就算领先不是3-4倍，也已经不错了。
再说K20上面，还有更强的K20X，对不？所以K20和Phi se10x比也没啥不合理的。
还有你这里只是比DGEMM，如果比SGEMM呢？差距更大了。

成本上老黄也不再弱势，用GPU的分摊研发成本，用Geforece产品线分摊生产成本。
但无奈两家的加速卡都不是按成本卖，溢价都很高，所以这个体现不出来。
相比于农企对阵Intel，技术落后，性能落后，成本落后；好多了吧！

作者: asdfjkl 时间: 2013-6-5 11:39

the_god_of_pig 发表于 2013-6-5 11:08
抛开ppt看第三方实测；都是225瓦，linpack k20是832Gflops，phi 5110p是763Gflops，tesla能效高9%，不知道那 ...

两家的计算加速卡，各有各的技术风格。完全是在不同的道路上走向未来1000PF的HPC，我所不屑的是LZ的观点和行文方式，仿佛Intel拿下了一家的HPC合同，其他的方案都可以消亡了，典型的小屁孩的简单头脑：那么是0，那么是1的，实在可笑。

作者: the_god_of_pig 时间: 2013-6-5 11:51

asdfjkl 发表于 2013-6-5 11:35
老黄用落后的工艺，取得了领先，就算领先不是3-4倍，也已经不错了。
再说K20上面，还有更强的K20X，对不 ...

Phi的x86核心比tesla的CUDA核心更为臃肿，大核心能效更低很正常

DGEMM被拿来说事是因为老黄的ppt只有这一项的成绩而已/换句话说tesla只有跑这个时效率才适合拿来做ppt

作者: the_god_of_pig 时间: 2013-6-5 11:55

asdfjkl 发表于 2013-6-5 11:39
两家的计算加速卡，各有各的技术风格。完全是在不同的道路上走向未来1000PF的HPC，我所不屑的是LZ的观点 ...

LZ观点我不评论，我只吐槽3-4倍

作者: asdfjkl 时间: 2013-6-5 11:57
本帖最后由 asdfjkl 于 2013-6-5 11:58 编辑

the_god_of_pig 发表于 2013-6-5 11:51
Phi的x86核心比tesla的CUDA核心更为臃肿，大核心能效更低很正常

DGEMM被拿来说事是因为老黄的ppt只有这 ...

笑了~~~~ 难道Phi 跑 Linpack的效率就比Tesla高很多么？还有Linpack FP/W的成绩，更是比橡树林国家实验室的更差，要知道那台用的AMD的CPU，CPU部分的：Perf/W有多差可想而知；而且橡树林的CPU:GPU的比例好像是 2:1；这台是2:3，大多数的计算有由速卡承担结果还是更差的Perf/W，可见一般了。

看看原文数据就能发现这个天河II很多落后的地方。

作者: the_god_of_pig 时间: 2013-6-5 12:02

asdfjkl 发表于 2013-6-5 11:57
笑了~~~~ 难道Phi 跑 Linpack的效率就比Tesla高很多么？还有Linpack FP/W的成绩，更是比橡树林国家实验室 ...

上面不是有实测吗？linpack tesla 效率才71%多一点，ppt上的效率写的可是93%啊

要比只能比单卡，整个超算变量太多

作者: R620 时间: 2013-6-5 22:46
等着看Maxwell PK 英特尔下一代计算加速卡

作者: eneiwstt 时间: 2013-6-6 12:23
这件事在我眼里看就是INTEL的关系更硬，给的回扣更多。跟技术没什么关系。而且就是一个单子而已，NV又不是光靠这一单活着。而且很多人都纸上谈兵，脱离实际。我就不举例了省着说我打广告。

作者: Xenomorph 时间: 2013-6-6 19:11

Vendicare 发表于 2013-6-3 21:22
还有些东西没搞明白，专门淘了个二手7970还没到货。

就等您了……

作者: wzglwoc 时间: 2013-6-6 22:27
提示: 作者被禁止或删除内容自动屏蔽

作者: wzglwoc 时间: 2013-6-6 22:37
提示: 作者被禁止或删除内容自动屏蔽

作者: wzglwoc 时间: 2013-6-6 22:40
提示: 作者被禁止或删除内容自动屏蔽

作者: jhj9 时间: 2013-6-6 23:58
本帖最后由 jhj9 于 2013-6-7 00:07 编辑

重复了

作者: jhj9 时间: 2013-6-7 00:02
本帖最后由 jhj9 于 2013-6-7 00:06 编辑

wzglwoc 发表于 2013-6-6 22:27
intel生产827XX系列显示的时侯NV还不知在哪呢；

就是NV早期的GPU也是加工工艺等各种惨不忍 ...

就A家那十分之一都不到的CPU份额才是有什么脸皮来吹啊？连渣都算不上
NV占据了64%的独显市场份额，NV图形部门营业额几乎是A家图形部门的3倍，这市场份额还不能歌颂一下，居然还有无知的家伙认为这市场份额不能提？果然笑死人

连比喻都听不懂的家伙，水平还不如小学生吧？汽车需要汽油才能开，正对应显卡需要CPU，所以NV算是汽车厂家，Intel算是石油巨头，就这么简单，某些人该回小学去重修了

Intel和NV有无数的交叉专利授权，每年Intel还要给NV上亿专利费，NV坐着都收钱。A家每个季度都要大亏好几亿，看着这些NV坐着不干都能白来的钱，只有眼红到家的份了，这也难怪，A家拼命做CPU拼命做主板结果还是大亏特亏，活该啊

作者: jhj9 时间: 2013-6-7 00:03

wzglwoc 发表于 2013-6-6 22:40
[/table]

APU算个什么垃圾？连CPU市场份额十分之一都不到的东西，根本没什么人用的渣渣

就当作不存在也根本没问题

作者: wzglwoc 时间: 2013-6-8 19:00
提示: 作者被禁止或删除内容自动屏蔽

作者: jhj9 时间: 2013-6-8 19:39
本帖最后由 jhj9 于 2013-6-8 19:45 编辑

wzglwoc 发表于 2013-6-8 19:00
就A家那十分之一都不到的CPU份额才是有什么脸皮来吹啊？连渣都算不上真人不要脸天下无敌，去看看 ...

AMD才6.4%的市场份额，你居然都不知道？无知得让人发指：
http://www.eepw.com.cn/article/145559.htm
莫非你认为ARM不叫CPU？

NV独显占据了64%，纯利就能大把，和Intel在CPU市场的占有率差不多。而AMD的CPU部门一个季度大亏好几亿，亏成这样垃圾的公司的还能叫活得好？笑话简直笑死人
AMD算上集显看份额？完全不赚钱搭在CPU里面一个季度亏几亿的货色你也敢提，这样的虚假份额越高AMD亏得越惨，越是离倒闭不远，你就继续YY这种价值为负值只能亏钱的假占有吧。