看到某人写的天河2的文章，实在为其技术基础捏把汗。。。

asdfjkl · 发表于 2013-6-14 23:57

本帖最后由 asdfjkl 于 2013-6-15 12:43 编辑

天河2用了Intel和Phi，某小编就说啥NV的Tesla穷途末路，完全是主观臆断，没有一点技术上的分析，下面把我Google到的一些数据给看家看看，Titan用的的K20X，天河2用的Phi到底，孰强孰弱。  AMD，拿着你的FirePro W9000去门口小卖部打酱油去！

型号                                  Xeon Phi                                                 K20X
面积                               750 mm2(22nm)                                  540 mm2(28nm)
等效面积 (28nm)             1216 mm2                                              540 mm2
等效面积 (22nm)             750 mm2                                              333 mm2
功耗：                               225W                                                    225 W
FP64 Peak:                      1.0 TFLOPS                                        1.3 TFLOPS
DGEMM:                         800 GFLOPS                                        1.2  TFLOPS
价格：                               相仿，                                                    相仿。

看了实打实的数据，还有啥要说的！
轮面积，Xeon Phi的面积是对手K20X 2倍有余；轮性能，只有对手的66 -73%；
就这样的产品的技术指标，估计在HPC里面打酱油的W9000也能达到，搞不好W9000更好，但AMD如果做到这个水准，铁定也是无法拿出来卖的。原因很简单很简单：面积比对手大一倍，成本估计要贵3倍（芯片越大良率越低），价格还要相仿，岂不卖一块亏一块么？  但Intel做成这样，却能卖，还能拿下大单，凭借的就是工艺的领先，享受到了新工艺的成本优势；明眼人从技术的指标上看，其实Phi是落后约对手的K20X。那个啥啥啥，还在网站上发文的，真心为你的技术基础汗颜呀。。。大家看看在当前的实现方法上，是GPU还是专门的多核CPU 计算卡用于HPC有优势呢？

但抛开技术标准，Intel的计算加速卡其实很了不起的！（我个人在技术和战略上一直很佩服Intel的）首先，它的节奏很快，从第一代KNF，到第二代的KNC，时间很短，进度很快，推向市场很快很快，Intel走的很坚决。的确给了对手NV Tesla很大的压力，可以这么说横空出世的Xeon Phi抢走了K20X的挺大的一片市场。没有Phi，也没有啥W9000多少事。  第一代KNF，基本没客户买，Intel主动送给各大科研机构和高校使用；第二代成本高于对手，仍然果断上市。  看过Intel 计算加速卡路线图就知道，Intel真正厉害的估计是下一代的Xeon phi了，基于最新的16nm工艺，听说是ATOM内核的，性能预计会提升3-4倍，这个还真正是NV正面强敌了。NV倘若扛住了,HPC市场双雄鼎立，以后还有看头；倘若顶不住的话，以后HPC市场的路难走了。。。

为了和Intel的下一代计算加速卡竞争，我给老黄支个招：赶紧把GPU用于通用计算的研发经费增加一倍，为啥增加一倍这么多？！太明显不过了，下一代要是扛不住，以后再想发展的基础就没了！！！
有些人可能想问，把Tesla的销售费用增加一倍有效么？忽悠些小白和‘专家’就能抗住下一代Xeon Phi吗？这个么，对AMD或许可能有效，对于NV还是算了吧。。。

asdfjkl · 发表于 2013-6-15 00:17

个人挺讨厌：摆事实，讲歪理的一些人。。。
Tianhe 2是个HPC的大单子，的确也是被Intel的方案给包场了，单就这个事实并不能说明Intel的Xeon Phi 计算加速卡就是HPC领域的不二选择，其他的各种方式的就是死路一条。。。

中国的专家，业内人士就是这样诞生的；凭着一些渠道在消息面上知道点还未公布的时间，然后大笔一挥开始胡诌了，把自己的一些个人的，未经思索和求证的结论一股脑的写上去了。这和街边的大妈很兴奋的从东街跑到西街，然后一脸得意的说：今儿的韭菜特别便宜，五毛一斤。你知道为啥么？温室效应，当今各大强国碳排放都超标了，气温升高，韭菜长得更快了 Orz....

f0f0f0 · 发表于 2013-6-15 00:21

应该是W9000，K20X是235瓦吧，K20才是225瓦，还有GK110似乎是561mm^2？

lemonninja · 发表于 2013-6-15 01:23

phi现在的优势是可以白送

asdfjkl · 发表于 2013-6-15 12:43

lemonninja 发表于 2013-6-15 01:23
phi现在的优势是可以白送

AMD的W9000要是白送，估计也能拿下天河2的订单的，可惜了。。。。。

wzglwoc · 发表于 2013-6-15 12:51

提示: 作者被禁止或删除内容自动屏蔽

asdfjkl · 发表于 2013-6-15 17:17

wzglwoc 发表于 2013-6-15 12:51
AMD那黑心厂商把卖楼钱都卖游戏送游戏卡了，phi出过400美元的良心价-----老黄就是对GTX游戏卡敲骨吸髓也不 ...

老黄黑心那是‘公认’的，不是听闻AMD以厚道出名么？怎么不能搞个399美金的W9000和Intel的Phi竞争呢？

xiaxin222a · 发表于 2013-6-15 18:19

ATOM 核心的Phi，这个算是黑么？

wzglwoc · 发表于 2013-6-15 18:21

提示: 作者被禁止或删除内容自动屏蔽

coollab · 发表于 2013-6-15 18:37

wzglwoc 发表于 2013-6-15 18:21
把卖楼钱都买游戏送游戏卡用户了没钱再补贴给大天河了

AMD楼还真是多，全地球的楼都是AMD的

iamw2d · 发表于 2013-6-15 18:42

首先有本事我大nv也用22nm造一个出来呗
第二我大kepler的寄存器bank位冲突导致连理论测试都跑不到峰值性能你就不说了？

wzglwoc · 发表于 2013-6-15 18:49

提示: 作者被禁止或删除内容自动屏蔽

the_god_of_pig · 发表于 2013-6-15 22:08

本帖最后由 the_god_of_pig 于 2013-6-15 22:11 编辑

什么样的心态把10%的优势找补成50%

Phi由大核心构成，效率当然比tesla低，这和设计水平没什么关系，如果Intel没有工艺优势当初也不会如此设计LRB和之后的Phi

基于x86的Phi可以套用intel的x86开发工具，性能也差不了多少外加打折自然有人买账

asdfjkl · 发表于 2013-6-16 23:25

the_god_of_pig 发表于 2013-6-15 22:08
什么样的心态把10%的优势找补成50%[shifty>

在HPC的基于不同的APP领域， DGEMM的成绩或许比Linpack更有代表性！

junychen · 发表于 2013-6-18 22:13

很不幸 Intel 没有16nm计划基本是楼主自己意淫的。再说了你光看理论性能干嘛？Intel的加速卡比 NV的加速卡效率更高。反而不吃亏。而且Intel PHi 很多堆料在缓存上面，相反 K20 效率在缓存上很抠门。而且论效率绝对是Intel 和 AMD 的效率高，NV空有高理论性能罢了。

frankincense · 发表于 2013-6-18 22:50

wzglwoc 发表于 2013-6-15 12:51
AMD那黑心厂商把卖楼钱都卖游戏送游戏卡了，phi出过400美元的良心价-----老黄就是对GTX游戏卡敲骨吸髓也不 ...

400美刀是Intel半卖半送给高校科研的估价，而且还是早期版本的KNC
正式的Phi就算折扣也很难有这个价位

frankincense · 发表于 2013-6-18 22:58

xiaxin222a 发表于 2013-6-15 18:19
ATOM 核心的Phi，这个算是黑么？

架构上和现在的Atom一样都是基于古老的P54C内核再开发，也算是同源了。
不过Atom只是单核双线程，Phi做到单核四线程，后端的运算单元更是完全不同咯。
至于下一代Phi内核会否像Atom（Silvermont）引入乱序执行，恐怕可能性不高。

iamw2d · 发表于 2013-6-18 23:26

frankincense 发表于 2013-6-18 22:58
架构上和现在的Atom一样都是基于古老的P54C内核再开发，也算是同源了。
不过Atom只是单核双线程，Phi做到 ...

很大程度上拼吞吐率的东西要是弄成乱序超标量那intel真是脑子进屎了

asdfjkl · 发表于 2013-6-18 23:54

本帖最后由 asdfjkl 于 2013-6-18 23:55 编辑

junychen 发表于 2013-6-18 22:13
很不幸 Intel 没有16nm计划基本是楼主自己意淫的。再说了你光看理论性能干嘛？Intel的加速卡比 NV的加速卡 ...

算了吧，你说的这些结果完全没有数据支撑，根本就是你脑补的~~~ 相反的，我为什么这么说是有成绩的。
1）[size=16.363636016845703px]Intel的加速卡比 NV的加速卡效率更高。反而不吃亏。
[size=16.363636016845703px]2)[size=16.363636016845703px]而且论效率绝对是Intel 和 AMD 的效率高.
[size=16.363636016845703px]

还有你不要拿CPU的效率和加速卡比，要比就是Intel的Xeon Phi和AMD的FireStream W9000和K20X比。
比单卡的DGEMM效率，或者互联以后的HPC的实际Linpack成绩/理论Linpack峰值，都行！想看看单位功耗的DGEMM成绩和Linpack成绩都OK！
看看谁的效率高！

这套天河2的Linpack效率大概61%，基本上是上一代Fermi Tesla计算卡的成绩。。。。

Nv-fans · 发表于 2013-6-18 23:57

提示: 作者被禁止或删除内容自动屏蔽

帐号		自动登录	找回密码
密码			注册

wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽	6^# 发表于 2013-6-15 12:51 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽	9^# 发表于 2013-6-15 18:21 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽	12^# 发表于 2013-6-15 18:49 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

Nv-fans Nv-fans 当前离线积分 9 IP卡狗仔卡头像被屏蔽	20^# 发表于 2013-6-18 23:57 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Nv-fans Nv-fans 当前离线积分 9 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

看到某人写的天河2的文章，实在为其技术基础捏把汗。。。

浏览过的版块