POPPUR爱换

标题: 看到某人写的天河2的文章,实在为其技术基础捏把汗。。。 [打印本页]

作者: asdfjkl    时间: 2013-6-14 23:57
标题: 看到某人写的天河2的文章,实在为其技术基础捏把汗。。。
本帖最后由 asdfjkl 于 2013-6-15 12:43 编辑

天河2用了Intel和Phi,某小编就说啥NV的Tesla穷途末路,完全是主观臆断,没有一点技术上的分析,下面把我Google到的一些数据给看家看看,Titan用的的K20X,天河2用的Phi到底,孰强孰弱。  AMD,拿着你的FirePro W9000去门口小卖部打酱油去!

型号                                   Xeon Phi                                                    K20X
面积                                 750 mm2(22nm)                                    540 mm2(28nm)
等效面积 (28nm)               1216 mm2                                               540 mm2
等效面积 (22nm)               750 mm2                                                 333 mm2
功耗:                                 225W                                                     225 W     
FP64 Peak:                        1.0 TFLOPS                                           1.3 TFLOPS
DGEMM:                           800 GFLOPS                                           1.2  TFLOPS
价格:                                 相仿,                                                     相仿。


看了实打实的数据,还有啥要说的!   
轮面积,Xeon Phi的面积是对手K20X 2倍有余; 轮性能,只有对手的66 -73%;
就这样的产品的技术指标,估计在HPC里面打酱油的W9000也能达到,搞不好W9000更好,但AMD如果做到这个水准,铁定也是无法拿出来卖的。 原因很简单很简单: 面积比对手大一倍,成本估计要贵3倍(芯片越大良率越低),价格还要相仿,岂不卖一块亏一块么?  但Intel做成这样,却能卖,还能拿下大单,凭借的就是工艺的领先,享受到了新工艺的成本优势;明眼人从技术的指标上看,其实Phi是落后约对手的K20X。 那个啥啥啥,还在网站上发文的,真心为你的技术基础汗颜呀。。。 大家看看在当前的实现方法上,是GPU还是专门的多核CPU 计算卡用于HPC有优势呢?


但抛开技术标准,Intel的计算加速卡其实很了不起的!(我个人在技术和战略上一直很佩服Intel的) 首先,它的节奏很快,从第一代KNF,到第二代的KNC,时间很短,进度很快,推向市场很快很快,Intel走的很坚决。的确给了对手NV Tesla很大的压力,可以这么说横空出世的Xeon Phi抢走了K20X的挺大的一片市场。没有Phi,也没有啥W9000多少事。  第一代KNF,基本没客户买,Intel主动送给各大科研机构和高校使用;第二代成本高于对手,仍然果断上市。  看过Intel 计算加速卡路线图就知道,Intel真正厉害的估计是下一代的Xeon phi了,基于最新的16nm工艺,听说是ATOM内核的,性能预计会提升3-4倍,这个还真正是NV正面强敌了。NV倘若扛住了,HPC市场双雄鼎立,以后还有看头;倘若顶不住的话,以后HPC市场的路难走了。。。

为了和Intel的下一代计算加速卡竞争,我给老黄支个招: 赶紧把GPU用于通用计算的研发经费增加一倍,为啥增加一倍这么多?! 太明显不过了,下一代要是扛不住,以后再想发展的基础就没了!!!
有些人可能想问,把Tesla的销售费用增加一倍有效么?忽悠些小白和‘专家’就能抗住下一代Xeon Phi吗? 这个么,对AMD或许可能有效,对于NV还是算了吧。。。

作者: asdfjkl    时间: 2013-6-15 00:17
个人挺讨厌: 摆事实,讲歪理的一些人。。。
Tianhe 2是个HPC的大单子,的确也是被Intel的方案给包场了,单就这个事实并不能说明Intel的Xeon Phi 计算加速卡就是HPC领域的不二选择,其他的各种方式的就是死路一条。。。

中国的专家,业内人士就是这样诞生的;凭着一些渠道在消息面上知道点还未公布的时间,然后大笔一挥开始胡诌了,把自己的一些个人的,未经思索和求证的结论一股脑的写上去了。 这和街边的大妈很兴奋的从东街跑到西街,然后一脸得意的说:今儿的韭菜特别便宜,五毛一斤。你知道为啥么?  温室效应,当今各大强国碳排放都超标了,气温升高,韭菜长得更快了 Orz....
作者: f0f0f0    时间: 2013-6-15 00:21
应该是W9000,K20X是235瓦吧,K20才是225瓦,还有GK110似乎是561mm^2?
作者: lemonninja    时间: 2013-6-15 01:23
phi现在的优势是可以白送
作者: asdfjkl    时间: 2013-6-15 12:43
lemonninja 发表于 2013-6-15 01:23
phi现在的优势是可以白送

AMD的W9000要是白送,估计也能拿下天河2的订单的,可惜了。。。。。
作者: wzglwoc    时间: 2013-6-15 12:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: asdfjkl    时间: 2013-6-15 17:17
wzglwoc 发表于 2013-6-15 12:51
AMD那黑心厂商把卖楼钱都卖游戏送游戏卡了,phi出过400美元的良心价-----老黄就是对GTX游戏卡敲骨吸髓也不 ...

老黄黑心那是‘公认’的,不是听闻AMD以厚道出名么? 怎么不能搞个399美金的W9000和Intel的Phi竞争呢?
作者: xiaxin222a    时间: 2013-6-15 18:19
ATOM 核心的Phi,这个算是黑么?
作者: wzglwoc    时间: 2013-6-15 18:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: coollab    时间: 2013-6-15 18:37
wzglwoc 发表于 2013-6-15 18:21
把卖楼钱都买游戏送游戏卡用户了没钱再补贴给大天河了

AMD楼还真是多,全地球的楼都是AMD的
作者: iamw2d    时间: 2013-6-15 18:42
首先 有本事 我大nv也用22nm造一个出来呗
第二  我大kepler的寄存器bank位冲突导致连理论测试都跑不到峰值性能 你就不说了?
作者: wzglwoc    时间: 2013-6-15 18:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: the_god_of_pig    时间: 2013-6-15 22:08
本帖最后由 the_god_of_pig 于 2013-6-15 22:11 编辑

什么样的心态把10%的优势找补成50%




Phi由大核心构成,效率当然比tesla低,这和设计水平没什么关系,如果Intel没有工艺优势当初也不会如此设计LRB和之后的Phi


基于x86的Phi可以套用intel的x86开发工具,性能也差不了多少外加打折自然有人买账

作者: asdfjkl    时间: 2013-6-16 23:25
the_god_of_pig 发表于 2013-6-15 22:08
什么样的心态把10%的优势找补成50%[shifty>


在HPC的基于不同的APP领域, DGEMM的成绩或许比Linpack更有代表性!
作者: junychen    时间: 2013-6-18 22:13
很不幸 Intel 没有16nm计划 基本是楼主自己意淫的。再说了 你光看理论性能干嘛?Intel的加速卡比 NV的加速卡 效率更高。反而不吃亏。而且Intel PHi 很多堆料在 缓存上面,相反 K20 效率在缓存上很抠门。而且论效率 绝对是Intel 和 AMD 的效率高,NV空有高理论性能罢了。
作者: frankincense    时间: 2013-6-18 22:50
wzglwoc 发表于 2013-6-15 12:51
AMD那黑心厂商把卖楼钱都卖游戏送游戏卡了,phi出过400美元的良心价-----老黄就是对GTX游戏卡敲骨吸髓也不 ...

400美刀是Intel半卖半送给高校科研的估价,而且还是早期版本的KNC
正式的Phi就算折扣也很难有这个价位
作者: frankincense    时间: 2013-6-18 22:58
xiaxin222a 发表于 2013-6-15 18:19
ATOM 核心的Phi,这个算是黑么?

架构上和现在的Atom一样都是基于古老的P54C内核再开发,也算是同源了。
不过Atom只是单核双线程,Phi做到单核四线程,后端的运算单元更是完全不同咯。
至于下一代Phi内核会否像Atom(Silvermont)引入乱序执行,恐怕可能性不高。
作者: iamw2d    时间: 2013-6-18 23:26
frankincense 发表于 2013-6-18 22:58
架构上和现在的Atom一样都是基于古老的P54C内核再开发,也算是同源了。
不过Atom只是单核双线程,Phi做到 ...

很大程度上拼吞吐率的东西 要是弄成乱序超标量 那intel真是脑子进屎了
作者: asdfjkl    时间: 2013-6-18 23:54
本帖最后由 asdfjkl 于 2013-6-18 23:55 编辑
junychen 发表于 2013-6-18 22:13
很不幸 Intel 没有16nm计划 基本是楼主自己意淫的。再说了 你光看理论性能干嘛?Intel的加速卡比 NV的加速卡 ...

算了吧,你说的这些结果完全没有数据支撑,根本就是你脑补的~~~  相反的,我为什么这么说是有成绩的。
1)[size=16.363636016845703px]Intel的加速卡比 NV的加速卡 效率更高。反而不吃亏。
[size=16.363636016845703px]2)[size=16.363636016845703px]而且论效率 绝对是Intel 和 AMD 的效率高.
[size=16.363636016845703px]

还有你不要拿CPU的效率和加速卡比,要比就是Intel的Xeon Phi和AMD的FireStream W9000和K20X比。
比单卡的DGEMM效率,或者互联以后的HPC的实际Linpack成绩/理论Linpack峰值,都行!想看看单位功耗的DGEMM成绩和Linpack成绩都OK!
看看谁的效率高!


这套天河2的Linpack效率大概61%,基本上是上一代Fermi Tesla计算卡的成绩。。。。



作者: Nv-fans    时间: 2013-6-18 23:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: huangpobu    时间: 2013-6-24 14:22
拿linpack这种代码来比当然是GPU占上风了。

之所以强调异构,原因之一(但不是全部)是CPU(多核,众核)与GPU适合不同的负载。比如CPU能够独立分支甚至分支预测,自动管理缓存,内存带宽和延迟都敏感,而GPU是SPM手动管理,依靠谓词寄存器来回切换低效处理分支,延迟不敏感而带宽极度敏感,光拿一种类型的代码来比,肯定是有漏洞的
作者: jhj9    时间: 2013-6-24 14:36
Nv-fans 发表于 2013-6-18 23:57
Tesla只能在AMD Intel底下跑,Nvidia的软肋就是没CPU,结果不自量力还想当老大
最後就是连个边都没了

AMD有x86 CPU,不想当老大又如何?下场如何大家都看到了
有还不如没有,一个季度亏损好几亿,哈哈哈哈
作者: xiaxin222a    时间: 2013-6-25 23:18
asdfjkl 发表于 2013-6-18 23:54
算了吧,你说的这些结果完全没有数据支撑,根本就是你脑补的~~~  相反的,我为什么这么说是有成绩的。
1 ...

61%的效率值哪里脑补的?
作者: asdfjkl    时间: 2013-6-25 23:53
xiaxin222a 发表于 2013-6-25 23:18
61%的效率值哪里脑补的?

Linpack实际峰值/Linpack理论峰值,自个算去~~~
当年,一班子人也是这么评价由Tesla C2050组成的天河1A的。




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4