POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 5251|回复: 23
打印 上一主题 下一主题

看到某人写的天河2的文章,实在为其技术基础捏把汗。。。

[复制链接]
跳转到指定楼层
#
发表于 2013-6-14 23:57 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
本帖最后由 asdfjkl 于 2013-6-15 12:43 编辑

天河2用了Intel和Phi,某小编就说啥NV的Tesla穷途末路,完全是主观臆断,没有一点技术上的分析,下面把我Google到的一些数据给看家看看,Titan用的的K20X,天河2用的Phi到底,孰强孰弱。  AMD,拿着你的FirePro W9000去门口小卖部打酱油去!

型号                                   Xeon Phi                                                    K20X
面积                                 750 mm2(22nm)                                    540 mm2(28nm)
等效面积 (28nm)               1216 mm2                                               540 mm2
等效面积 (22nm)               750 mm2                                                 333 mm2
功耗:                                 225W                                                     225 W     
FP64 Peak:                        1.0 TFLOPS                                           1.3 TFLOPS
DGEMM:                           800 GFLOPS                                           1.2  TFLOPS
价格:                                 相仿,                                                     相仿。


看了实打实的数据,还有啥要说的!   
轮面积,Xeon Phi的面积是对手K20X 2倍有余; 轮性能,只有对手的66 -73%;
就这样的产品的技术指标,估计在HPC里面打酱油的W9000也能达到,搞不好W9000更好,但AMD如果做到这个水准,铁定也是无法拿出来卖的。 原因很简单很简单: 面积比对手大一倍,成本估计要贵3倍(芯片越大良率越低),价格还要相仿,岂不卖一块亏一块么?  但Intel做成这样,却能卖,还能拿下大单,凭借的就是工艺的领先,享受到了新工艺的成本优势;明眼人从技术的指标上看,其实Phi是落后约对手的K20X。 那个啥啥啥,还在网站上发文的,真心为你的技术基础汗颜呀。。。 大家看看在当前的实现方法上,是GPU还是专门的多核CPU 计算卡用于HPC有优势呢?


但抛开技术标准,Intel的计算加速卡其实很了不起的!(我个人在技术和战略上一直很佩服Intel的) 首先,它的节奏很快,从第一代KNF,到第二代的KNC,时间很短,进度很快,推向市场很快很快,Intel走的很坚决。的确给了对手NV Tesla很大的压力,可以这么说横空出世的Xeon Phi抢走了K20X的挺大的一片市场。没有Phi,也没有啥W9000多少事。  第一代KNF,基本没客户买,Intel主动送给各大科研机构和高校使用;第二代成本高于对手,仍然果断上市。  看过Intel 计算加速卡路线图就知道,Intel真正厉害的估计是下一代的Xeon phi了,基于最新的16nm工艺,听说是ATOM内核的,性能预计会提升3-4倍,这个还真正是NV正面强敌了。NV倘若扛住了,HPC市场双雄鼎立,以后还有看头;倘若顶不住的话,以后HPC市场的路难走了。。。

为了和Intel的下一代计算加速卡竞争,我给老黄支个招: 赶紧把GPU用于通用计算的研发经费增加一倍,为啥增加一倍这么多?! 太明显不过了,下一代要是扛不住,以后再想发展的基础就没了!!!
有些人可能想问,把Tesla的销售费用增加一倍有效么?忽悠些小白和‘专家’就能抗住下一代Xeon Phi吗? 这个么,对AMD或许可能有效,对于NV还是算了吧。。。
23#
 楼主| 发表于 2013-6-25 23:53 | 只看该作者
xiaxin222a 发表于 2013-6-25 23:18
61%的效率值哪里脑补的?

Linpack实际峰值/Linpack理论峰值,自个算去~~~
当年,一班子人也是这么评价由Tesla C2050组成的天河1A的。
回复 支持 反对

使用道具 举报

22#
发表于 2013-6-25 23:18 | 只看该作者
asdfjkl 发表于 2013-6-18 23:54
算了吧,你说的这些结果完全没有数据支撑,根本就是你脑补的~~~  相反的,我为什么这么说是有成绩的。
1 ...

61%的效率值哪里脑补的?
回复 支持 反对

使用道具 举报

21#
发表于 2013-6-24 14:36 | 只看该作者
Nv-fans 发表于 2013-6-18 23:57
Tesla只能在AMD Intel底下跑,Nvidia的软肋就是没CPU,结果不自量力还想当老大
最後就是连个边都没了

AMD有x86 CPU,不想当老大又如何?下场如何大家都看到了
有还不如没有,一个季度亏损好几亿,哈哈哈哈
回复 支持 反对

使用道具 举报

20#
发表于 2013-6-24 14:22 | 只看该作者
拿linpack这种代码来比当然是GPU占上风了。

之所以强调异构,原因之一(但不是全部)是CPU(多核,众核)与GPU适合不同的负载。比如CPU能够独立分支甚至分支预测,自动管理缓存,内存带宽和延迟都敏感,而GPU是SPM手动管理,依靠谓词寄存器来回切换低效处理分支,延迟不敏感而带宽极度敏感,光拿一种类型的代码来比,肯定是有漏洞的
回复 支持 反对

使用道具 举报

头像被屏蔽
19#
发表于 2013-6-18 23:57 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

18#
 楼主| 发表于 2013-6-18 23:54 | 只看该作者
本帖最后由 asdfjkl 于 2013-6-18 23:55 编辑
junychen 发表于 2013-6-18 22:13
很不幸 Intel 没有16nm计划 基本是楼主自己意淫的。再说了 你光看理论性能干嘛?Intel的加速卡比 NV的加速卡 ...

算了吧,你说的这些结果完全没有数据支撑,根本就是你脑补的~~~  相反的,我为什么这么说是有成绩的。
1)[size=16.363636016845703px]Intel的加速卡比 NV的加速卡 效率更高。反而不吃亏。
[size=16.363636016845703px]2)[size=16.363636016845703px]而且论效率 绝对是Intel 和 AMD 的效率高.
[size=16.363636016845703px]

还有你不要拿CPU的效率和加速卡比,要比就是Intel的Xeon Phi和AMD的FireStream W9000和K20X比。
比单卡的DGEMM效率,或者互联以后的HPC的实际Linpack成绩/理论Linpack峰值,都行!想看看单位功耗的DGEMM成绩和Linpack成绩都OK!
看看谁的效率高!


这套天河2的Linpack效率大概61%,基本上是上一代Fermi Tesla计算卡的成绩。。。。


回复 支持 反对

使用道具 举报

17#
发表于 2013-6-18 23:26 | 只看该作者
frankincense 发表于 2013-6-18 22:58
架构上和现在的Atom一样都是基于古老的P54C内核再开发,也算是同源了。
不过Atom只是单核双线程,Phi做到 ...

很大程度上拼吞吐率的东西 要是弄成乱序超标量 那intel真是脑子进屎了
回复 支持 反对

使用道具 举报

16#
发表于 2013-6-18 22:58 来自手机 | 只看该作者
xiaxin222a 发表于 2013-6-15 18:19
ATOM 核心的Phi,这个算是黑么?

架构上和现在的Atom一样都是基于古老的P54C内核再开发,也算是同源了。
不过Atom只是单核双线程,Phi做到单核四线程,后端的运算单元更是完全不同咯。
至于下一代Phi内核会否像Atom(Silvermont)引入乱序执行,恐怕可能性不高。
回复 支持 反对

使用道具 举报

15#
发表于 2013-6-18 22:50 来自手机 | 只看该作者
wzglwoc 发表于 2013-6-15 12:51
AMD那黑心厂商把卖楼钱都卖游戏送游戏卡了,phi出过400美元的良心价-----老黄就是对GTX游戏卡敲骨吸髓也不 ...

400美刀是Intel半卖半送给高校科研的估价,而且还是早期版本的KNC
正式的Phi就算折扣也很难有这个价位
回复 支持 反对

使用道具 举报

14#
发表于 2013-6-18 22:13 | 只看该作者
很不幸 Intel 没有16nm计划 基本是楼主自己意淫的。再说了 你光看理论性能干嘛?Intel的加速卡比 NV的加速卡 效率更高。反而不吃亏。而且Intel PHi 很多堆料在 缓存上面,相反 K20 效率在缓存上很抠门。而且论效率 绝对是Intel 和 AMD 的效率高,NV空有高理论性能罢了。
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2013-6-16 23:25 | 只看该作者
the_god_of_pig 发表于 2013-6-15 22:08
什么样的心态把10%的优势找补成50%[shifty>


在HPC的基于不同的APP领域, DGEMM的成绩或许比Linpack更有代表性!
回复 支持 反对

使用道具 举报

12#
发表于 2013-6-15 22:08 | 只看该作者
本帖最后由 the_god_of_pig 于 2013-6-15 22:11 编辑

什么样的心态把10%的优势找补成50%




Phi由大核心构成,效率当然比tesla低,这和设计水平没什么关系,如果Intel没有工艺优势当初也不会如此设计LRB和之后的Phi


基于x86的Phi可以套用intel的x86开发工具,性能也差不了多少外加打折自然有人买账
回复 支持 反对

使用道具 举报

头像被屏蔽
11#
发表于 2013-6-15 18:49 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

10#
发表于 2013-6-15 18:42 | 只看该作者
首先 有本事 我大nv也用22nm造一个出来呗
第二  我大kepler的寄存器bank位冲突导致连理论测试都跑不到峰值性能 你就不说了?
回复 支持 反对

使用道具 举报

9#
发表于 2013-6-15 18:37 | 只看该作者
wzglwoc 发表于 2013-6-15 18:21
把卖楼钱都买游戏送游戏卡用户了没钱再补贴给大天河了

AMD楼还真是多,全地球的楼都是AMD的
回复 支持 反对

使用道具 举报

头像被屏蔽
8#
发表于 2013-6-15 18:21 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

7#
发表于 2013-6-15 18:19 | 只看该作者
ATOM 核心的Phi,这个算是黑么?
回复 支持 反对

使用道具 举报

6#
 楼主| 发表于 2013-6-15 17:17 | 只看该作者
wzglwoc 发表于 2013-6-15 12:51
AMD那黑心厂商把卖楼钱都卖游戏送游戏卡了,phi出过400美元的良心价-----老黄就是对GTX游戏卡敲骨吸髓也不 ...

老黄黑心那是‘公认’的,不是听闻AMD以厚道出名么? 怎么不能搞个399美金的W9000和Intel的Phi竞争呢?
回复 支持 反对

使用道具 举报

头像被屏蔽
5#
发表于 2013-6-15 12:51 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2013-6-15 12:43 | 只看该作者
lemonninja 发表于 2013-6-15 01:23
phi现在的优势是可以白送

AMD的W9000要是白送,估计也能拿下天河2的订单的,可惜了。。。。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2026-6-15 21:50

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表