看到某人写的天河2的文章，实在为其技术基础捏把汗。。。

asdfjkl · 发表于 2013-6-14 23:57

本帖最后由 asdfjkl 于 2013-6-15 12:43 编辑

天河2用了Intel和Phi，某小编就说啥NV的Tesla穷途末路，完全是主观臆断，没有一点技术上的分析，下面把我Google到的一些数据给看家看看，Titan用的的K20X，天河2用的Phi到底，孰强孰弱。  AMD，拿着你的FirePro W9000去门口小卖部打酱油去！

型号                                  Xeon Phi                                                 K20X
面积                               750 mm2(22nm)                                  540 mm2(28nm)
等效面积 (28nm)             1216 mm2                                              540 mm2
等效面积 (22nm)             750 mm2                                              333 mm2
功耗：                               225W                                                    225 W
FP64 Peak:                      1.0 TFLOPS                                        1.3 TFLOPS
DGEMM:                         800 GFLOPS                                        1.2  TFLOPS
价格：                               相仿，                                                    相仿。

看了实打实的数据，还有啥要说的！
轮面积，Xeon Phi的面积是对手K20X 2倍有余；轮性能，只有对手的66 -73%；
就这样的产品的技术指标，估计在HPC里面打酱油的W9000也能达到，搞不好W9000更好，但AMD如果做到这个水准，铁定也是无法拿出来卖的。原因很简单很简单：面积比对手大一倍，成本估计要贵3倍（芯片越大良率越低），价格还要相仿，岂不卖一块亏一块么？  但Intel做成这样，却能卖，还能拿下大单，凭借的就是工艺的领先，享受到了新工艺的成本优势；明眼人从技术的指标上看，其实Phi是落后约对手的K20X。那个啥啥啥，还在网站上发文的，真心为你的技术基础汗颜呀。。。大家看看在当前的实现方法上，是GPU还是专门的多核CPU 计算卡用于HPC有优势呢？

但抛开技术标准，Intel的计算加速卡其实很了不起的！（我个人在技术和战略上一直很佩服Intel的）首先，它的节奏很快，从第一代KNF，到第二代的KNC，时间很短，进度很快，推向市场很快很快，Intel走的很坚决。的确给了对手NV Tesla很大的压力，可以这么说横空出世的Xeon Phi抢走了K20X的挺大的一片市场。没有Phi，也没有啥W9000多少事。  第一代KNF，基本没客户买，Intel主动送给各大科研机构和高校使用；第二代成本高于对手，仍然果断上市。  看过Intel 计算加速卡路线图就知道，Intel真正厉害的估计是下一代的Xeon phi了，基于最新的16nm工艺，听说是ATOM内核的，性能预计会提升3-4倍，这个还真正是NV正面强敌了。NV倘若扛住了,HPC市场双雄鼎立，以后还有看头；倘若顶不住的话，以后HPC市场的路难走了。。。

为了和Intel的下一代计算加速卡竞争，我给老黄支个招：赶紧把GPU用于通用计算的研发经费增加一倍，为啥增加一倍这么多？！太明显不过了，下一代要是扛不住，以后再想发展的基础就没了！！！
有些人可能想问，把Tesla的销售费用增加一倍有效么？忽悠些小白和‘专家’就能抗住下一代Xeon Phi吗？这个么，对AMD或许可能有效，对于NV还是算了吧。。。

asdfjkl · 发表于 2013-6-25 23:53

xiaxin222a 发表于 2013-6-25 23:18
61%的效率值哪里脑补的？

Linpack实际峰值/Linpack理论峰值，自个算去~~~
当年，一班子人也是这么评价由Tesla C2050组成的天河1A的。

xiaxin222a · 发表于 2013-6-25 23:18

asdfjkl 发表于 2013-6-18 23:54
算了吧，你说的这些结果完全没有数据支撑，根本就是你脑补的~~~ 相反的，我为什么这么说是有成绩的。
1 ...

61%的效率值哪里脑补的？

jhj9 · 发表于 2013-6-24 14:36

Nv-fans 发表于 2013-6-18 23:57
Tesla只能在AMD Intel底下跑，Nvidia的软肋就是没CPU，结果不自量力还想当老大
最後就是连个边都没了

AMD有x86 CPU，不想当老大又如何？下场如何大家都看到了
有还不如没有，一个季度亏损好几亿，哈哈哈哈

huangpobu · 发表于 2013-6-24 14:22

拿linpack这种代码来比当然是GPU占上风了。

之所以强调异构，原因之一（但不是全部）是CPU（多核，众核）与GPU适合不同的负载。比如CPU能够独立分支甚至分支预测，自动管理缓存，内存带宽和延迟都敏感，而GPU是SPM手动管理，依靠谓词寄存器来回切换低效处理分支，延迟不敏感而带宽极度敏感，光拿一种类型的代码来比，肯定是有漏洞的

Nv-fans · 发表于 2013-6-18 23:57

提示: 作者被禁止或删除内容自动屏蔽

asdfjkl · 发表于 2013-6-18 23:54

本帖最后由 asdfjkl 于 2013-6-18 23:55 编辑

junychen 发表于 2013-6-18 22:13
很不幸 Intel 没有16nm计划基本是楼主自己意淫的。再说了你光看理论性能干嘛？Intel的加速卡比 NV的加速卡 ...

算了吧，你说的这些结果完全没有数据支撑，根本就是你脑补的~~~ 相反的，我为什么这么说是有成绩的。
1）[size=16.363636016845703px]Intel的加速卡比 NV的加速卡效率更高。反而不吃亏。
[size=16.363636016845703px]2)[size=16.363636016845703px]而且论效率绝对是Intel 和 AMD 的效率高.
[size=16.363636016845703px]

还有你不要拿CPU的效率和加速卡比，要比就是Intel的Xeon Phi和AMD的FireStream W9000和K20X比。
比单卡的DGEMM效率，或者互联以后的HPC的实际Linpack成绩/理论Linpack峰值，都行！想看看单位功耗的DGEMM成绩和Linpack成绩都OK！
看看谁的效率高！

这套天河2的Linpack效率大概61%，基本上是上一代Fermi Tesla计算卡的成绩。。。。

iamw2d · 发表于 2013-6-18 23:26

frankincense 发表于 2013-6-18 22:58
架构上和现在的Atom一样都是基于古老的P54C内核再开发，也算是同源了。
不过Atom只是单核双线程，Phi做到 ...

很大程度上拼吞吐率的东西要是弄成乱序超标量那intel真是脑子进屎了

frankincense · 发表于 2013-6-18 22:58

xiaxin222a 发表于 2013-6-15 18:19
ATOM 核心的Phi，这个算是黑么？

架构上和现在的Atom一样都是基于古老的P54C内核再开发，也算是同源了。
不过Atom只是单核双线程，Phi做到单核四线程，后端的运算单元更是完全不同咯。
至于下一代Phi内核会否像Atom（Silvermont）引入乱序执行，恐怕可能性不高。

frankincense · 发表于 2013-6-18 22:50

wzglwoc 发表于 2013-6-15 12:51
AMD那黑心厂商把卖楼钱都卖游戏送游戏卡了，phi出过400美元的良心价-----老黄就是对GTX游戏卡敲骨吸髓也不 ...

400美刀是Intel半卖半送给高校科研的估价，而且还是早期版本的KNC
正式的Phi就算折扣也很难有这个价位

junychen · 发表于 2013-6-18 22:13

很不幸 Intel 没有16nm计划基本是楼主自己意淫的。再说了你光看理论性能干嘛？Intel的加速卡比 NV的加速卡效率更高。反而不吃亏。而且Intel PHi 很多堆料在缓存上面，相反 K20 效率在缓存上很抠门。而且论效率绝对是Intel 和 AMD 的效率高，NV空有高理论性能罢了。

asdfjkl · 发表于 2013-6-16 23:25

the_god_of_pig 发表于 2013-6-15 22:08
什么样的心态把10%的优势找补成50%[shifty>

在HPC的基于不同的APP领域， DGEMM的成绩或许比Linpack更有代表性！

the_god_of_pig · 发表于 2013-6-15 22:08

本帖最后由 the_god_of_pig 于 2013-6-15 22:11 编辑

什么样的心态把10%的优势找补成50%

Phi由大核心构成，效率当然比tesla低，这和设计水平没什么关系，如果Intel没有工艺优势当初也不会如此设计LRB和之后的Phi

基于x86的Phi可以套用intel的x86开发工具，性能也差不了多少外加打折自然有人买账

wzglwoc · 发表于 2013-6-15 18:49

提示: 作者被禁止或删除内容自动屏蔽

iamw2d · 发表于 2013-6-15 18:42

首先有本事我大nv也用22nm造一个出来呗
第二我大kepler的寄存器bank位冲突导致连理论测试都跑不到峰值性能你就不说了？

coollab · 发表于 2013-6-15 18:37

wzglwoc 发表于 2013-6-15 18:21
把卖楼钱都买游戏送游戏卡用户了没钱再补贴给大天河了

AMD楼还真是多，全地球的楼都是AMD的

wzglwoc · 发表于 2013-6-15 18:21

提示: 作者被禁止或删除内容自动屏蔽

xiaxin222a · 发表于 2013-6-15 18:19

ATOM 核心的Phi，这个算是黑么？

asdfjkl · 发表于 2013-6-15 17:17

wzglwoc 发表于 2013-6-15 12:51
AMD那黑心厂商把卖楼钱都卖游戏送游戏卡了，phi出过400美元的良心价-----老黄就是对GTX游戏卡敲骨吸髓也不 ...

老黄黑心那是‘公认’的，不是听闻AMD以厚道出名么？怎么不能搞个399美金的W9000和Intel的Phi竞争呢？

wzglwoc · 发表于 2013-6-15 12:51

提示: 作者被禁止或删除内容自动屏蔽

asdfjkl · 发表于 2013-6-15 12:43

lemonninja 发表于 2013-6-15 01:23
phi现在的优势是可以白送

AMD的W9000要是白送，估计也能拿下天河2的订单的，可惜了。。。。。

帐号		自动登录	找回密码
密码			注册

Nv-fans Nv-fans 当前离线积分 9 IP卡狗仔卡头像被屏蔽	19^# 发表于 2013-6-18 23:57 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Nv-fans Nv-fans 当前离线积分 9 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽	11^# 发表于 2013-6-15 18:49 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽	8^# 发表于 2013-6-15 18:21 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽	5^# 发表于 2013-6-15 12:51 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
wzglwoc wzglwoc 当前离线积分 4 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

看到某人写的天河2的文章，实在为其技术基础捏把汗。。。

浏览过的版块