POPPUR爱换

标题: Rv870原本是一个核心面积和G200b一样大的大家伙,结果被砍了 [打印本页]

作者: 什么?    时间: 2010-2-15 18:27
标题: Rv870原本是一个核心面积和G200b一样大的大家伙,结果被砍了


AMD本来想给NVIDIA一个惊喜,造个大家伙,但是鉴于柴扉的TSMC,为了不耽误工期(与win7同步上市),所以妥协了,造了一个稍微小点的。但是这个芯片对于看惯了Rv670、Rv770大小的NVIDIA来说,仍然把NV吓了一跳,因为它比通常意义上的小芯片(Rv670、770)要大很多
作者: 懿梵    时间: 2010-2-15 18:31
学习了,,,
作者: woaiyanwenjuan    时间: 2010-2-15 18:35
内部消息么???
作者: aibo    时间: 2010-2-15 18:44
嗯TSMC是万恶之源啊
作者: 浅色    时间: 2010-2-15 18:49
tsmc才是老大 决定一切
作者: skywalker_hao    时间: 2010-2-15 18:54
tsmc才是老大 决定一切
浅色 发表于 2010-2-15 18:49


nv也不是没反水过,参考NV40
作者: yamhill    时间: 2010-2-15 19:09
那……砍掉的部分是做什么的?
作者: goldman948    时间: 2010-2-15 19:11
拿不出来却放在**上说的行为,版上的A饭似乎都是解释为吹牛
作者: yamhill    时间: 2010-2-15 19:11
规模缩小而已,该有的都有。
AMOLED 发表于 2010-2-15 19:10

这个……有点不明白……
作者: yamhill    时间: 2010-2-15 19:13
带宽缩小,sp减少,相应的控制单元也减少,就是这样。
AMOLED 发表于 2010-2-15 19:13

按这样的话,确实是缩小规模了~
作者: earcandy    时间: 2010-2-15 20:06
本来就是R600的翻版,暴力堆积SP而已
作者: hoygosl    时间: 2010-2-15 20:08
按这样的话,确实是缩小规模了~
yamhill 发表于 2010-2-15 19:13



    说说看
作者: yamhill    时间: 2010-2-15 20:13
说说看
hoygosl 发表于 2010-2-15 20:08

看12楼
作者: 奶牛老仙    时间: 2010-2-15 20:16
提示: 作者被禁止或删除 内容自动屏蔽
作者: slr    时间: 2010-2-15 20:18
本来就是R600的翻版,暴力堆积SP而已
earcandy 发表于 2010-2-15 20:06
G200堆得出来也是本事,576mm^2的大家伙啊,怎么到费米却堆不出来了?
作者: 什么?    时间: 2010-2-15 20:33
本来就是R600的翻版,暴力堆积SP而已
earcandy 发表于 2010-2-15 20:06



    不可这样饭N
作者: akcadia    时间: 2010-2-15 20:41
G200堆得出来也是本事,576mm^2的大家伙啊,怎么到费米却堆不出来了?
slr 发表于 2010-2-15 20:18



    我觉得老拿费米来说事,你要分清楚,就跟统一渲染单元一样
费米是划时代的,人家注重的是科学计算领域。你不看看AMD,要下一代才加入这个所谓的什么通用计算。足足晚了一两代了。
作者: slr    时间: 2010-2-15 20:44
本帖最后由 slr 于 2010-2-15 20:46 编辑
我觉得老拿费米来说事,你要分清楚,就跟统一渲染单元一样
费米是划时代的,人家注重的是科学计 ...
akcadia 发表于 2010-2-15 20:41

桌面应用没看出什么需要“如此强大”的GPU来帮忙运算。要我说,先把CUDA编码做好,不支持2-pass的编码方式我认为只是糊弄新手。至于科学运算之类的,天国都堆出了个天河一号跑进TOP500前5——这是最通用的测试linpack。A卡不能跑科学运算纯属扯淡

当然,大家对费米的游戏性能还是认可的,怎么说也秒5870,希望价格不要太高
作者: kulanyee    时间: 2010-2-15 21:07
那么5890会是RV870的最终形态?
作者: ericman    时间: 2010-2-15 21:35
45倾角的R600不死,这也真长寿,还想在打一代啊!真是个彻头彻尾的“马甲大王”
作者: 什么?    时间: 2010-2-15 21:47
45倾角的R600不死,这也真长寿,还想在打一代啊!真是个彻头彻尾的“马甲大王”
ericman 发表于 2010-2-15 21:35



    当初被贬得一文不值的5D VLIW SIMD架构立了大功
ps:马甲这个词要慎用
作者: skywalker_hao    时间: 2010-2-15 22:11
anandtech这个文章不就是说,按照rv770继续放大,就会比gt200b还大
所以,ati想了个好办法,相当于放了两块RV770,结果就小了
作者: Edison    时间: 2010-2-15 22:44
AMD 的“好办法”就是对功能、性能进行裁减。
作者: slug    时间: 2010-2-15 22:50
LZ哪儿来的消息呀?
作者: Edison    时间: 2010-2-15 22:51
LZ哪儿来的消息呀?
slug 发表于 2010-2-15 22:50



    http://www.anandtech.com/video/showdoc.aspx?i=3740
作者: slug    时间: 2010-2-15 22:53
回复 29# Edison


    谢谢斑竹
作者: jocover    时间: 2010-2-15 23:03
怪不得opencl只能用1/4的显存,原来缩水了
作者: 菲利克丝    时间: 2010-2-15 23:25
回复 17# 奶牛老仙

估计这个应该直接飞跃了   制程的升级肯定会给我们不少的惊喜
作者: 牛奶不老    时间: 2010-2-16 00:03
现在明白4770是干什么用的吧?
作者: toshibacom    时间: 2010-2-16 00:04
本帖最后由 toshibacom 于 2010-2-16 00:07 编辑
AMD 的“好办法”就是对功能、性能进行裁减。
Edison 发表于 2010-2-15 22:44

不裁减,就不能和Win 7同步发行,就不能领先费米半年以上率先支持DX11,AMD要造的是游戏卡,GPGPU还不是他的重点。
现在AMD DX11从高端到低端全面布局完成,NV到目前为止还没有1快DX11的GPU发售。
作者: toshibacom    时间: 2010-2-16 00:08
游戏卡.....游戏机.....游戏卡...游戏机...

都不知道AFAN想要啥.
kvip 发表于 2010-2-16 00:06

目前为止,世界上绝大多数PC用户买独立显卡只有一个目的,打PC游戏。
作者: deadmeat    时间: 2010-2-16 00:10
提示: 作者被禁止或删除 内容自动屏蔽
作者: toshibacom    时间: 2010-2-16 00:11
那NV的好办法是啥?
prankfree1 发表于 2010-2-16 00:04

NV的办法是霸王硬上弓,求大求全,设计一颗让TSMC无法生产的超大核心,延期半年也在所不惜,期间用马 甲战术应付AMD。
作者: 牛奶不老    时间: 2010-2-16 00:13
游戏卡.....游戏机.....游戏卡...游戏机...

都不知道AFAN想要啥.
kvip 发表于 2010-2-16 00:06


不知道K神的N卡是买来干啥的
作者: toshibacom    时间: 2010-2-16 00:14
N饭说fermi会秒杀5970  A饭说年中6870会秒杀fermi....
N饭又说年底fermi二代秒杀6870.............. ...
deadmeat 发表于 2010-2-16 00:10

Fermi秒5970根本不可能,最多秒5870,看NV先前所有的官方宣传都是拿5870做对比而不敢拿5970,就知道Fermi有多少斤两了。
作者: CoreSolo    时间: 2010-2-16 00:15
估计是看N萎了才决定砍的
fairfox 发表于 2010-2-15 23:15



    仔细看原文吧,Cypress在0803就定型了。
作者: Laoxiangzhi    时间: 2010-2-16 00:16
越大越好么
作者: toshibacom    时间: 2010-2-16 00:17
不知道K神的N卡是买来干啥的
牛奶不老 发表于 2010-2-16 00:13

Nfan估计都是拿来用CUDA压片和跑folding@home的,后面那个还是有点正面意义的。
作者: CoreSolo    时间: 2010-2-16 00:27
本帖最后由 CoreSolo 于 2010-2-16 00:29 编辑

原文导读:
1、目录
2、R520的教训和影响:时间表优先政策
3、打造一个大核心RV870的观点,以及Carrell对小核心策略的坚持
4、对小核心策略的妥协原因及过程,主要还是在工艺上的考虑
5、双芯片产品的妥协:取消Sideport
6、Evergreen家族半年4颗GPU让一切变得顺利,以及为什么RV870没能像RV770一样小
7、40nm的代价:?*杀静⑽吹玫浇档停?
8、工艺和架构之间的抉择,老生常谈的核心大小与良率问题
9、RV740是如何拯救RV870的,而GF100又是为何缺少了工艺上的清道夫
10、EyeFinity技术,没看。。。
作者: 牛奶不老    时间: 2010-2-16 00:30
Nfan估计都是拿来用CUDA压片和跑folding@home的,后面那个还是有点正面意义的。
toshibacom 发表于 2010-2-16 00:17


这对一般用户来说,都是很遥远的,没有几个人会专门买回来干这两件事情
作者: Edison    时间: 2010-2-16 00:35
很显然对于部分人来说,GPU Computing 与游戏毫无瓜葛,微软 directcomputing 幻灯片中的例子他们是看不明白的。
作者: ericman    时间: 2010-2-16 00:36
N的性能设计一代可以应付一两代甚至三代A卡,费米和28nm二代目标应该是6870反观A社却疲于不停设计流片。唉!架构分歧后果差距巨大
作者: NV30F0    时间: 2010-2-16 00:38
amd每次都找anand来发这些东西,有意思。。。
作者: ericman    时间: 2010-2-16 00:40
N的性能设计一代可以应付一两代甚至三代A卡,费米和28nm二代目标应该是6870反观A社却疲于不停设计流片。唉!架构分歧后果差距巨大
作者: toshibacom    时间: 2010-2-16 00:47
很显然对于部分人来说,GPU Computing 与游戏毫无瓜葛,微软 directcomputing 幻灯片中的例子他们是看不明白的。
Edison 发表于 2010-2-16 00:35

很显然,微软directcomputing中GPU Computing说的是DX11,和OpenCL完全没关系,RV870跑DX11没有问题,OpenCL目前还跑得不好,而PC游戏性能是看DX11而不是看OpenCL的。
作者: ericman    时间: 2010-2-16 01:08
5870就成双核了,难道是胶水,AMD的cpu设计难道影响到了gpu。那个久远的双核伦是真的啊!看来A社被卖后影响蛮大滴:R600的ringbus首先砍,用桥接单卡能力斗增,然后直接装俩770
作者: UX201A    时间: 2010-2-16 01:10
那NV的好办法是啥?
prankfree1 发表于 2010-2-16 00:04


马甲套马甲再套马甲
作者: dxjzzqbx    时间: 2010-2-16 01:25
哎 费米到现在都买不到
我真不知道ls众多的nfan为什么还有脸说amd的不是呢~~
nv的好办法呢?难道就是凭各位在论坛上吹吗?
作者: defv4    时间: 2010-2-16 01:40
那NV的好办法是啥?
prankfree1 发表于 2010-2-16 00:04

方法就是直接改个威武的名字!
作者: deadmeat    时间: 2010-2-16 01:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: aibo    时间: 2010-2-16 01:56
本帖最后由 aibo 于 2010-2-16 01:59 编辑

nv这次罕见的没有探路就在高端强上新工艺,所以出问题也是正常。
回看以前,上一个高端强上新工艺的例子就是nv30

后来的
130nm: nv40
110nm:nv42探路,接着就出G70了。
90nm:G72探路,接着就是G71,最终boss的G80
65nm:传说中的G98以及G92探路,最终576mm2的GT200高潮了
55nm:G92b又立功了,然后GT200b
40nm:没有工兵,结果GF100把自己炸了
作者: slr    时间: 2010-2-16 02:00
AMD 的“好办法”就是对功能、性能进行裁减。
Edison 发表于 2010-2-15 22:44

AMD是为了造得出芯片,不是为了造个模型去给场下观众YY

500mm^2的芯片有这么好造?
作者: westlee    时间: 2010-2-16 10:13
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2010-2-16 10:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2010-2-16 10:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2010-2-16 10:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: kulanyee    时间: 2010-2-16 10:51
nv这次罕见的没有探路就在高端强上新工艺,所以出问题也是正常。
回看以前,上一个高端强上新工艺的例子就是nv30

后来的
130nm: nv40
110nm:nv42探路,接着就出G70了。
90nm:G72探路,接着就是G71,最终boss的G80
65nm:传说中的G98以及G92探路,最终576mm2的GT200高潮了
55nm:G92b又立功了,然后GT200b
40nm:没有工兵,结果GF100把自己炸了
aibo 发表于 2010-2-16 01:56


作者: toshibacom    时间: 2010-2-16 10:58
能够比对手早3个月以上量产,并且达到了4870x2的性能目标,也算完成任务了。应该说,这种裁剪还是合适 ...
westlee 发表于 2010-2-16 10:13

请把3个月以上改成6个月以上。
作者: 什么?    时间: 2010-2-16 11:03
本帖最后由 什么? 于 2010-2-16 11:06 编辑
N的性能设计一代可以应付一两代甚至三代A卡,费米和28nm二代目标应该是6870反观A社却疲于不停设计流片。唉! ...
ericman 发表于 2010-2-16 00:36

现在貌似是AMD设计一代R600架构对付了NV 6代显卡(gf8~gtx4xx)。
终于谁流片多少,看看
Geforce8 vs hd2000时代,A3,N3
          G80
R600
Rv630 G84
Rv610 G86

Geforce9 vs hd3000时代,A3,N4
Rv670  G92
            G94
Rv635  G96
Rv620  G98

GT2xx vs hd4000时代, A5,N6
Rv770  G200
            G92b
Rv790  G200b
Rv730
Rv710
Rv740  G218
            G216
            G215

高达 vs HD5000时代(已知的芯片),A4,N2
Rv870  
Rv840  
Rv830
Rv810
           GF100           GF104


AMD流出了15款芯片,NV也流出15款芯片。

不知道是谁疲于流片???
不过有一点可以确认,NV是疲于马甲
作者: toshibacom    时间: 2010-2-16 11:07
dx11秒5970还有一丝非常渺茫的希望,dx10性能肯定是不如的。
westlee 发表于 2010-2-16 10:15

你这个Nfan都这么说,那我更加对Fermi秒5970不报一丝希望了。
作者: koppie    时间: 2010-2-16 11:22
40nm其实有工兵,只不过是相对容易的GT210和220而已

nv这次罕见的没有探路就在高端强上新工艺,所以出问题也是正常。
回看以前,上一个高端强上新工艺的例子就 ...
aibo 发表于 2010-2-16 01:56

作者: hnso    时间: 2010-2-16 12:57
同样大小的芯片
NV性能,功耗 完败
作者: ericman    时间: 2010-2-16 14:03
nv在通用和physx走好远了(好几代经验),A社现在貌似不苟同(不屑为之),说不定终归还走到这条路,那时骑马都难追上啊…                 吼!吼!n社犹如醇酒,时间越久越醇香
作者: ericman    时间: 2010-2-16 14:04
nv在通用和physx走好远了(好几代经验),A社现在貌似不苟同(不屑为之),说不定终归还走到这条路,那时骑马都难追上啊…                 吼!吼!n社犹如醇酒,时间越久越醇香
作者: 奶牛老仙    时间: 2010-2-16 14:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: lemonninja    时间: 2010-2-16 15:57
如果ati真要造这么大的估计要在菲米之后上市了.
作者: 苯苯小哥    时间: 2010-2-16 16:35
楼主这不是瞎掰嘛 理想是美好的现实是残酷的,NV还想双512呢 ,AMD要真搞这个大家伙比费米还杯具,AMD向现实低头 虽然更为实际,但躲得了初一躲不过十五,迟早也要上通用计算,倒时候NV早下手
作者: 我有3个马甲    时间: 2010-2-16 16:55
楼主这不是瞎掰嘛 理想是美好的现实是残酷的,NV还想双512呢 ,AMD要真搞这个大家伙比费米还杯具,AMD向现实 ...
苯苯小哥 发表于 2010-2-16 16:35

AMD有CPU,AMD不怕。
作者: slr    时间: 2010-2-16 17:09
本帖最后由 slr 于 2010-2-16 17:10 编辑
說白了,Nvidia目前的GPU的三種功能:"物理加速[PhysX]”、"遊戲[Games]”、"通用計算[General purpose computing]”就相當於同一家餐館使用相同的廚具跟一大堆食材可以完成日韓菜、中國菜、法國西餐,以同時供大家享用。而AMD-ATI只能搞中國菜,而對日韓菜和法國西餐則是力不從心跟無能為力!
empressgirlPCI 发表于 2010-2-16 15:57

费米是通用计算,天河一号上面的4870X2就不是了?
另外请不要把物理加速[PhysX] 与GPU-PHYSX混在一起。绝大多数物理加速均是CPU完成的。
遊戲[Games]这个我没看到NV宣传拿游戏性能作对比,我们买的是游戏卡,不是通用计算卡

继续吹水吧,有本事也堆个像天河一号的异架构来跑linpack冲进TOP500 前五
作者: 什么?    时间: 2010-2-16 17:19
說白了,Nvidia目前的GPU的三種功能:"物理加速”、"遊戲[Games]”、"通用計算[General purpose computing] ...
empressgirlPCI 发表于 2010-2-16 15:57


你说错了,Physx for CUDA也是通用计算里的一种应用而已,请不要把物理加速单独那出来说。游戏和通用计算,AMD目前偏游戏一点,但通用计算也不弱,毕竟Top500里能排第5,实打实的linpack跑完了。

要拿做菜比,AMD中国菜、法国菜、日本料理也都能做,不过有个菜谱叫“Physx”,这个被NV买下后当招牌菜在工商备案了,AMD如果做这道菜就不能叫physx了
作者: 什么?    时间: 2010-2-16 17:26
楼主这不是瞎掰嘛 理想是美好的现实是残酷的,NV还想双512呢 ,AMD要真搞这个大家伙比费米还杯具,AMD向现实 ...
苯苯小哥 发表于 2010-2-16 16:35

我瞎掰啥了?那是anandtech访谈里AMD PR说的,我只是把一小段内容搬运过来而已
作者: CC9K    时间: 2010-2-16 21:49
AMD的通用计算是和CPU高度结合,而NV是想要取代CPU,方向不同
作者: 380    时间: 2010-2-17 13:16
提示: 作者被禁止或删除 内容自动屏蔽
作者: yamhill    时间: 2010-2-17 13:58
說白了,Nvidia目前的GPU的三種功能:"物理加速”、"遊戲[Games]”、"通用計算[General purpose computing] ...
empressgirlPCI 发表于 2010-2-16 15:57

通俗易懂,支持
作者: yamhill    时间: 2010-2-17 14:00
你说错了,Physx for CUDA也是通用计算里的一种应用而已,请不要把物理加速单独那出来说。游戏和通用计 ...
什么? 发表于 2010-2-16 17:19

中国菜、法国菜、日本料理也都是食物

就拿制药来说,不是每个厂都能造云南白药

多说无益…………
作者: yamhill    时间: 2010-2-17 14:05
关于HPC,我很想知道这样一组数据

就是性能和核心数的比例,以及性能功耗比
作者: yamhill    时间: 2010-2-17 14:07
刚翻了一下TOP10的资料,发现天河一号的Rpeak/Rmax是最大的……小白我不明白什么意思
作者: jocover    时间: 2010-2-17 14:38
刚翻了一下TOP10的资料,发现天河一号的Rpeak/Rmax是最大的……小白我不明白什么意思
yamhill 发表于 2010-2-17 14:07

RMax:实际GFlops值
RPeak:理论GFlops值
目前来看异构运算效率都不高
作者: 菲利克丝    时间: 2010-2-17 14:41
估计今年的好戏发生在秋季  我和秋天有个约会的说  哈哈
作者: toshibacom    时间: 2010-2-17 14:46
刚翻了一下TOP10的资料,发现天河一号的Rpeak/Rmax是最大的……小白我不明白什么意思
yamhill 发表于 2010-2-17 14:07

就是GPU异构的实际效率没有CPU的高,这个是没办法的,NV的也GPU效率也不高,feimi还没出来,不知道,但是已有的NV GPU效率不会比AMD的4870X2更高。
作者: 好多好多水    时间: 2010-2-17 14:54
都是浮云
作者: 什么?    时间: 2010-2-17 14:57
中国菜、法国菜、日本料理也都是食物

就拿制药来说,不是每个厂都能造云南白药

多说无益…………
yamhill 发表于 2010-2-17 14:00

你说的挺多的了
作者: jocover    时间: 2010-2-17 14:59
就是GPU异构的实际效率没有CPU的高,这个是没办法的,NV的也GPU效率也不高,feimi还没出来,不知道,但是 ...
toshibacom 发表于 2010-2-17 14:46

不知道你是怎么计算出纯GPU效率的
我用RMax和RPeak算了一下,使用4870的天河1号是46%,使用GT200的GSIC是53%
作者: toshibacom    时间: 2010-2-17 14:59
本帖最后由 toshibacom 于 2010-2-17 15:38 编辑
关于HPC,我很想知道这样一组数据

就是性能和核心数的比例,以及性能功耗比
yamhill 发表于 2010-2-17 14:05

HPC性能与核心数的比例是没有意义的,每一种核心设计时就不一样,有些是大核心,性能强劲,性能一个就顶好几个小核心,有些设计思路就是小核心堆砌。性能与功耗比倒是有点意义,有一个相对top500的网站,叫做green 500,网址是http://www.green500.org  ,在最新排名中,天河一号排名世界第八,379.24MFLOPS/W,与排名第一的节能王722.98MFLOPS/W还是有差距的。不过在TOP500前20名的HPC中,天河一号性能功耗比排第二,仅次于top500中性能第二的IBM 走鹃。
作者: 什么?    时间: 2010-2-17 15:03
不知道你是怎么计算出纯GPU效率的
我用RMax和RPeak算了一下,使用4870的天河1号是46%,使用GT200的GSIC是 ...
jocover 发表于 2010-2-17 14:59


你是怎么算的,我记得以前算过,4870和GT200都没那么高
作者: jocover    时间: 2010-2-17 15:08
你是怎么算的,我记得以前算过,4870和GT200都没那么高
什么? 发表于 2010-2-17 15:03

                          RMax         RPeak
天河1号            563100        1206190
GSIC Center      87010        163188
做个除法算出来的
作者: toshibacom    时间: 2010-2-17 15:09
RMax         RPeak
天河1号            563100        1206190
GSIC Center      87010         ...
jocover 发表于 2010-2-17 15:08

你也太简单化了,这2套系统中都有大量CPU,哪能直接这么除。
作者: jocover    时间: 2010-2-17 15:10
你也太简单化了,这2套系统中都有大量CPU,哪能直接这么除。
toshibacom 发表于 2010-2-17 15:09

所以想问你是怎么算出GPU效率的,TOP500上没查到
作者: 什么?    时间: 2010-2-17 15:19
所以想问你是怎么算出GPU效率的,TOP500上没查到
jocover 发表于 2010-2-17 15:10

我以前算过,因为CPU和型号、频率、数量都知道,所以CPU的计算当量都能算出了,如果CPU的效率按照80%算,那GPU效率仅2x%多,如果CPU效率 70%算,那GPU的效率就提升到3x%多了
作者: slr    时间: 2010-2-17 15:23
本帖最后由 slr 于 2010-2-17 15:31 编辑


天国官方公布的这张图。。。吹牛的峰值性能不错,实际一般般
作者: toshibacom    时间: 2010-2-17 15:33
天国官方公布的这张图。。。吹牛的峰值性能不错,实际一般般
slr 发表于 2010-2-17 15:23

一般一般,世界第五。功耗性能比世界第八,做得都还可以。
作者: slr    时间: 2010-2-17 16:10
本帖最后由 slr 于 2010-2-17 16:12 编辑

参见这个贴子http://we.pcinlife.com/thread-1298834-1-1.html,采用Infiniband QDR互联的XEON 55XX系列,TOP500 第10位的为86.9%,第12位为84.5%,第13位为89.2%,第14位为89.5%。此处以85%最低效率计算5120颗E5540。

575Mhz下的4870X2理论双精度浮点能力为0.575*2*800/5*2=368GF ,2560块能提供942.08TF。85%计算Xeon E5540部分,2.53*4*4*5120*0.85=176.16TF,占整个系统563.1TF的31.3%,GPU部分的Linpack约为 563.1-176.1=386.9TF,效率为41%。也就是说4870X2在LINPACK上效率撑死41%。
作者: 奶牛老仙    时间: 2010-2-17 16:17
提示: 作者被禁止或删除 内容自动屏蔽
作者: toshibacom    时间: 2010-2-17 17:08
参见这个贴子,采用Infiniband QDR互联的XEON 55XX系列,TOP500 第10位的为86.9%,第12位为84.5%,第13位为 ...
slr 发表于 2010-2-17 16:10

41%不错了,看下面这个东京工业大学的
http://computer.kaosheng.com/200812271129551957.html
,在2006年6月TOP500中位居全球第7位。虽然之后该系统也不断升级,提高性能,但很难赶上全球高性能计算机的快速发展速度,在2008年6月公布的TOP500中,运算速度为67.7TFLOPS,排名跌至第24位。
————————————————————————————————————
我们可以认为,这台机器纯CPU运算能力67.7T。最新2009年top500排56的这台机器,速度是87.01T,也就是87.01 - 67.7 = 19.31T是由170台Tesla S1070提供,我们知道Tesla S1070理论双精度是0.345T,170台就是0.345 x 170 = 58.65T,19.31/58.65 = 32.9%,所以NV吹嘘半天的GPGPU,在TOP500中最好的效率也就32.9%,而天河一号的4870X2上面的兄弟计算了,有41%
作者: yamhill    时间: 2010-2-17 17:31
HPC性能与核心数的比例是没有意义的,每一种核心设计时就不一样,有些是大核心,性能强劲,性能一个就顶好 ...
toshibacom 发表于 2010-2-17 14:59

我不管有没有意义,我只想知道……
作者: yamhill    时间: 2010-2-17 17:32
RMax:实际GFlops值
RPeak:理论GFlops值
目前来看异构运算效率都不高
jocover 发表于 2010-2-17 14:38

嗯……可惜我只在top10中看了看

要是能找到所有异构型机器的这个比例,应该更能说明问题
作者: yamhill    时间: 2010-2-17 17:33
就是GPU异构的实际效率没有CPU的高,这个是没办法的,NV的也GPU效率也不高,feimi还没出来,不知道,但是 ...
toshibacom 发表于 2010-2-17 14:46

哈哈

异构的linpack效率不高是事实~有待改进~

至于对我的意义嘛,只要跑FAH快就行啦~对比FAH上GPU的表现,可以会急死一群人的~
作者: haoiihao    时间: 2010-2-17 20:10
NV显卡 在哪国
作者: haoiihao    时间: 2010-2-17 20:12
NV显卡 在哪国
作者: slr    时间: 2010-2-17 20:20
哈哈

异构的linpack效率不高是事实~有待改进~

至于对我的意义嘛,只要跑FAH快就行啦~对比FAH上G ...
yamhill 发表于 2010-2-17 17:33

非商业化的东西,没有动力进行更高效率的编程




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4