POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: RealT
打印 上一主题 下一主题

橡树岭的纸面上的Fermi HPC悲剧了吗?

[复制链接]
头像被屏蔽
41#
发表于 2009-12-18 00:36 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

42#
发表于 2009-12-18 01:42 | 只看该作者
80核是实验室的东西,不是可量产的
回复 支持 反对

使用道具 举报

43#
发表于 2009-12-18 04:49 | 只看该作者
主频2.6GHz、单颗浮点性能10.4GFlops
6訷 发表于 2009-12-17 15:46


理论性能很好算啊,核心数*频率*4 就对了
这就是胡扯的
算出来是62.4好不
回复 支持 反对

使用道具 举报

44#
发表于 2009-12-18 04:54 | 只看该作者
HPL对比测试的两个平台介绍,AMD方面为皓龙2435“伊斯坦布尔”系统(六核心,主频2.6GHz,16GB 800MHz DDR2 ...
tomsmith123 发表于 2009-12-17 18:00


国内枪文就不要贴出来了
回复 支持 反对

使用道具 举报

45#
发表于 2009-12-18 05:00 | 只看该作者
80核是实验室的东西,不是可量产的
CC9K 发表于 2009-12-18 01:42


80核心不具备完整的CPU功能,不能商业化
Intel最近拿出一个48核心x86核心+2D mesh互联,这个才是能实际用的
回复 支持 反对

使用道具 举报

46#
发表于 2009-12-18 06:49 | 只看该作者

您是来娱乐大家的。

主频2.6GHz、单颗浮点性能10.4GFlops
6訷 发表于 2009-12-17 15:46
回复 支持 反对

使用道具 举报

47#
发表于 2009-12-18 06:53 | 只看该作者
本帖最后由 bessel 于 2009-12-18 06:57 编辑

我觉得在60G左右,你似乎算错了?

回复  6訷
100W CPU 以Istanbul 为例(Cray XT5 的装备),目前大致是90GFlops 双精度,而且通用性更好。 ...
tomsmith123 发表于 2009-12-17 14:03
回复 支持 反对

使用道具 举报

48#
发表于 2009-12-18 06:58 | 只看该作者
抄的还是自己写的,很难找出对的部分哟。

科学研究中的计算问题计算机化了之后通常是矩阵运算,而Linpack和Eispack是标准的矩阵运算程序Library,所以它的性能能比较准确的反映HPC的实际计算效率
虽然逐渐被Lapack取代,其在理论评估计算能力上还是有很大现实意义的。
koppie 发表于 2009-12-17 23:20
回复 支持 反对

使用道具 举报

49#
发表于 2009-12-18 07:01 | 只看该作者
hpcc。
不过linpack仍然是最常用的,传统么。
就像过年要包饺子一样。

您能推荐个更好的?
gaint 发表于 2009-12-17 19:30
回复 支持 反对

使用道具 举报

50#
发表于 2009-12-18 07:11 | 只看该作者
有时候会直接拿production的代码来测试。
要看rate的话直接买nahelem-xeon就行了.

specfp_rate啊,正经评估性能,谁用什么linpack?
Prescott 发表于 2009-12-17 20:22
回复 支持 反对

使用道具 举报

51#
发表于 2009-12-18 07:12 | 只看该作者
这是两个socket。

HPL对比测试的两个平台介绍,AMD方面为皓龙2435“伊斯坦布尔”系统(六核心,主频2.6GHz,16GB 800MHz DDR2 ...
tomsmith123 发表于 2009-12-17 18:00
回复 支持 反对

使用道具 举报

52#
发表于 2009-12-18 07:19 | 只看该作者
看多大的系统了,oak的那个系统吃了大概10M瓦的电。
如果原封不动的扩大体系,上amd的12核心,推到20P的话要吃掉5倍以上的电力。

100W CPU 以Istanbul 为例(Cray XT5 的装备),目前大致是90GFlops 双精度,而且通用性更好。我只是说,功耗不应该是个很敏感的因素,对于GPU 系统,目前看如果取消,那么是长时间延迟导致的。
tomsmith123 发表于 2009-12-17 14:03
回复 支持 反对

使用道具 举报

53#
发表于 2009-12-18 08:31 | 只看该作者
回复 68# bessel
我是以HE 版本估算的,上下有浮动。
回复 支持 反对

使用道具 举报

54#
发表于 2009-12-18 08:33 | 只看该作者
回复 73# bessel
扩大到原体系不变,互联必须有所变化。如果有重载算法可以异构,可以GPU,那么Fermi还是不错的选择。
SC09 的主要问题是两个,编程和功耗。
回复 支持 反对

使用道具 举报

55#
发表于 2009-12-18 08:33 | 只看该作者
回复 72# bessel
这是针对那个单CPU 10.4 G说的。。。
回复 支持 反对

使用道具 举报

56#
发表于 2009-12-18 09:35 | 只看该作者
确实杯具了…
回复 支持 反对

使用道具 举报

57#
发表于 2009-12-18 09:43 | 只看该作者
来回看了几遍,终于懂了.
你说的是2个2.1G的he版本大概有90G左右.

回复  bessel
我是以HE 版本估算的,上下有浮动。
tomsmith123 发表于 2009-12-18 08:31
回复 支持 反对

使用道具 举报

58#
发表于 2009-12-18 09:49 | 只看该作者
回复 78# bessel
HE 版本的Istanbul HE 版本是55W,这样的话,100W 的基准性能可以达到90GFlops/100W。
SE 版本的性能高,但是功耗也高,目前用在高密度计算,反而HE 版本要经济一些。
回复 支持 反对

使用道具 举报

59#
发表于 2009-12-18 09:51 | 只看该作者
回复 78# bessel
HE 版本的Istanbul HE 版本是55W,这样的话,100W 的基准性能可以达到90GFlops/100W。
SE 版本的性能高,但是功耗也高,目前用在高密度计算,反而HE 版本要经济一些。
按照100W 功耗性能计算,HE 版本性能大概是4G 的SE 版本,这是有90GFlops/100W的。
回复 支持 反对

使用道具 举报

60#
发表于 2009-12-18 09:52 | 只看该作者
本帖最后由 bessel 于 2009-12-18 09:53 编辑

fermi的功耗如果有150w,并且提供400G的linpack,
对比x86的优势就不明显. oak那里的coder还是很勤奋的,在nv的卡上做了不少工作。
如果charlie的话是真的,那么功耗可能是主要的因素,或者说dp的性能还不够高。

回复  bessel
扩大到原体系不变,互联必须有所变化。如果有重载算法可以异构,可以GPU,那么Fermi还是不错 ...
tomsmith123 发表于 2009-12-18 08:33
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-9 08:24

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表