POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 6030|回复: 48
打印 上一主题 下一主题

Clovertown的科学性能太渣了点吧

[复制链接]
RacingPHT 该用户已被删除
跳转到指定楼层
1#
发表于 2007-11-25 15:02 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
2#
发表于 2007-11-25 16:06 | 只看该作者
Clovertown的内存带宽跑到了11G……莫非测试时用的是2400FSB的U?
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
3#
 楼主| 发表于 2007-11-25 16:15 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

4#
发表于 2007-11-25 16:44 | 只看该作者
科学计算!=拼内存带宽

  :sleeping:
回复 支持 反对

使用道具 举报

5#
发表于 2007-11-25 17:01 | 只看该作者
原帖由 RacingPHT 于 2007-11-25 16:15 发表
1333 FSB * 64bit = 10.6G/s
加上是2x Socket, 所以peak是21.3G/s
跑11G/s, 只到peak的一半

双路的Xeon测评我也看过不少,带宽跑到7G的都没看到过。
回复 支持 反对

使用道具 举报

6#
发表于 2007-11-25 17:19 | 只看该作者
Their code is better than the benchmark.

It is said AMD has a code which can run 13GB/s with k10.

原帖由 acqwer 于 2007-11-25 17:01 发表

双路的Xeon测评我也看过不少,带宽跑到7G的都没看到过。
回复 支持 反对

使用道具 举报

7#
发表于 2007-11-25 17:25 | 只看该作者
In certain cases scientific computing is limited by memory bandwidth only,
and those users have no choice.
That is why NEC are still building their very expensive vector machines.
their sx9 has 4TB/s in one node.


原帖由 itany 于 2007-11-25 16:44 发表
科学计算!=拼内存带宽

  :sleeping:
回复 支持 反对

使用道具 举报

8#
发表于 2007-11-25 17:30 | 只看该作者
原帖由 bessel 于 2007-11-25 17:19 发表
Their code is better than the benchmark.

It is said AMD has a code which can run 13GB/s with k10.


K10跑到13G很稀奇吗?把这里的内存从667换成800就差不多了吧。


[ 本帖最后由 acqwer 于 2007-11-25 17:33 编辑 ]
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
9#
 楼主| 发表于 2007-11-25 17:32 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
10#
 楼主| 发表于 2007-11-25 17:33 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

11#
发表于 2007-11-25 17:37 | 只看该作者
This  result is  very good for FSB,:sweatingbullets:

% of configuration peak bandwidth:
amd: 62.6%
intel: 52.7%



原帖由 RacingPHT 于 2007-11-25 16
:15 发表
1333 FSB * 64bit = 10.6G/s
加上是2x Socket, 所以peak是21.3G/s
跑11G/s, 只到peak的一半
回复 支持 反对

使用道具 举报

12#
发表于 2007-11-25 17:38 | 只看该作者
4 core ,single socket.
but only AMD has this bench.

:shifty:
原帖由 RacingPHT 于 2007-11-25 17:32 发表

single core? single socket?
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
13#
 楼主| 发表于 2007-11-25 17:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

14#
发表于 2007-11-25 17:55 | 只看该作者
FPU is limited by memory bandwidth,
FPU is kept on waiting for the data.

Flops is proportional to memory bandwidth
for amd:  13.35GB/s ,3.31 GF/s        4.03B/flop
for intel:   11.24GB/s,  2.79 GF/s       4.03B/flop

原帖由 RacingPHT 于 2007-11-25 17:46 发表

but not for the FPUs.
2.79 GF/s (3.7%)
回复 支持 反对

使用道具 举报

15#
发表于 2007-11-25 17:56 | 只看该作者
原帖由 RacingPHT 于 2007-11-25 17:33 发表


那你也要看benchmark是怎么写的。benckmark侧不出来是他的事。

基本上,内存带宽的测试方式都是一样的吧。
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
16#
 楼主| 发表于 2007-11-25 18:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

17#
发表于 2007-11-25 19:01 | 只看该作者
你贴的文章中有写啊。

btw:这文章和作者都不错。

原帖由 RacingPHT 于 2007-11-25 18:23 发表


这是没错, 问题在: 为什么FSB只能用到50%? 而CELL可以用到90%+?

[ 本帖最后由 bessel 于 2007-11-26 03:10 编辑 ]
回复 支持 反对

使用道具 举报

18#
发表于 2007-11-25 20:19 | 只看该作者
原帖由 RacingPHT 于 2007-11-25 15:02 发表
http://www.cs.berkeley.edu/~samw/research/papers/sc07.pdf
8个核心的Clovertown系统被4核心的X2玩死了, 人间罕见啊。

Clovertown只要数据不在cache中, FSB的性能就奇烂
page 8


搞个测试,两个单核心的Opteron玩死两个Clovertown也不奇怪。
换另外一个测试,一个E6550玩死4个Barcelona也不是不可能。

上面的例子都是实际工作中碰到的,不是臆断。

至于Clovertown科学性能到底怎么样,最近的Top500排名早就给出了答案。如果Clovertown的内存带宽不是问题,这个世界上还有什么处理器是Clovertown的对手?

[ 本帖最后由 Prescott 于 2007-11-25 21:35 编辑 ]
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
19#
发表于 2007-11-25 21:19 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

20#
发表于 2007-11-25 22:33 | 只看该作者
原帖由 itany 于 2007-11-25 16:44 发表
科学计算!=拼内存带宽

  :sleeping:



科学计算很多种的,有的却是湿拼内存带宽,有的拼内存延迟.
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-9 18:46

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表