POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: mooncocoon
打印 上一主题 下一主题

科学运算,请远离INTEL

[复制链接]
61#
发表于 2007-4-19 17:53 | 只看该作者
原帖由 Prescott 于 2007-4-19 17:52 发表

有可能嘛,只要存在一个就行,找一两个X5355快过Op265 3倍的还是比较容易的。
想找几个OP265比X5355快3倍的程序,那就难多了不是?

这就有一个啊,多好啊。
回复 支持 反对

使用道具 举报

62#
发表于 2007-4-19 17:56 | 只看该作者
原帖由 bessel 于 2007-4-19 17:53 发表

这就有一个啊,多好啊。

:sweatingbullets:
已经和LZ谈过了,内存使用量超过可用物理内存。让他换64bit OS和软件去了。

[ 本帖最后由 Prescott 于 2007-4-19 17:59 编辑 ]
回复 支持 反对

使用道具 举报

63#
发表于 2007-4-19 17:59 | 只看该作者
...........

VM 都一起上了,那性能直接降到 1% :funk:
回复 支持 反对

使用道具 举报

64#
发表于 2007-4-19 18:06 | 只看该作者
ok,你的程序可以在a上跑,在i上就不行,这是现在的问题。

公司测了一个月都测了什么?
你测了多久,都检查了什么?

一直用的好好的不见得没有问题,毕竟是使用了不同的平台,不同平台出问题是很正常的事情,如果你有对于不同平台特别的优化。

最简单的,单独的dmol是否在两个平台可以有正常的速度和结果。以及你做的计算中间过程是否一致。

不同的优化下来可能有极小的机器误差,或许你们的机器误差影响了计算,不能收敛,你检查过中间步骤没有?

原帖由 mooncocoon 于 2007-4-19 17:49 发表
一个通过ACCELRYS认证和测试的普适外挂程序这么快就被你判断成出了问题,而且最关键的是我们一直用的好好的计算过程在你这里都是有问题的了

别人测试了1个多月

原帖由 mooncocoon 于 2007-4-19 12:48 发表
整机需要5W,买U的时候被狠宰了一把,一快1W2

找了几天时间的原因了,没有头绪,计算模型~调用内存数~计算量设置~操作系统全部一样,AMD这边的系统还要老整整1年……

事实让人崩溃,除非你打算跟我说2003 ...
回复 支持 反对

使用道具 举报

65#
发表于 2007-4-19 18:10 | 只看该作者
细节。

那个amd机器怎么没问题?两个一个开了pae一个没开?
一个读内存一个读硬盘还是两个都读硬盘?
读硬盘的机器怎么可能cpu 100%。


原帖由 Prescott 于 2007-4-19 17:56 发表

:sweatingbullets:
已经和LZ谈过了,内存使用量超过可用物理内存。让他换64bit OS和软件去了。
回复 支持 反对

使用道具 举报

66#
发表于 2007-4-19 18:17 | 只看该作者
原帖由 bessel 于 2007-4-19 18:10 发表
细节。

那个amd机器怎么没问题?两个一个开了pae一个没开?
一个读内存一个读硬盘还是两个都读硬盘?
读硬盘的机器怎么可能cpu 100%。



我猜想:两个都读,但是我不知道这个程序的行为,这个需要你这个专家告诉我,有没有可能8个线程的情况下程序malloc的内存更多?还有一种可能是更多的并行度加大了page fault的频度和颠簸。

具体的细节问楼主吧。

如果是page fault造成的交换,CPU是会到100%的。

[ 本帖最后由 Prescott 于 2007-4-19 18:19 编辑 ]
回复 支持 反对

使用道具 举报

67#
发表于 2007-4-19 18:28 | 只看该作者
楼主说是一样的内存使用,w00t) 这个得他回答。

读swap的时候从windows那个任务管理器看可能是100%
代码里如果检测cpu时间恐怕是0%,难道楼主是按了alt-ctrl+del检测的?

作科学计算用到swap的还是请他自个儿来定性吧。不过貌似有些量化软件曾经这样干过,那时候人们只有几百兆内存。


原帖由 Prescott 于 2007-4-19 18:17 发表

我猜想:两个都读,但是我不知道这个程序的行为,这个需要你这个专家告诉我,有没有可能8个线程的情况下程序malloc的内存更多?还有一种可能是更多的并行度加大了page fault的频度和颠簸。

具体的细节问楼 ...
回复 支持 反对

使用道具 举报

68#
发表于 2007-4-19 18:56 | 只看该作者
怎么AMD比INTEL快了
LZ就给人扣上帽子了?
虽然扣肉比K8好,不排除有某些情况下反过来吧...
AMD不是那么见鬼吧?跑个程序快了,连用的人都变有问题
不知道怎么说好类
回复 支持 反对

使用道具 举报

69#
发表于 2007-4-19 19:10 | 只看该作者
我说个相反的例子:
有限差分法, 内存大小不是瓶颈
都是O2 优化

K8 3500+  vs.  woodcrest 5160
>35 min    vs.  <10min
回复 支持 反对

使用道具 举报

70#
发表于 2007-4-19 19:12 | 只看该作者
原帖由 Prescott 于 2007-4-19 17:56 发表

:sweatingbullets:
已经和LZ谈过了,内存使用量超过可用物理内存。让他换64bit OS和软件去了。


原来如此
Prescott 好敬业啊:lol:
回复 支持 反对

使用道具 举报

71#
发表于 2007-4-19 20:23 | 只看该作者
还有一种可能是xeon使用的是双通道fb-dimm而不是4通道,这样amd有2倍的带宽优势以及延时上有优势。


原帖由 Prescott 于 2007-4-19 17:45 发表

X5355比OP265快3倍还真有可能。反过来可能性就不大了。
回复 支持 反对

使用道具 举报

72#
发表于 2007-4-19 22:46 | 只看该作者
原帖由 cjmgz 于 2007-4-19 18:56 发表
怎么AMD比INTEL快了
LZ就给人扣上帽子了?
虽然扣肉比K8好,不排除有某些情况下反过来吧...
AMD不是那么见鬼吧?跑个程序快了,连用的人都变有问题
不知道怎么说好类



把帖子看仔细了,现在说的不是AMD比Intel快,而是说OP265比X5355快9倍。。。 这可能么?楼主在不明原因的情况下就下结论,所以遭到质疑。
回复 支持 反对

使用道具 举报

73#
发表于 2007-4-19 23:51 | 只看该作者
楼主搞科学计算的嘛
应该学会用Vtune和threadprofile之类的软件
看看每个thread是否真的都在满负载运行,还是互相等待memory allocation或者I/O
用Vtune看看每个thread hotspot 是否是在系统调用,那就很值得研究(比如前面prescott分析的在32bit OS中超过4G内存分配导致分配错误就可能出现这种现象)
总之你做学问总要花点时间细心研究下
不太懂计算机的话这里也有很多人可以问
再不济可以直接打电话找intel AE support,人不过来问问还是可以
(btw 如果是AMD大概就不会有人帮你了)
回复 支持 反对

使用道具 举报

74#
发表于 2007-4-19 23:54 | 只看该作者
原帖由 cap 于 2007-4-19 23:51 发表
楼主搞科学计算的嘛
应该学会用Vtune和threadprofile之类的软件
看看每个thread是否真的都在满负载运行,还是互相等待memory allocation或者I/O
用Vtune看看每个thread hotspot 是否是在系统调用,那就很值得 ...

100% Intel employee. )_)
回复 支持 反对

使用道具 举报

75#
发表于 2007-4-20 00:01 | 只看该作者
原帖由 Prescott 于 2007-4-19 23:54 发表

100% Intel employee. )_)

我amd的
建议楼主用perfmon2:lol:
回复 支持 反对

使用道具 举报

76#
发表于 2007-4-20 00:02 | 只看该作者
原帖由 cap 于 2007-4-20 00:01 发表

我amd的
建议楼主用perfmon2:lol:

真的假的 :wacko:
回复 支持 反对

使用道具 举报

77#
发表于 2007-4-20 01:02 | 只看该作者
科学运算?换64-bit Linux吧
回复 支持 反对

使用道具 举报

78#
发表于 2007-4-20 04:29 | 只看该作者
搞科研的,hoho...........
回复 支持 反对

使用道具 举报

79#
发表于 2007-4-20 07:07 | 只看该作者
呵呵,绝对不正常!
回复 支持 反对

使用道具 举报

80#
发表于 2007-4-20 08:48 | 只看该作者
如果是内存不够导致swap, taskmanager里performance那个tab上把show kernel time打开, 如果kernel time很高, 那么存在可能是内存不够导致page fault, 如果kernel time很低, 那么应该就不是swap的问题. 虽然没有perfmon, vtune, thread profiling tool这些来得精确, 但是对于快速初步判断是有一些帮助的.
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-21 13:37

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表