POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Edison
打印 上一主题 下一主题

PCINLIFE新测试报告发表:英特尔 Core 2 Duo 处理器全面深入评析

[复制链接]
21#
发表于 2006-8-5 23:02 | 只看该作者
越来越感觉上PCINLIFE走向一个硬件强论坛了,起码要有自己的作品才能支持
回复 支持 反对

使用道具 举报

22#
发表于 2006-8-5 23:08 | 只看该作者
看了一半,明天继续看 。#
回复 支持 反对

使用道具 举报

23#
发表于 2006-8-6 01:22 | 只看该作者
后天终于来到了    
回复 支持 反对

使用道具 举报

24#
 楼主| 发表于 2006-8-6 01:40 | 只看该作者
Conroe也许目前来说还是不错的,但是从一些测试来看,x86的包袱越来越重了,问题也越来越突出了。
回复 支持 反对

使用道具 举报

25#
发表于 2006-8-6 02:15 | 只看该作者
原帖由 Edison 于 2006-8-6 01:40 发表
Conroe也许目前来说还是不错的,但是从一些测试来看,x86的包袱越来越重了,问题也越来越突出了。


设计理念的不同吧,从当前常见实际应用程序的代码、指令的组合统计概率上来看,conroe应该还是很平衡的。纯理论测试方面就有些效率上的落差了,这和netburst似乎恰好相反。不知道我这样理解对不对。
回复 支持 反对

使用道具 举报

whj788 该用户已被删除
26#
发表于 2006-8-6 02:38 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

27#
 楼主| 发表于 2006-8-6 13:29 | 只看该作者
原帖由 fayerlxy 于 2006-8-6 02:15 发表


设计理念的不同吧,从当前常见实际应用程序的代码、指令的组合统计概率上来看,conroe应该还是很平衡的。纯理论测试方面就有些效率上的落差了,这和netburst似乎恰好相反。不知道我这样理解对不对。


在我看来CPU2000是真实的应用测试而不是纯理论测试。
回复 支持 反对

使用道具 举报

28#
发表于 2006-8-6 13:57 | 只看该作者
原帖由 Edison 于 2006-8-6 01:40 AM 发表
Conroe也许目前来说还是不错的,但是从一些测试来看,x86的包袱越来越重了,问题也越来越突出了。

为什么会越来越重??现在RISC也靠指令复杂化来提升性能,RISC和CISC在趋近,原来那个介绍扣肉的文章在不是说Core2比RISC还像RISC??cho大衣车手能和我们分享一下视角么??
回复 支持 反对

使用道具 举报

29#
发表于 2006-8-6 14:07 | 只看该作者
啊啊啊。。
Peturm D820在3D渲染上好牛啊。。看来图形计算指令很规范,软件对双核优化也很到位。
暴力计算是Netburst的强项。
回复 支持 反对

使用道具 举报

30#
发表于 2006-8-6 15:59 | 只看该作者
原帖由 Edison 于 2006-8-6 13:29 发表


在我看来CPU2000是真实的应用测试而不是纯理论测试。


CPU2000中conroe成绩不是非常优异么?so...
回复 支持 反对

使用道具 举报

31#
发表于 2006-8-7 10:52 | 只看该作者
mark
要慢慢看,现在还没到时候
回复 支持 反对

使用道具 举报

tschj 该用户已被删除
32#
发表于 2006-8-7 12:10 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

33#
 楼主| 发表于 2006-8-7 13:59 | 只看该作者
原帖由 tschj 于 2006-8-7 12:10 发表
大概看了一下这个测试,LINPACK部分测试的结果问题很大,可以看出对于LINPACK,测试者是基本不了解的。
12GFLOPS的结果比正常值低了很多,从实测中得到的数据应该是大于16GFLOPS的。
根据GOTO BLAS的作者自己提 ...


请注意,Kazushige Goto在他的mail list所说的测试结果是把N是拉到了31000,这需要大概31000*31000*8byte=7GB内存,换句话说,需要的内存容量是8GB等级。

我在测试中都是把N拉成了14000(cygwin+HPL)或者15000(Intel linpack 3.01),这是受到测试平台以及cygwin本身的内存容量限制。

我测试报告中给出的Windows XP 64bit linpack测试结果是15.x GFLOPS。

Kazushige Goto所指的测试结果也不是目前的1.04所测试出来的:
“I’m about to release next version. Now Woodcrest version is a little bit better than before.”

这里有一个日本的HPC测试网站提供的同样是N=15000时候的HPL测试结果。
http://www.hpc.co.jp/hit/benchmark/benchmark_xeon.html
回复 支持 反对

使用道具 举报

tschj 该用户已被删除
34#
发表于 2006-8-7 14:13 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

35#
 楼主| 发表于 2006-8-7 14:27 | 只看该作者
原帖由 tschj 于 2006-8-7 14:13 发表
我提到的16GFLOPS是用Intel LINPACK 3.01在Linux上,4GB内存可以达到的结果。
使用GOTO BLAS 1.03都可以得到这样的结果,Kazushige Goto用1.03得到的结果是这样的,
Linapck (HPL, N=31000)   : 1 CPU … 9.00G ...


实际上根据我的经验,用1.03+cygwin+core 2make出来的hpl根本跑不了,1.03虽然号称支持Core 2,但是出来的hpl会提示内存分配错误,Kazushige Goto在1.03发布后几天后就马上发布了修订的1.04。

Core 2在1.02上用Prescott profile跑出来的结果只有8.xGFLOPS(单核4.XGFLOPS)。

我说的15.XGFLOPS是在2GB内存上用N=15000+64bit OS上跑的,12.XGFLOPS是32bit OS上跑的,这和你说的并不矛盾。

我们对Core2的NB设定是232(192也尝试过,差别不大),PxQ是1x2,其他的设定对单机或者说单socket影响非常小。

  1. [font=Courier New]N      :   14000
  2. NB     :     232
  3. PMAP   : Row-major process mapping
  4. P      :       1
  5. Q      :       2
  6. PFACT  :   Right
  7. NBMIN  :       4
  8. NDIV   :       2
  9. RFACT  :   Right
  10. BCAST  :  2ringM
  11. DEPTH  :       1
  12. SWAP   : Mix (threshold = 64)
  13. L1     : transposed form
  14. U      : transposed form
  15. EQUIL  : yes
  16. ALIGN  : 8 double precision words[/font]
复制代码
回复 支持 反对

使用道具 举报

tschj 该用户已被删除
36#
发表于 2006-8-7 14:36 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

37#
 楼主| 发表于 2006-8-7 14:40 | 只看该作者
linux下和windows下差别不是很大,不过windows的主要问题是目前只能用cygwin来跑,而windows的Cluster版还没有正式推出,暂时不想在这个上浪费时间。

fx_55_10000_fc5.png (179.94 KB, 下载次数: )

fx_55_10000_fc5.png
回复 支持 反对

使用道具 举报

tschj 该用户已被删除
38#
发表于 2006-8-7 14:59 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

39#
 楼主| 发表于 2006-8-7 15:13 | 只看该作者
你的NBs是切成多少的?
回复 支持 反对

使用道具 举报

40#
发表于 2006-8-7 18:27 | 只看该作者
果然是深度评测,够深。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-5-8 03:04

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表