POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 7245|回复: 49
打印 上一主题 下一主题

不用等到07年年中,现在最快的Woodcrest在浮点上已经被2.6GHz Opteron打死了

[复制链接]
跳转到指定楼层
1#
发表于 2006-9-12 10:25 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Sun Microsystems
Sun Fire X2200 M2
SPECfp_rate2000 = 117   
SPECfp_rate_base2000 = 101   
SPEC license # 6Tested by: Sun Microsystems, Santa ClaraTest date: Jul-2006Hardware Avail: Aug-2006Software Avail: Jul-2006
[/td]BenchmarkBase
CopiesBase
RuntimeBase
RatioCopiesRuntimeRatio[/tr]

168.wupwise458.9  126    457.6  129   

171.swim476.3  188    473.8  195   

172.mgrid4118    70.7  4112    74.6  

173.applu498.1  99.3  491.4  107   

177.mesa488.5  73.4  471.6  90.8  

178.galgel4102    132    469.2  194   

179.art433.5  360    415.8  763   

183.equake447.4  127    444.1  137   

187.facerec469.7  127    449.6  178   

188.ammp4158    64.5  4159    64.0  

189.lucas4134    69.3  4134    69.1  

191.fma3d4124    78.3  4122    79.7  

200.sixtrack4143    35.7  4139    36.6  

301.apsi4123    97.8  4111    108   
SPECfp_rate_base2000101   
SPECfp_rate2000117   

Model Name:Sun Fire X2200 M2 CPU:AMD Opteron (TM) 2218CPU MHz:2600FPU:IntegratedCPU(s) enabled:4 cores, 2 chips, 2 cores/chipCPU(s) orderable:1,2 (order by # of chips)Parallel:NoPrimary Cache:64KBI + 64KBD (on chip) per coreSecondary Cache:1024KB (I+D) (on chip) per coreL3 Cache:N/AOther Cache:N/AMemory:16GB (8x2GB, DDR2-667 CL5 ECC Reg)Disk Subsystem:SATA,250GB,7200RPMOther Hardware:None
HardwareHardware Vendor:Sun Microsystems
SoftwareOperating System:Solaris 10 6/06Compiler:Sun Studio 11 with PatchesFile System:ufsSystem State:Multi-userNotes / Tuning InformationCompiler invocation:   C: cc  F90: f90  F77: f90     FDO:  PASS1= -xprofile=collect:./feedback PASS2= -xprofile=use:./feedback      fdo_pre0:  rm -rf ./feedback.profileFloating point base flags:  Fortran: -fast -xipo=2 -xarch=amd64 -xprefetch_level=3 ONESTEP=yes        C: -fast -xipo=2 -xalias_level=std -xpagesize=2m ONESTEP=yes Floating point peak flags: ONESTEP=yes for all benchmarks  168.wupwise:   -fast -xautopar -xpad=common:3969 -xipo=2 -xarch=amd64 -xprefetch_level=3  -xpagesize_heap=2m 171.swim:      -fast -xpad=common:3969 -xipo=2 -xvector=simd -xprefetch_level=3 -Qoption iropt                 -Atile:skewp,-Ainline:cs=700 -xarch=amd64 -Qoption ube_ipa -inl_alt                 -xpagesize_stack=2m 172.mgrid:     -fast -xautopar -stackvar -xpad=common:900 -xipo=2 -xarch=amd64 -xprefetch_level=3                 -xvector -xpagesize=2m -Qoption ld -M,/usr/lib/ld/map.bssalign 173.applu:     -fast -xautopar -unroll=5 -stackvar -xO4 -xipo=2 -xprefetch_level=3 -xarch=amd64a                -qoption iropt -Rloop_dist -xpagesize_heap=2m 177.mesa:      -fast -xautopar -xO4 -xipo=2 -Wd,-iropt-prof -xarch=amd64 -xalias_level=strong -xpagesize=2m +FDO 178.galgel:   -fast -xcache=64/32/4:1024/64/4 -xipo=2 -xpagesize_heap=2m -xvector=simd -xarch=amd64  -xprefetch_level=3                RM_SOURCES=lapak.f90                EXTRA_LIBS=-xlic_lib=sunperf 179.art:       -fast -xipo=2 -xalias_level=strong -xprefetch -Wd,-iropt-prof -xpagesize=2m +FDO 183.equake:    -fast -Wd,-iropt-prof -xipo=2 -xprefetch -xalias_level=strong -xpagesize=2m -lmopt -lm +FDO 187.facerec:   -fast -xO4 -xipo=2 -xprefetch_level=3 -xpagesize=2m                RM_SOURCES=cfftb.f90 cffti.f90 cfftf.f90                EXTRA_LIBS=-xlic_lib=sunperf 188.ammp:      -fast -xcache=64/32/4:1024/64/4 -xO4 -xipo=2 -xarch=amd64a -xalias_level=std -xpagesize_heap=2m -lmopt -lm 189.lucas:     -fast -Qoption ube_ipa -inl_alt -xipo=2 -xarch=amd64 -xprefetch_level=3 191.fma3d:     -fast -xcache=64/32/4:1024/64/4 -unroll=5 -fsimple=1 -xipo=2                -xprefetch_level=3 -xarch=amd64 -xpagesize_heap=2m +FDO 200.sixtrack:  -fast -xipo=2 -O -xprefetch_level=3 -xarch=amd64                 -xpagesize_heap=2m -Qoption ld -M,/usr/lib/ld/map.bssalign +FDO 301.apsi:      -fast -xO4 -xipo=2 -xprefetch_level=3 -xarch=amd64a -xpagesize=2mPortability: 178.galgel:  -fixed Shell Environments:  Stack size set to unlimited via "ulimit -s unlimited"        PARALLEL was not set, therefore each copy of the benchmark  ran single-threaded using only one core.     The following patches were applied to Sun Studio 11 compiler:120759-07 : x86/x64121016-03 : x86 C121020-03 : x86 F90121018-03 : x86 C++    Processes were bound to CPUs using submit=pbindDefault BIOS setting was used



Supermicro
Motherboard X7DB8-X ( 3.00GHz, Intel Xeon 5160 processor)
SPECfp_rate2000 = 80.6  
SPECfp_rate_base2000 = 80.8  
SPEC license # 001176Tested by: SupermicroTest date: Jun-2006Hardware Avail: May-2006Software Avail: Mar-2006
[/td]BenchmarkBase
CopiesBase
RuntimeBase
RatioCopiesRuntimeRatio[/tr]

168.wupwise469.1  107    469.1  107   

171.swim4263    54.8  4262    54.8  

172.mgrid4164    50.8  4164    50.8  

173.applu4190    51.3  4190    51.3  

177.mesa452.6  124    452.6  124   

178.galgel457.7  233    457.8  233   

179.art458.0  208    458.0  208   

183.equake487.3  69.1  487.3  69.1  

187.facerec489.9  98.1  490.7  97.2  

188.ammp4139    73.5  4142    71.9  

189.lucas4172    54.0  4172    54.0  

191.fma3d4167    58.5  4167    58.5  

200.sixtrack493.9  54.4  495.4  53.5  

301.apsi4187    64.6  4187    64.6  
SPECfp_rate_base200080.8  
SPECfp_rate200080.6  

Model Name:Motherboard X7DB8-X ( 3.00GHz, Intel Xeon 5160 processor)CPU:Intel Xeon 5160 processor ( 3.00GHz, 4MB L2 shared, 1333 MHz bus)CPU MHz:3000FPU:IntegratedCPU(s) enabled:4 cores, 2 chips, 2 cores/chip CPU(s) orderable:1, 2Parallel:NoPrimary Cache:32KBI + 32KBD on chip per coreSecondary Cache:4MB(I+D) on chip sharedL3 Cache:N/AOther Cache:N/AMemory:8x 2GB 667MHz CL5 DDR2 FB-DIMMDisk Subsystem:1 X WD 2500 250GB SATAOther Hardware:N/A
HardwareHardware Vendor:Supermicro
SoftwareOperating System:Windows server 2003 Enterprise Edition 32-bits W/ SP1Compiler:Intel C++ and Fortran Compiler 9.1 for 32-bit applications
Build 20060323Z Package ID: W_FC_P_9.1.020
Microsoft Visual Studio 2005(for libraries)
SmartHeap Library Version 8.0 from http://www.microquill.com/File System:NTFSSystem State:DefaultNotes / Tuning Information +FDO: PASS1=  -Qprof_gen  PASS2=-Qprof_use  Base tuning for Fortran programs:  -fast -Qansi_alias +FDO  Base tuning for C programs: -fast shlW32M.lib +FDO  Portability: 178.galgel:   -FI /F32000000 Peak tuning: 168.wupwise:  -fast -Qansi_alias +FDO 171.swim:     -fast -Qansi_alias +FDO 172.mgrid:    -fast -Qansi_alias +FDO 173.applu:  basepeak=yes 177.mesa:   basepeak=yes 178.galgel:   -fast -Qansi_alias +FDO 179.art:      basepeak=yes 183.equake:   -QxP -Oa -Qrcd -Qipo  +FDO  shlW32M.lib 187.facerec:  -fast -Qunroll1 -Qscalar_rep- +FDO  188.ammp:     -fast -Oa +FDO  shlW32M.lib 189.lucas:    -fast -Qprefetch- +FDO 191.fma3d:    basepeak=yes 200.sixtrack: -Qipo -QxP +FDO 301.apsi:     -fast +FDO  Tested systems can be used with SC825S2-R700LPV case,   To ensure system stability, a 500W (minimum) ATX power supply  [4-pin (+12V), 8-pin (+12V) and 24-pin are required]  Product description located as of X7DB8-X:  http://www.supermicro.com/produc ... 3/5000P/X7DB8-X.cfm  The system bus runs at 1333 MHz
2#
发表于 2006-9-12 10:26 | 只看该作者
妙杀Woodcrest 垃圾
回复 支持 反对

使用道具 举报

3#
发表于 2006-9-12 10:29 | 只看该作者
AMD浮点的确比较强,2.56G闪龙跑1M比P43.5E还快2S,但是又怎么样,只要一个卡巴斯基,机器就不能动,P4还可以边卡巴边CS

光强调浮点有P用,整数才是王道,毕竟操作系统,大部分软件还是靠整数维系的,浮点只能在游戏上YY下
回复 支持 反对

使用道具 举报

4#
发表于 2006-9-12 10:37 | 只看该作者
浮点是用来杀安腾的, 这个分数就算是安腾搭配NUMA也顶不住了

看来FB-DIMM也拯救不了Intel啊, 强如扣肉, 没有NUMA就是亏.
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2006-9-12 10:55 | 只看该作者
回复 支持 反对

使用道具 举报

6#
发表于 2006-9-12 11:02 | 只看该作者
五块的浮点居然被奥普特龙做掉了?
汗一个:sweatingbullets:
回复 支持 反对

使用道具 举报

7#
发表于 2006-9-12 11:18 | 只看该作者
http://www.spec.org/cpu2000/resu ... 20060816-07008.html

配置和SUN的那台差不多的机器SPECfp_rate2000得分是89.3,难道是SUN做了什么特别的优化。

还有SPECfp2000的得分5160都在2700~2800,而Opteron 2218都只有2000左右,这两种测试不是应该基本上同步的吗?

[ 本帖最后由 acqwer 于 2006-9-12 11:32 编辑 ]
回复 支持 反对

使用道具 举报

8#
发表于 2006-9-12 11:28 | 只看该作者
编译器不一样,不过也比以前sun的编译器分高很多

这编译器是打了patch,估计有点关系

而且应该在优化上也下了功夫, 个别测试peak成绩比base成绩高了一倍, 够吓人的了
回复 支持 反对

使用道具 举报

9#
发表于 2006-9-12 11:33 | 只看该作者
原帖由 roadrunner 于 2006-9-12 11:28 发表
编译器不一样,不过也比以前sun的编译器分高很多

这编译器是打了patch,估计有点关系

而且应该在优化上也下了功夫, 个别测试peak成绩比base成绩高了一倍, 够吓人的了



不管怎么说,这项是k8赢得

google了一下,原来是这么回事


新 Opteron 最快的一颗 CPU 是 2.8GHz,虽然这些 CPU 和 Intel 上一代架构的 Dempsy 核心 Xeon 比起来应该是有绝对优势,但和新架构的 Woodcrest 比起来就比较不乐观了。AMD 至少还有把握在一种数据上 ( Linux SPECfp_rate2000 ) 上赢过 Woodcrest 11%,但接下来就只有不断地强调「处理器、内存和北桥加起来的耗电量比较低」,有没有听起来似曾相识啊…



不同的架构cpu总能找到某项测试一种比另一种强的
回复 支持 反对

使用道具 举报

10#
发表于 2006-9-12 11:34 | 只看该作者
新出的东西自然不会比出了5年的东西优化更彻底。
回复 支持 反对

使用道具 举报

11#
发表于 2006-9-12 11:35 | 只看该作者
sun的编译器有个别成绩高得吓人

swim, art, equake这几项比pathscale的提高都是按倍数算的, 即使使用base参数也是

但pathscale有不少项目也领先sun的编译器,

如果允许针对不同测试项目使用不同编译器成绩会更高。
回复 支持 反对

使用道具 举报

12#
发表于 2006-9-12 11:43 | 只看该作者
原帖由 soft 于 2006-9-12 11:33 发表



不管怎么说,这项是k8赢得

google了一下,原来是这么回事


新 Opteron 最快的一颗 CPU 是 2.8GHz,虽然这些 CPU 和 Intel 上一代架构的 Dempsy 核心 Xeon 比起来应该是有绝对优势,但和新架构的 Woo ...


我觉得Woodcrest相对于Opteron的优势并不象Conroe对Athlon64那么明显,主要的一个原因是WoodCrest要求搭配FB-DIMM内存,这在低端服务器要增加不少成本,而对于高端来说,WoodCrest又没有4路的产品。其他补充产品线,NetBrust不争气就不说了,Yonah又没有64位,所以Intel的服务器产品线阵容总给人不完整的感觉。

从上面这测试看,FB-DIMM让人失望,在双U四核的市场中,至少在要求内存带宽的应用中不敌AMD的双内置内存控制器,要求内存延时的应用估计可能输得更惨。

要充分发挥WoodCrest在Cache上的优势需要对软件充分的优化,而实际应用大部分软件都是优化得不怎么样的,我觉得还是Opteron的双内置内存控制器实在。
回复 支持 反对

使用道具 举报

13#
发表于 2006-9-12 11:44 | 只看该作者
呵呵,看到这个测试,转一篇新闻。
英特尔再挑AMD 称Woodcrest性能评测中占优

作者: CNET科技资讯网
CNETNews.com.cn 2006-09-05 11:30:01 AM

CNET科技资讯网9月5日台北报道(旷文溱)英特尔又再把Woodcrest表现拿出来说一次,并且和AMD甫面市的“Rev F”版双核Opteron处理器,展开性能比大赛。

距离上一次发布新款双核Xeon 5100处理器(代号为Woodcrest)过了两个多月的时间,英特尔8月30日又在台北举办Woodcrest的性能发布会。

强调不论是执行一般运算应用、Java应用、甚至以往AMD较为擅长的高性能运算,Woodcrest的性能表现都分别胜出Rev F Opteron高达46%、42%以及100%。

英特尔甚至在现场摆上了两台内存容量等规范都相同、唯分别搭载Woodcrest和Rev F Opteron的电脑,展示在执行模拟撞击测试、3D立体动画等软件时,Woodcrest的速度的确快上Rev F Opteron。

“以往英特尔的确很少这样做(意指公布与AMD处理器性能评比数据),但是对方的确太大声嚷嚷了,所以英特尔要提出数据证明,”英特尔亚太区营销及技术总监黄逸松说。

“事实证明AMD Rev F Opteron的各项性能评比都比英特尔Woodcrest差,”英特尔亚太区营销暨业务营销部协理刘景慈说。

至于AMD在先前发布Rev F Opteron时,提出在耗电量及虚拟化技术等表现在在都胜过英特尔。英特尔对此的反应是:“英特尔的手边并没有双方的性能耗电比信息。

不过,Woodcrest的性能表现好,用户就可以节省服务器高速运作的时间,难道这个不会更节省耗电吗?”刘景慈说。

再者,虚拟化技术不会是单一厂商推动就算数。英特尔和VMWare合推的Virtualiza ASAP计划,可以确保英特尔处理器的虚拟化技术更上层楼,他补充道。

Woodcrest是英特尔首款采用英特尔核心微架构 (Intel Core Microarchitecture)的双核处理器产品。拥有优于旧型英特尔服务器产品135%的性能并减少40%的耗电量。其频率达3.0 GHz,支持更快的1333 MHz汇流排,内建4 MB L2缓存内存,供两个核心使用。

3 GHz处理器的散热设计功率(Thermal Design Point, TDP)为80瓦,其余的处理器则为65瓦。未来还将推出2.33 GHz的低电压处理器,总耗电量为40瓦。Woodcrest 所包含的电力管理技术,使得实际耗电量可大幅低于TDP电量。

Woodcrest的推出让英特尔眼睛为之一亮。因为近年来AMD凭借着低耗电量、专精HPC、EDA应用等优点,让其气势一路上扬。

根据IDC台湾提供的信息,AMD Opteron在台湾x86服务器市场第一季的占有率为5.3%。和去年同期相比堪称增长飞速,达到了442.7%;和去年第四季相比,也有31.5%的增长。

AMD Opteron连战皆捷,继英特尔忠实的老战友戴尔宣布在今年推出AMD Opteron四路服务器后,IBM也宣布扩大AMD产品线。上述种种自然给了英特尔不小的压力。

不过英特尔也不是省油的灯,在今年六月底发布Woodcrest后,由于其性能和耗电量表现,都较上一代的Xeon Dempsey明显提升,英特尔视其为反攻市场力作。

“Woodcrest的问世,会让英特尔把去年失去的市场占有率拿回来,”英特尔台湾分公司总经理陈立生说。
回复 支持 反对

使用道具 举报

14#
 楼主| 发表于 2006-9-12 11:45 | 只看该作者
这里相差的是~40%。
回复 支持 反对

使用道具 举报

15#
发表于 2006-9-12 12:14 | 只看该作者
弱弱的問一下各位DX
在遊戲中是強調CPU的浮点還是整數???
如果是浮點,那照理說A64在遊戲中並不會几乎完敗Conroe吧
還是說以K8的架構要多way才能体現出浮點的优勢??:unsure:
回复 支持 反对

使用道具 举报

16#
发表于 2006-9-12 12:23 | 只看该作者
玩游戏Athlon比P4好太多了,这个不用多说,但扣肉的构架不错,所以比较有潜力,等待K8L来拯救AMD了。
回复 支持 反对

使用道具 举报

17#
发表于 2006-9-12 12:40 | 只看该作者
原帖由 goodayoo 于 2006-9-12 12:23 发表
玩游戏Athlon比P4好太多了,这个不用多说,但扣肉的构架不错,所以比较有潜力,等待K8L来拯救AMD了。


扣肉還有潛力??
倒是聽到另一種說法是扣肉架構己經快被压榨到極限:unsure:
回复 支持 反对

使用道具 举报

18#
发表于 2006-9-12 12:54 | 只看该作者
扣肉的整数成绩基本上把啥CPU都杀了……
CINT2000跑3000分呀!
回复 支持 反对

使用道具 举报

19#
发表于 2006-9-12 13:18 | 只看该作者
原帖由 NONO 于 2006-9-12 12:40 发表


扣肉還有潛力??
倒是聽到另一種說法是扣肉架構己經快被压榨到極限:unsure:



扣肉的架构并不是已经到极限,而是intel给扣肉分配的浮点线程很少,毕竟intel大部分的目标客户还是商业用户,整数运算强大更能讨好客户,K8L的架构相对K8也不见得是全新的,个人觉得没什么好指望
回复 支持 反对

使用道具 举报

20#
发表于 2006-9-12 13:20 | 只看该作者
扣肉浮点比K8只好不差,差距还是在内存带宽,Intel服务器系统的老弱点
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-12-27 11:07

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表