POPPUR爱换

标题: 不用等到07年年中,现在最快的Woodcrest在浮点上已经被2.6GHz Opteron打死了 [打印本页]

作者: Edison    时间: 2006-9-12 10:25
标题: 不用等到07年年中,现在最快的Woodcrest在浮点上已经被2.6GHz Opteron打死了
Sun Microsystems
Sun Fire X2200 M2
SPECfp_rate2000 = 117   
SPECfp_rate_base2000 = 101   
SPEC license # 6Tested by: Sun Microsystems, Santa ClaraTest date: Jul-2006Hardware Avail: Aug-2006Software Avail: Jul-2006
[/td]BenchmarkBase
CopiesBase
RuntimeBase
RatioCopiesRuntimeRatio[/tr]

168.wupwise458.9  126    457.6  129   

171.swim476.3  188    473.8  195   

172.mgrid4118    70.7  4112    74.6  

173.applu498.1  99.3  491.4  107   

177.mesa488.5  73.4  471.6  90.8  

178.galgel4102    132    469.2  194   

179.art433.5  360    415.8  763   

183.equake447.4  127    444.1  137   

187.facerec469.7  127    449.6  178   

188.ammp4158    64.5  4159    64.0  

189.lucas4134    69.3  4134    69.1  

191.fma3d4124    78.3  4122    79.7  

200.sixtrack4143    35.7  4139    36.6  

301.apsi4123    97.8  4111    108   
SPECfp_rate_base2000101   
SPECfp_rate2000117   

Model Name:Sun Fire X2200 M2 CPU:AMD Opteron (TM) 2218CPU MHz:2600FPU:IntegratedCPU(s) enabled:4 cores, 2 chips, 2 cores/chipCPU(s) orderable:1,2 (order by # of chips)Parallel:NoPrimary Cache:64KBI + 64KBD (on chip) per coreSecondary Cache:1024KB (I+D) (on chip) per coreL3 Cache:N/AOther Cache:N/AMemory:16GB (8x2GB, DDR2-667 CL5 ECC Reg)Disk Subsystem:SATA,250GB,7200RPMOther Hardware:None
HardwareHardware Vendor:Sun Microsystems
SoftwareOperating System:Solaris 10 6/06Compiler:Sun Studio 11 with PatchesFile System:ufsSystem State:Multi-userNotes / Tuning InformationCompiler invocation:   C: cc  F90: f90  F77: f90     FDO:  PASS1= -xprofile=collect:./feedback PASS2= -xprofile=use:./feedback      fdo_pre0:  rm -rf ./feedback.profileFloating point base flags:  Fortran: -fast -xipo=2 -xarch=amd64 -xprefetch_level=3 ONESTEP=yes        C: -fast -xipo=2 -xalias_level=std -xpagesize=2m ONESTEP=yes Floating point peak flags: ONESTEP=yes for all benchmarks  168.wupwise:   -fast -xautopar -xpad=common:3969 -xipo=2 -xarch=amd64 -xprefetch_level=3  -xpagesize_heap=2m 171.swim:      -fast -xpad=common:3969 -xipo=2 -xvector=simd -xprefetch_level=3 -Qoption iropt                 -Atile:skewp,-Ainline:cs=700 -xarch=amd64 -Qoption ube_ipa -inl_alt                 -xpagesize_stack=2m 172.mgrid:     -fast -xautopar -stackvar -xpad=common:900 -xipo=2 -xarch=amd64 -xprefetch_level=3                 -xvector -xpagesize=2m -Qoption ld -M,/usr/lib/ld/map.bssalign 173.applu:     -fast -xautopar -unroll=5 -stackvar -xO4 -xipo=2 -xprefetch_level=3 -xarch=amd64a                -qoption iropt -Rloop_dist -xpagesize_heap=2m 177.mesa:      -fast -xautopar -xO4 -xipo=2 -Wd,-iropt-prof -xarch=amd64 -xalias_level=strong -xpagesize=2m +FDO 178.galgel:   -fast -xcache=64/32/4:1024/64/4 -xipo=2 -xpagesize_heap=2m -xvector=simd -xarch=amd64  -xprefetch_level=3                RM_SOURCES=lapak.f90                EXTRA_LIBS=-xlic_lib=sunperf 179.art:       -fast -xipo=2 -xalias_level=strong -xprefetch -Wd,-iropt-prof -xpagesize=2m +FDO 183.equake:    -fast -Wd,-iropt-prof -xipo=2 -xprefetch -xalias_level=strong -xpagesize=2m -lmopt -lm +FDO 187.facerec:   -fast -xO4 -xipo=2 -xprefetch_level=3 -xpagesize=2m                RM_SOURCES=cfftb.f90 cffti.f90 cfftf.f90                EXTRA_LIBS=-xlic_lib=sunperf 188.ammp:      -fast -xcache=64/32/4:1024/64/4 -xO4 -xipo=2 -xarch=amd64a -xalias_level=std -xpagesize_heap=2m -lmopt -lm 189.lucas:     -fast -Qoption ube_ipa -inl_alt -xipo=2 -xarch=amd64 -xprefetch_level=3 191.fma3d:     -fast -xcache=64/32/4:1024/64/4 -unroll=5 -fsimple=1 -xipo=2                -xprefetch_level=3 -xarch=amd64 -xpagesize_heap=2m +FDO 200.sixtrack:  -fast -xipo=2 -O -xprefetch_level=3 -xarch=amd64                 -xpagesize_heap=2m -Qoption ld -M,/usr/lib/ld/map.bssalign +FDO 301.apsi:      -fast -xO4 -xipo=2 -xprefetch_level=3 -xarch=amd64a -xpagesize=2mPortability: 178.galgel:  -fixed Shell Environments:  Stack size set to unlimited via "ulimit -s unlimited"        PARALLEL was not set, therefore each copy of the benchmark  ran single-threaded using only one core.     The following patches were applied to Sun Studio 11 compiler:120759-07 : x86/x64121016-03 : x86 C121020-03 : x86 F90121018-03 : x86 C++    Processes were bound to CPUs using submit=pbindDefault BIOS setting was used



Supermicro
Motherboard X7DB8-X ( 3.00GHz, Intel Xeon 5160 processor)
SPECfp_rate2000 = 80.6  
SPECfp_rate_base2000 = 80.8  
SPEC license # 001176Tested by: SupermicroTest date: Jun-2006Hardware Avail: May-2006Software Avail: Mar-2006
[/td]BenchmarkBase
CopiesBase
RuntimeBase
RatioCopiesRuntimeRatio[/tr]

168.wupwise469.1  107    469.1  107   

171.swim4263    54.8  4262    54.8  

172.mgrid4164    50.8  4164    50.8  

173.applu4190    51.3  4190    51.3  

177.mesa452.6  124    452.6  124   

178.galgel457.7  233    457.8  233   

179.art458.0  208    458.0  208   

183.equake487.3  69.1  487.3  69.1  

187.facerec489.9  98.1  490.7  97.2  

188.ammp4139    73.5  4142    71.9  

189.lucas4172    54.0  4172    54.0  

191.fma3d4167    58.5  4167    58.5  

200.sixtrack493.9  54.4  495.4  53.5  

301.apsi4187    64.6  4187    64.6  
SPECfp_rate_base200080.8  
SPECfp_rate200080.6  

Model Name:Motherboard X7DB8-X ( 3.00GHz, Intel Xeon 5160 processor)CPU:Intel Xeon 5160 processor ( 3.00GHz, 4MB L2 shared, 1333 MHz bus)CPU MHz:3000FPU:IntegratedCPU(s) enabled:4 cores, 2 chips, 2 cores/chip CPU(s) orderable:1, 2Parallel:NoPrimary Cache:32KBI + 32KBD on chip per coreSecondary Cache:4MB(I+D) on chip sharedL3 Cache:N/AOther Cache:N/AMemory:8x 2GB 667MHz CL5 DDR2 FB-DIMMDisk Subsystem:1 X WD 2500 250GB SATAOther Hardware:N/A
HardwareHardware Vendor:Supermicro
SoftwareOperating System:Windows server 2003 Enterprise Edition 32-bits W/ SP1Compiler:Intel C++ and Fortran Compiler 9.1 for 32-bit applications
Build 20060323Z Package ID: W_FC_P_9.1.020
Microsoft Visual Studio 2005(for libraries)
SmartHeap Library Version 8.0 from http://www.microquill.com/File System:NTFSSystem State:DefaultNotes / Tuning Information +FDO: PASS1=  -Qprof_gen  PASS2=-Qprof_use  Base tuning for Fortran programs:  -fast -Qansi_alias +FDO  Base tuning for C programs: -fast shlW32M.lib +FDO  Portability: 178.galgel:   -FI /F32000000 Peak tuning: 168.wupwise:  -fast -Qansi_alias +FDO 171.swim:     -fast -Qansi_alias +FDO 172.mgrid:    -fast -Qansi_alias +FDO 173.applu:  basepeak=yes 177.mesa:   basepeak=yes 178.galgel:   -fast -Qansi_alias +FDO 179.art:      basepeak=yes 183.equake:   -QxP -Oa -Qrcd -Qipo  +FDO  shlW32M.lib 187.facerec:  -fast -Qunroll1 -Qscalar_rep- +FDO  188.ammp:     -fast -Oa +FDO  shlW32M.lib 189.lucas:    -fast -Qprefetch- +FDO 191.fma3d:    basepeak=yes 200.sixtrack: -Qipo -QxP +FDO 301.apsi:     -fast +FDO  Tested systems can be used with SC825S2-R700LPV case,   To ensure system stability, a 500W (minimum) ATX power supply  [4-pin (+12V), 8-pin (+12V) and 24-pin are required]  Product description located as of X7DB8-X:  http://www.supermicro.com/produc ... 3/5000P/X7DB8-X.cfm  The system bus runs at 1333 MHz
作者: xhxsoft    时间: 2006-9-12 10:26
妙杀Woodcrest 垃圾
作者: hbdavidlee    时间: 2006-9-12 10:29
AMD浮点的确比较强,2.56G闪龙跑1M比P43.5E还快2S,但是又怎么样,只要一个卡巴斯基,机器就不能动,P4还可以边卡巴边CS

光强调浮点有P用,整数才是王道,毕竟操作系统,大部分软件还是靠整数维系的,浮点只能在游戏上YY下
作者: roadrunner    时间: 2006-9-12 10:37
浮点是用来杀安腾的, 这个分数就算是安腾搭配NUMA也顶不住了

看来FB-DIMM也拯救不了Intel啊, 强如扣肉, 没有NUMA就是亏.
作者: Edison    时间: 2006-9-12 10:55
http://www.spec.org/osg/cpu2000/ ... 20060815-06997.html
作者: Albatron    时间: 2006-9-12 11:02
五块的浮点居然被奥普特龙做掉了?
汗一个:sweatingbullets:
作者: acqwer    时间: 2006-9-12 11:18
http://www.spec.org/cpu2000/resu ... 20060816-07008.html

配置和SUN的那台差不多的机器SPECfp_rate2000得分是89.3,难道是SUN做了什么特别的优化。

还有SPECfp2000的得分5160都在2700~2800,而Opteron 2218都只有2000左右,这两种测试不是应该基本上同步的吗?

[ 本帖最后由 acqwer 于 2006-9-12 11:32 编辑 ]
作者: roadrunner    时间: 2006-9-12 11:28
编译器不一样,不过也比以前sun的编译器分高很多

这编译器是打了patch,估计有点关系

而且应该在优化上也下了功夫, 个别测试peak成绩比base成绩高了一倍, 够吓人的了
作者: soft    时间: 2006-9-12 11:33
原帖由 roadrunner 于 2006-9-12 11:28 发表
编译器不一样,不过也比以前sun的编译器分高很多

这编译器是打了patch,估计有点关系

而且应该在优化上也下了功夫, 个别测试peak成绩比base成绩高了一倍, 够吓人的了



不管怎么说,这项是k8赢得

google了一下,原来是这么回事


新 Opteron 最快的一颗 CPU 是 2.8GHz,虽然这些 CPU 和 Intel 上一代架构的 Dempsy 核心 Xeon 比起来应该是有绝对优势,但和新架构的 Woodcrest 比起来就比较不乐观了。AMD 至少还有把握在一种数据上 ( Linux SPECfp_rate2000 ) 上赢过 Woodcrest 11%,但接下来就只有不断地强调「处理器、内存和北桥加起来的耗电量比较低」,有没有听起来似曾相识啊…



不同的架构cpu总能找到某项测试一种比另一种强的
作者: AFXIF    时间: 2006-9-12 11:34
新出的东西自然不会比出了5年的东西优化更彻底。
作者: roadrunner    时间: 2006-9-12 11:35
sun的编译器有个别成绩高得吓人

swim, art, equake这几项比pathscale的提高都是按倍数算的, 即使使用base参数也是

但pathscale有不少项目也领先sun的编译器,

如果允许针对不同测试项目使用不同编译器成绩会更高。
作者: roadrunner    时间: 2006-9-12 11:43
原帖由 soft 于 2006-9-12 11:33 发表



不管怎么说,这项是k8赢得

google了一下,原来是这么回事


新 Opteron 最快的一颗 CPU 是 2.8GHz,虽然这些 CPU 和 Intel 上一代架构的 Dempsy 核心 Xeon 比起来应该是有绝对优势,但和新架构的 Woo ...


我觉得Woodcrest相对于Opteron的优势并不象Conroe对Athlon64那么明显,主要的一个原因是WoodCrest要求搭配FB-DIMM内存,这在低端服务器要增加不少成本,而对于高端来说,WoodCrest又没有4路的产品。其他补充产品线,NetBrust不争气就不说了,Yonah又没有64位,所以Intel的服务器产品线阵容总给人不完整的感觉。

从上面这测试看,FB-DIMM让人失望,在双U四核的市场中,至少在要求内存带宽的应用中不敌AMD的双内置内存控制器,要求内存延时的应用估计可能输得更惨。

要充分发挥WoodCrest在Cache上的优势需要对软件充分的优化,而实际应用大部分软件都是优化得不怎么样的,我觉得还是Opteron的双内置内存控制器实在。
作者: ok2000    时间: 2006-9-12 11:44
呵呵,看到这个测试,转一篇新闻。
英特尔再挑AMD 称Woodcrest性能评测中占优

作者: CNET科技资讯网
CNETNews.com.cn 2006-09-05 11:30:01 AM

CNET科技资讯网9月5日台北报道(旷文溱)英特尔又再把Woodcrest表现拿出来说一次,并且和AMD甫面市的“Rev F”版双核Opteron处理器,展开性能比大赛。

距离上一次发布新款双核Xeon 5100处理器(代号为Woodcrest)过了两个多月的时间,英特尔8月30日又在台北举办Woodcrest的性能发布会。

强调不论是执行一般运算应用、Java应用、甚至以往AMD较为擅长的高性能运算,Woodcrest的性能表现都分别胜出Rev F Opteron高达46%、42%以及100%。

英特尔甚至在现场摆上了两台内存容量等规范都相同、唯分别搭载Woodcrest和Rev F Opteron的电脑,展示在执行模拟撞击测试、3D立体动画等软件时,Woodcrest的速度的确快上Rev F Opteron。

“以往英特尔的确很少这样做(意指公布与AMD处理器性能评比数据),但是对方的确太大声嚷嚷了,所以英特尔要提出数据证明,”英特尔亚太区营销及技术总监黄逸松说。

“事实证明AMD Rev F Opteron的各项性能评比都比英特尔Woodcrest差,”英特尔亚太区营销暨业务营销部协理刘景慈说。

至于AMD在先前发布Rev F Opteron时,提出在耗电量及虚拟化技术等表现在在都胜过英特尔。英特尔对此的反应是:“英特尔的手边并没有双方的性能耗电比信息。

不过,Woodcrest的性能表现好,用户就可以节省服务器高速运作的时间,难道这个不会更节省耗电吗?”刘景慈说。

再者,虚拟化技术不会是单一厂商推动就算数。英特尔和VMWare合推的Virtualiza ASAP计划,可以确保英特尔处理器的虚拟化技术更上层楼,他补充道。

Woodcrest是英特尔首款采用英特尔核心微架构 (Intel Core Microarchitecture)的双核处理器产品。拥有优于旧型英特尔服务器产品135%的性能并减少40%的耗电量。其频率达3.0 GHz,支持更快的1333 MHz汇流排,内建4 MB L2缓存内存,供两个核心使用。

3 GHz处理器的散热设计功率(Thermal Design Point, TDP)为80瓦,其余的处理器则为65瓦。未来还将推出2.33 GHz的低电压处理器,总耗电量为40瓦。Woodcrest 所包含的电力管理技术,使得实际耗电量可大幅低于TDP电量。

Woodcrest的推出让英特尔眼睛为之一亮。因为近年来AMD凭借着低耗电量、专精HPC、EDA应用等优点,让其气势一路上扬。

根据IDC台湾提供的信息,AMD Opteron在台湾x86服务器市场第一季的占有率为5.3%。和去年同期相比堪称增长飞速,达到了442.7%;和去年第四季相比,也有31.5%的增长。

AMD Opteron连战皆捷,继英特尔忠实的老战友戴尔宣布在今年推出AMD Opteron四路服务器后,IBM也宣布扩大AMD产品线。上述种种自然给了英特尔不小的压力。

不过英特尔也不是省油的灯,在今年六月底发布Woodcrest后,由于其性能和耗电量表现,都较上一代的Xeon Dempsey明显提升,英特尔视其为反攻市场力作。

“Woodcrest的问世,会让英特尔把去年失去的市场占有率拿回来,”英特尔台湾分公司总经理陈立生说。
作者: Edison    时间: 2006-9-12 11:45
这里相差的是~40%。
作者: NONO    时间: 2006-9-12 12:14
弱弱的問一下各位DX
在遊戲中是強調CPU的浮点還是整數???
如果是浮點,那照理說A64在遊戲中並不會几乎完敗Conroe吧
還是說以K8的架構要多way才能体現出浮點的优勢??:unsure:
作者: goodayoo    时间: 2006-9-12 12:23
玩游戏Athlon比P4好太多了,这个不用多说,但扣肉的构架不错,所以比较有潜力,等待K8L来拯救AMD了。
作者: NONO    时间: 2006-9-12 12:40
原帖由 goodayoo 于 2006-9-12 12:23 发表
玩游戏Athlon比P4好太多了,这个不用多说,但扣肉的构架不错,所以比较有潜力,等待K8L来拯救AMD了。


扣肉還有潛力??
倒是聽到另一種說法是扣肉架構己經快被压榨到極限:unsure:
作者: AFXIF    时间: 2006-9-12 12:54
扣肉的整数成绩基本上把啥CPU都杀了……
CINT2000跑3000分呀!
作者: hbdavidlee    时间: 2006-9-12 13:18
原帖由 NONO 于 2006-9-12 12:40 发表


扣肉還有潛力??
倒是聽到另一種說法是扣肉架構己經快被压榨到極限:unsure:



扣肉的架构并不是已经到极限,而是intel给扣肉分配的浮点线程很少,毕竟intel大部分的目标客户还是商业用户,整数运算强大更能讨好客户,K8L的架构相对K8也不见得是全新的,个人觉得没什么好指望
作者: roadrunner    时间: 2006-9-12 13:20
扣肉浮点比K8只好不差,差距还是在内存带宽,Intel服务器系统的老弱点
作者: xhxsoft    时间: 2006-9-12 13:22
期待amd的妙杀扣肉的产品
作者: 汉尼拔    时间: 2006-9-12 13:28
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2006-9-12 22:43
原帖由 xhxsoft 于 2006-9-12 10:26 发表
妙杀Woodcrest 垃圾


看到一个测试就欢欣鼓舞,还不知道优化是不是有效呢
当年显卡优化风波还教训不够深么?
作者: AFXIF    时间: 2006-9-12 23:41
这个评测不优化也胜11%,不过这东西基本不能反映家用性能。

何必看着这个来分析要买K8或者扣肉呢……
作者: xreal    时间: 2006-9-12 23:43
:huh: 不过 solaris10强过windows server2003,这一点没什么疑问。
w00t)
作者: FENG950    时间: 2006-9-12 23:59
测试的英特尔系统是哪个公司的啊?看起来更像是超微推销自己主板而DIY的。
作者: AFXIF    时间: 2006-9-13 00:12
原帖由 FENG950 于 2006-9-12 23:59 发表
测试的英特尔系统是哪个公司的啊?看起来更像是超微推销自己主板而DIY的。

恩,2路扣肉的最高成绩似乎是这个
http://www.spec.org/osg/cpu2000/ ... 20060612-06165.html

比楼主贴的这个高一些
作者: FENG950    时间: 2006-9-13 00:24
原帖由 AFXIF 于 2006-9-13 00:12 发表

恩,2路扣肉的最高成绩似乎是这个
http://www.spec.org/osg/cpu2000/ ... 20060612-06165.html

比楼主贴的这个高一些

最高是这个?配置不怎么样嘛,内存才8G。
作者: Edison    时间: 2006-9-13 00:37
cfp2000在4 user的时候,内存占用不会超过3GB,内存容量对于这里的测试系统来说根本不是问题。
作者: Prescott    时间: 2006-9-13 09:34
Sun的这种作弊的Specfp测试根本都可以无视。Sun在这么干下去,还不如直接把计算部分都跳过,直接输出结果算了。

不如让Sun把那个作弊的代码放到Woodcrest上面跑跑看看,就一切都清楚了。

[ 本帖最后由 Prescott 于 2006-9-13 09:39 编辑 ]
作者: roadrunner    时间: 2006-9-13 10:14
有证据吗?

SUN的测试即使是BASE成绩都很优秀. 你是否认为SUN的编译器并非通过编译开关激活作弊状态?

你能说一下SUN编译器如何判断需要激活作弊状态呢? 文件名比较还是源代码匹配?

又或者你能否列出一个国外论坛关于SUN编译器作弊的讨论的URL?
作者: roadrunner    时间: 2006-9-13 10:16
SUN的编译器在单U成绩下并不突出, 如果是作弊, 为什么单U不能把WOODCREST打得落花流水?

我觉得成绩提升来自对NUMA更有效的利用.

WOODCREST系统的内存带宽多少? 喂得饱4个单核SPECFP2000得分在2500以上的核心吗?
作者: Edison    时间: 2006-9-13 10:17
Intel的编译器还弄厂商识别呢。
作者: popwangyuII    时间: 2006-9-13 10:23
标题: 回复 #3 hbdavidlee 的帖子
卡吧的问题无非还是线程优先级的问题,把他的优先级降低,K8和P4HT差不多.说P4的指令性能比K8好,那倒不至于,指令性能好不好,游戏一测就知道.

不过楼主这个帖子倒是
作者: locksmith    时间: 2006-9-13 10:32
如果没有作弊的话,sun编译器的这个patch真的很厉害,比较下面两个链接:
http://www.spec.org/osg/cpu2000/ ... 20051114-05067.html
http://www.spec.org/osg/cpu2000/ ... 20060815-06997.html
软硬件配置基本相同,但是这个patch硬是把成绩提高了40%。:funk:
这是单U的成绩:
http://www.spec.org/osg/cpu2000/ ... 20060815-07000.html
双U+16G内存 vs 单U + 4G内存,成绩提高超过了100%
作者: AFXIF    时间: 2006-9-13 11:01
2218和285毕竟是不同的……

这测试本来就沾内存的光。
作者: roadrunner    时间: 2006-9-13 11:23
其中art一项测试,打了patch后快了11倍!

即使是base,也比没有patch的peak快了5倍多!

这的确太象作弊了, 但是作弊能把base成绩提升那么多, 也够不简单的, 但是如果是作弊的话, 要抓它证据应该很轻松吧, 比抓gpu驱动作弊简单多了, 国外应该老早有讨论才是
作者: roadrunner    时间: 2006-9-13 11:58
pathscale的成绩也不弱

http://www.spec.org/osg/cpu2000/ ... 20060721-06583.html

pathscale 2.3  CPU是2.8G, base得分87.9 peak得分96.0

也足够击败woodcrest了, 应当说Opteron在多路浮点上可以轻松击败woodcrest是没有疑问的了.

而且woodcrest得分85分的那个测试中是混用了pathscale的编译器和icc编译器, 更没有pathscale作弊使k8得利的可能了
作者: xreal    时间: 2006-9-13 12:59
:huh:
wintel组合显然在服务器上搞不过sun+amdw00t)
作者: Prescott    时间: 2006-9-13 13:09
在specfp,尤其是art子项上“优化”各大厂商都有,只不过是程度问题。“优化”过度了也就变成了作弊。

双U,4Core系统中,Woodcrest的Specfp成绩确实不是很突出,这是系统的问题。这项上面也是唯一一个Opteron没有被Woodcrest打得满地找牙的项目了。

4U,8Core系统,就不谈了,没什么可说的,只能等2008吧,2008的夏天和2006的夏天一样会值得激动。

另外SpecCPU2006已经出来了。

[ 本帖最后由 Prescott 于 2006-9-13 13:13 编辑 ]
作者: roadrunner    时间: 2006-9-13 13:14
安腾跑art还只需要13秒呢, 如果Opteron跑16秒是作弊的话, 那么安腾作弊也是没有疑问的了
作者: Prescott    时间: 2006-9-13 13:23
原帖由 roadrunner 于 2006-9-13 13:14 发表
安腾跑art还只需要13秒呢, 如果Opteron跑16秒是作弊的话, 那么安腾作弊也是没有疑问的了

你知道art是干什么的吗?怎么“优化”吗?就敢下这样的结论。

Itanium的体系结构中有些其他处理器都没有达到的指标。
作者: roadrunner    时间: 2006-9-13 13:31
specCPU 2006我觉得在fp rates方面依旧会很依赖内存带宽

比较一下P4EE 3.73G双核心和Xeon 3.8G双U的成绩

3.73P4EE: http://www.spec.org/cpu2006/resu ... 20060513-00011.html

3.8GXeon: http://www.spec.org/cpu2006/resu ... 20060513-00025.html

两者用同样的编译器, Xeon主频更高, 但是P4EE反而分数高出15%, 明显是赢在内存上. 可见spec CPU 2006 FP RATES一样是对内存带宽十分敏感, 多路Opteron依旧会有好表现

至于2008, 也实在远了点吧
作者: roadrunner    时间: 2006-9-13 13:37
原帖由 Prescott 于 2006-9-13 13:23 发表

你知道art是干什么的吗?怎么“优化”吗?就敢下这样的结论。

Itanium的体系结构中有些其他处理器都没有达到的指标。


你最好能讲得清楚为何Itanium的13秒成绩不算作弊, 而Opteron的16秒成绩为何必然是作弊, 你讲不清楚就算了, 没必要再在这扯废话.

现在很明显的情况是: 即使换用相同的编译器, WoodCrest在4核2路跑fp rates也不是Opteron的对手.
作者: Edison    时间: 2006-9-13 13:40
A64 5000+使用Intel ICC 9.1 二进制代码:
http://www.pcinlife.com/article/ ... 4158113d191_26.html

作者: Prescott    时间: 2006-9-13 16:08
原帖由 roadrunner 于 2006-9-13 13:37 发表


你最好能讲得清楚为何Itanium的13秒成绩不算作弊, 而Opteron的16秒成绩为何必然是作弊, 你讲不清楚就算了, 没必要再在这扯废话.

现在很明显的情况是: 即使换用相同的编译器, WoodCrest在4核2路跑fp rates也 ...


小同学,不懂就虚心请教。

虽然你这么不懂礼貌,我还是大人不记小人过,告诉你算了:179.art的footprint很小,6M的L3就够把所有需要的数据全部装进去。而且art访问内存的方式相当不规律,当cache比较小的时候,miss rate非常高。所以,Itanium的128个寄存器,单周期L1D,5cycle L2,加上6ML3跑得快就很正常了。

[ 本帖最后由 Prescott 于 2006-9-13 16:30 编辑 ]
作者: dennis    时间: 2006-9-13 16:35
原帖由 roadrunner 于 2006-9-13 13:14 发表
安腾跑art还只需要13秒呢, 如果Opteron跑16秒是作弊的话, 那么安腾作弊也是没有疑问的了



这样推导的结果绝对是错误的。Itanium还是有很多独得的地方,如果真的要优化Itanium2的成绩恐怕还不用13秒。

P.S 突然发现RR、Prescott重出江湖,让我想起2004年那场IA大战:lol:

[ 本帖最后由 dennis 于 2006-9-13 16:37 编辑 ]
作者: Edison    时间: 2006-9-13 16:43
这是用Itanium 1 733MHz跑的一些执行时间占用百分比,可以看出它跑art时候的data cache miss rate占用的时间相当高。

Hans的测试中缺乏这方面的细节。
作者: Edison    时间: 2006-9-13 16:48
几个架构使用一个简单数据布局优化获得的效果比较:
作者: graphiccard    时间: 2006-10-1 14:51
原帖由 NONO 于 2006-9-12 12:14 发表
弱弱的問一下各位DX
在遊戲中是強調CPU的浮点還是整數???
如果是浮點,那照理說A64在遊戲中並不會几乎完敗Conroe吧
還是說以K8的架構要多way才能体現出浮點的优勢??:unsure:



浮点分两种,一种是SIMD的浮点,另一种是X87浮点

P4```不说其深流水线的问题,就算不是这个问题,他的X87浮点也很明显是弱化了的!比起K8来说有一定差距!弱化X87是业界制定的标准与目标,未来完成形态的64bitCPU是不需要什么硬件协助处理器的!未来一条SIMD足以代替,N个X87的效能,相对起来~X87这种东西又占地方又多消耗成本```是属于该蜕化腐朽玩意!

不过如今不是又有个问题!听高人侃过,说SSE2浮点在如今游戏中,还没有谁对其做针对优化也不容易做到全局优化,如今游戏都还是主要靠X87浮点,所以````P4比K8差是很正常的!




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4