POPPUR爱换

标题: 不用等到07年年中，现在最快的Woodcrest在浮点上已经被2.6GHz Opteron打死了 [打印本页]

作者: Edison 时间: 2006-9-12 10:25
标题: 不用等到07年年中，现在最快的Woodcrest在浮点上已经被2.6GHz Opteron打死了

Sun Microsystems
Sun Fire X2200 M2

SPECfp_rate2000 =	117
SPECfp_rate_base2000 =	101

SPEC license # 6

Tested by: Sun Microsystems, Santa Clara

Test date: Jul-2006

Hardware Avail: Aug-2006

Software Avail: Jul-2006

[/td]BenchmarkBase CopiesBase RuntimeBase RatioCopiesRuntimeRatio[/tr]
	168.wupwise	4	58.9	126	4	57.6	129
	171.swim	4	76.3	188	4	73.8	195
	172.mgrid	4	118	70.7	4	112	74.6
	173.applu	4	98.1	99.3	4	91.4	107
	177.mesa	4	88.5	73.4	4	71.6	90.8
	178.galgel	4	102	132	4	69.2	194
	179.art	4	33.5	360	4	15.8	763
	183.equake	4	47.4	127	4	44.1	137
	187.facerec	4	69.7	127	4	49.6	178
	188.ammp	4	158	64.5	4	159	64.0
	189.lucas	4	134	69.3	4	134	69.1
	191.fma3d	4	124	78.3	4	122	79.7
	200.sixtrack	4	143	35.7	4	139	36.6
	301.apsi	4	123	97.8	4	111	108
	SPECfp_rate_base2000			101
				SPECfp_rate2000			117

Model Name:Sun Fire X2200 M2 CPU:AMD Opteron (TM) 2218CPU MHz:2600FPU:IntegratedCPU(s) enabled:4 cores, 2 chips, 2 cores/chipCPU(s) orderable:1,2 (order by # of chips)Parallel:NoPrimary Cache:64KBI + 64KBD (on chip) per coreSecondary Cache:1024KB (I+D) (on chip) per coreL3 Cache:N/AOther Cache:N/AMemory:16GB (8x2GB, DDR2-667 CL5 ECC Reg)Disk Subsystem:SATA,250GB,7200RPMOther Hardware:None

HardwareHardware Vendor:Sun Microsystems

SoftwareOperating System:Solaris 10 6/06Compiler:Sun Studio 11 with PatchesFile System:ufsSystem State:Multi-userNotes / Tuning InformationCompiler invocation: C: cc F90: f90 F77: f90 FDO: PASS1= -xprofile=collect:./feedback PASS2= -xprofile=use:./feedback fdo_pre0: rm -rf ./feedback.profileFloating point base flags: Fortran: -fast -xipo=2 -xarch=amd64 -xprefetch_level=3 ONESTEP=yes C: -fast -xipo=2 -xalias_level=std -xpagesize=2m ONESTEP=yes Floating point peak flags: ONESTEP=yes for all benchmarks 168.wupwise: -fast -xautopar -xpad=common:3969 -xipo=2 -xarch=amd64 -xprefetch_level=3 -xpagesize_heap=2m 171.swim: -fast -xpad=common:3969 -xipo=2 -xvector=simd -xprefetch_level=3 -Qoption iropt -Atile:skewp,-Ainline:cs=700 -xarch=amd64 -Qoption ube_ipa -inl_alt -xpagesize_stack=2m 172.mgrid: -fast -xautopar -stackvar -xpad=common:900 -xipo=2 -xarch=amd64 -xprefetch_level=3 -xvector -xpagesize=2m -Qoption ld -M,/usr/lib/ld/map.bssalign 173.applu: -fast -xautopar -unroll=5 -stackvar -xO4 -xipo=2 -xprefetch_level=3 -xarch=amd64a -qoption iropt -Rloop_dist -xpagesize_heap=2m 177.mesa: -fast -xautopar -xO4 -xipo=2 -Wd,-iropt-prof -xarch=amd64 -xalias_level=strong -xpagesize=2m +FDO 178.galgel: -fast -xcache=64/32/4:1024/64/4 -xipo=2 -xpagesize_heap=2m -xvector=simd -xarch=amd64 -xprefetch_level=3 RM_SOURCES=lapak.f90 EXTRA_LIBS=-xlic_lib=sunperf 179.art: -fast -xipo=2 -xalias_level=strong -xprefetch -Wd,-iropt-prof -xpagesize=2m +FDO 183.equake: -fast -Wd,-iropt-prof -xipo=2 -xprefetch -xalias_level=strong -xpagesize=2m -lmopt -lm +FDO 187.facerec: -fast -xO4 -xipo=2 -xprefetch_level=3 -xpagesize=2m RM_SOURCES=cfftb.f90 cffti.f90 cfftf.f90 EXTRA_LIBS=-xlic_lib=sunperf 188.ammp: -fast -xcache=64/32/4:1024/64/4 -xO4 -xipo=2 -xarch=amd64a -xalias_level=std -xpagesize_heap=2m -lmopt -lm 189.lucas: -fast -Qoption ube_ipa -inl_alt -xipo=2 -xarch=amd64 -xprefetch_level=3 191.fma3d: -fast -xcache=64/32/4:1024/64/4 -unroll=5 -fsimple=1 -xipo=2 -xprefetch_level=3 -xarch=amd64 -xpagesize_heap=2m +FDO 200.sixtrack: -fast -xipo=2 -O -xprefetch_level=3 -xarch=amd64 -xpagesize_heap=2m -Qoption ld -M,/usr/lib/ld/map.bssalign +FDO 301.apsi: -fast -xO4 -xipo=2 -xprefetch_level=3 -xarch=amd64a -xpagesize=2mPortability: 178.galgel: -fixed Shell Environments: Stack size set to unlimited via "ulimit -s unlimited" PARALLEL was not set, therefore each copy of the benchmark ran single-threaded using only one core. The following patches were applied to Sun Studio 11 compiler:120759-07 : x86/x64121016-03 : x86 C121020-03 : x86 F90121018-03 : x86 C++ Processes were bound to CPUs using submit=pbindDefault BIOS setting was used

Supermicro
Motherboard X7DB8-X ( 3.00GHz, Intel Xeon 5160 processor)

SPECfp_rate2000 =	80.6
SPECfp_rate_base2000 =	80.8

SPEC license # 001176

Tested by: Supermicro

Test date: Jun-2006

Hardware Avail: May-2006

Software Avail: Mar-2006

[/td]BenchmarkBase CopiesBase RuntimeBase RatioCopiesRuntimeRatio[/tr]
	168.wupwise	4	69.1	107	4	69.1	107
	171.swim	4	263	54.8	4	262	54.8
	172.mgrid	4	164	50.8	4	164	50.8
	173.applu	4	190	51.3	4	190	51.3
	177.mesa	4	52.6	124	4	52.6	124
	178.galgel	4	57.7	233	4	57.8	233
	179.art	4	58.0	208	4	58.0	208
	183.equake	4	87.3	69.1	4	87.3	69.1
	187.facerec	4	89.9	98.1	4	90.7	97.2
	188.ammp	4	139	73.5	4	142	71.9
	189.lucas	4	172	54.0	4	172	54.0
	191.fma3d	4	167	58.5	4	167	58.5
	200.sixtrack	4	93.9	54.4	4	95.4	53.5
	301.apsi	4	187	64.6	4	187	64.6
	SPECfp_rate_base2000			80.8
				SPECfp_rate2000			80.6

Model Name:Motherboard X7DB8-X ( 3.00GHz, Intel Xeon 5160 processor)CPU:Intel Xeon 5160 processor ( 3.00GHz, 4MB L2 shared, 1333 MHz bus)CPU MHz:3000FPU:IntegratedCPU(s) enabled:4 cores, 2 chips, 2 cores/chip CPU(s) orderable:1, 2Parallel:NoPrimary Cache:32KBI + 32KBD on chip per coreSecondary Cache:4MB(I+D) on chip sharedL3 Cache:N/AOther Cache:N/AMemory:8x 2GB 667MHz CL5 DDR2 FB-DIMMDisk Subsystem:1 X WD 2500 250GB SATAOther Hardware:N/A

HardwareHardware Vendor:Supermicro

SoftwareOperating System:Windows server 2003 Enterprise Edition 32-bits W/ SP1Compiler:Intel C++ and Fortran Compiler 9.1 for 32-bit applications
Build 20060323Z Package ID: W_FC_P_9.1.020
Microsoft Visual Studio 2005(for libraries)
SmartHeap Library Version 8.0 from http://www.microquill.com/File System:NTFSSystem State:DefaultNotes / Tuning Information +FDO: PASS1= -Qprof_gen PASS2=-Qprof_use Base tuning for Fortran programs: -fast -Qansi_alias +FDO Base tuning for C programs: -fast shlW32M.lib +FDO Portability: 178.galgel: -FI /F32000000 Peak tuning: 168.wupwise: -fast -Qansi_alias +FDO 171.swim: -fast -Qansi_alias +FDO 172.mgrid: -fast -Qansi_alias +FDO 173.applu: basepeak=yes 177.mesa: basepeak=yes 178.galgel: -fast -Qansi_alias +FDO 179.art: basepeak=yes 183.equake: -QxP -Oa -Qrcd -Qipo +FDO shlW32M.lib 187.facerec: -fast -Qunroll1 -Qscalar_rep- +FDO 188.ammp: -fast -Oa +FDO shlW32M.lib 189.lucas: -fast -Qprefetch- +FDO 191.fma3d: basepeak=yes 200.sixtrack: -Qipo -QxP +FDO 301.apsi: -fast +FDO Tested systems can be used with SC825S2-R700LPV case, To ensure system stability, a 500W (minimum) ATX power supply [4-pin (+12V), 8-pin (+12V) and 24-pin are required] Product description located as of X7DB8-X: http://www.supermicro.com/produc ... 3/5000P/X7DB8-X.cfm The system bus runs at 1333 MHz

作者: xhxsoft 时间: 2006-9-12 10:26
妙杀Woodcrest 垃圾

作者: hbdavidlee 时间: 2006-9-12 10:29
AMD浮点的确比较强，2.56G闪龙跑1M比P43.5E还快2S，但是又怎么样，只要一个卡巴斯基，机器就不能动，P4还可以边卡巴边CS

光强调浮点有P用，整数才是王道，毕竟操作系统，大部分软件还是靠整数维系的，浮点只能在游戏上YY下

作者: roadrunner 时间: 2006-9-12 10:37
浮点是用来杀安腾的, 这个分数就算是安腾搭配NUMA也顶不住了

看来FB-DIMM也拯救不了Intel啊, 强如扣肉, 没有NUMA就是亏.

作者: Edison 时间: 2006-9-12 10:55
http://www.spec.org/osg/cpu2000/ ... 20060815-06997.html

作者: Albatron 时间: 2006-9-12 11:02
五块的浮点居然被奥普特龙做掉了？
汗一个:sweatingbullets:

作者: acqwer 时间: 2006-9-12 11:18
http://www.spec.org/cpu2000/resu ... 20060816-07008.html

配置和SUN的那台差不多的机器SPECfp_rate2000得分是89.3，难道是SUN做了什么特别的优化。

还有SPECfp2000的得分5160都在2700~2800，而Opteron 2218都只有2000左右，这两种测试不是应该基本上同步的吗？

[ 本帖最后由 acqwer 于 2006-9-12 11:32 编辑 ]

作者: roadrunner 时间: 2006-9-12 11:28
编译器不一样，不过也比以前sun的编译器分高很多

这编译器是打了patch，估计有点关系

而且应该在优化上也下了功夫, 个别测试peak成绩比base成绩高了一倍, 够吓人的了

作者: soft 时间: 2006-9-12 11:33

原帖由 roadrunner 于 2006-9-12 11:28 发表
编译器不一样，不过也比以前sun的编译器分高很多

这编译器是打了patch，估计有点关系

而且应该在优化上也下了功夫, 个别测试peak成绩比base成绩高了一倍, 够吓人的了

不管怎么说，这项是k8赢得

google了一下，原来是这么回事

新 Opteron 最快的一颗 CPU 是 2.8GHz，虽然这些 CPU 和 Intel 上一代架构的 Dempsy 核心 Xeon 比起来应该是有绝对优势，但和新架构的 Woodcrest 比起来就比较不乐观了。AMD 至少还有把握在一种数据上 ( Linux SPECfp_rate2000 ) 上赢过 Woodcrest 11%，但接下来就只有不断地强调「处理器、内存和北桥加起来的耗电量比较低」，有没有听起来似曾相识啊…

不同的架构cpu总能找到某项测试一种比另一种强的

作者: AFXIF 时间: 2006-9-12 11:34
新出的东西自然不会比出了5年的东西优化更彻底。

作者: roadrunner 时间: 2006-9-12 11:35
sun的编译器有个别成绩高得吓人

swim, art, equake这几项比pathscale的提高都是按倍数算的, 即使使用base参数也是

但pathscale有不少项目也领先sun的编译器,

如果允许针对不同测试项目使用不同编译器成绩会更高。

作者: roadrunner 时间: 2006-9-12 11:43

原帖由 soft 于 2006-9-12 11:33 发表

不管怎么说，这项是k8赢得

google了一下，原来是这么回事

新 Opteron 最快的一颗 CPU 是 2.8GHz，虽然这些 CPU 和 Intel 上一代架构的 Dempsy 核心 Xeon 比起来应该是有绝对优势，但和新架构的 Woo ...

我觉得Woodcrest相对于Opteron的优势并不象Conroe对Athlon64那么明显，主要的一个原因是WoodCrest要求搭配FB-DIMM内存，这在低端服务器要增加不少成本，而对于高端来说，WoodCrest又没有4路的产品。其他补充产品线，NetBrust不争气就不说了，Yonah又没有64位，所以Intel的服务器产品线阵容总给人不完整的感觉。

从上面这测试看，FB-DIMM让人失望，在双U四核的市场中，至少在要求内存带宽的应用中不敌AMD的双内置内存控制器，要求内存延时的应用估计可能输得更惨。

要充分发挥WoodCrest在Cache上的优势需要对软件充分的优化，而实际应用大部分软件都是优化得不怎么样的，我觉得还是Opteron的双内置内存控制器实在。

作者: ok2000 时间: 2006-9-12 11:44
呵呵，看到这个测试，转一篇新闻。
英特尔再挑AMD 称Woodcrest性能评测中占优

作者： CNET科技资讯网
CNETNews.com.cn 2006-09-05 11:30:01 AM

CNET科技资讯网9月5日台北报道（旷文溱）英特尔又再把Woodcrest表现拿出来说一次，并且和AMD甫面市的“Rev F”版双核Opteron处理器，展开性能比大赛。

距离上一次发布新款双核Xeon 5100处理器（代号为Woodcrest）过了两个多月的时间，英特尔8月30日又在台北举办Woodcrest的性能发布会。

强调不论是执行一般运算应用、Java应用、甚至以往AMD较为擅长的高性能运算，Woodcrest的性能表现都分别胜出Rev F Opteron高达46%、42%以及100%。

英特尔甚至在现场摆上了两台内存容量等规范都相同、唯分别搭载Woodcrest和Rev F Opteron的电脑，展示在执行模拟撞击测试、3D立体动画等软件时，Woodcrest的速度的确快上Rev F Opteron。

“以往英特尔的确很少这样做（意指公布与AMD处理器性能评比数据），但是对方的确太大声嚷嚷了，所以英特尔要提出数据证明，”英特尔亚太区营销及技术总监黄逸松说。

“事实证明AMD Rev F Opteron的各项性能评比都比英特尔Woodcrest差，”英特尔亚太区营销暨业务营销部协理刘景慈说。

至于AMD在先前发布Rev F Opteron时，提出在耗电量及虚拟化技术等表现在在都胜过英特尔。英特尔对此的反应是：“英特尔的手边并没有双方的性能耗电比信息。

不过，Woodcrest的性能表现好，用户就可以节省服务器高速运作的时间，难道这个不会更节省耗电吗？”刘景慈说。

再者，虚拟化技术不会是单一厂商推动就算数。英特尔和VMWare合推的Virtualiza ASAP计划，可以确保英特尔处理器的虚拟化技术更上层楼，他补充道。

Woodcrest是英特尔首款采用英特尔核心微架构 (Intel Core Microarchitecture)的双核处理器产品。拥有优于旧型英特尔服务器产品135%的性能并减少40%的耗电量。其频率达3.0 GHz，支持更快的1333 MHz汇流排，内建4 MB L2缓存内存，供两个核心使用。

3 GHz处理器的散热设计功率(Thermal Design Point, TDP)为80瓦，其余的处理器则为65瓦。未来还将推出2.33 GHz的低电压处理器，总耗电量为40瓦。Woodcrest 所包含的电力管理技术，使得实际耗电量可大幅低于TDP电量。

Woodcrest的推出让英特尔眼睛为之一亮。因为近年来AMD凭借着低耗电量、专精HPC、EDA应用等优点，让其气势一路上扬。

根据IDC台湾提供的信息，AMD Opteron在台湾x86服务器市场第一季的占有率为5.3%。和去年同期相比堪称增长飞速，达到了442.7%；和去年第四季相比，也有31.5%的增长。

AMD Opteron连战皆捷，继英特尔忠实的老战友戴尔宣布在今年推出AMD Opteron四路服务器后，IBM也宣布扩大AMD产品线。上述种种自然给了英特尔不小的压力。

不过英特尔也不是省油的灯，在今年六月底发布Woodcrest后，由于其性能和耗电量表现，都较上一代的Xeon Dempsey明显提升，英特尔视其为反攻市场力作。

“Woodcrest的问世，会让英特尔把去年失去的市场占有率拿回来，”英特尔台湾分公司总经理陈立生说。

作者: Edison 时间: 2006-9-12 11:45
这里相差的是~40%。

作者: NONO 时间: 2006-9-12 12:14
弱弱的問一下各位DX
在遊戲中是強調CPU的浮点還是整數???
如果是浮點，那照理說A64在遊戲中並不會几乎完敗Conroe吧
還是說以K8的架構要多way才能体現出浮點的优勢??:unsure:

作者: goodayoo 时间: 2006-9-12 12:23
玩游戏Athlon比P4好太多了，这个不用多说，但扣肉的构架不错，所以比较有潜力，等待K8L来拯救AMD了。

作者: NONO 时间: 2006-9-12 12:40

原帖由 goodayoo 于 2006-9-12 12:23 发表
玩游戏Athlon比P4好太多了，这个不用多说，但扣肉的构架不错，所以比较有潜力，等待K8L来拯救AMD了。

扣肉還有潛力??
倒是聽到另一種說法是扣肉架構己經快被压榨到極限:unsure:

作者: AFXIF 时间: 2006-9-12 12:54
扣肉的整数成绩基本上把啥CPU都杀了……
CINT2000跑3000分呀！

作者: hbdavidlee 时间: 2006-9-12 13:18

原帖由 NONO 于 2006-9-12 12:40 发表

扣肉還有潛力??
倒是聽到另一種說法是扣肉架構己經快被压榨到極限:unsure:

扣肉的架构并不是已经到极限，而是intel给扣肉分配的浮点线程很少，毕竟intel大部分的目标客户还是商业用户，整数运算强大更能讨好客户，K8L的架构相对K8也不见得是全新的，个人觉得没什么好指望

作者: roadrunner 时间: 2006-9-12 13:20
扣肉浮点比K8只好不差，差距还是在内存带宽，Intel服务器系统的老弱点

作者: xhxsoft 时间: 2006-9-12 13:22
期待amd的妙杀扣肉的产品

作者: 汉尼拔 时间: 2006-9-12 13:28
提示: 作者被禁止或删除内容自动屏蔽

作者: itany 时间: 2006-9-12 22:43

原帖由 xhxsoft 于 2006-9-12 10:26 发表
妙杀Woodcrest 垃圾

看到一个测试就欢欣鼓舞，还不知道优化是不是有效呢
当年显卡优化风波还教训不够深么？

作者: AFXIF 时间: 2006-9-12 23:41
这个评测不优化也胜11%，不过这东西基本不能反映家用性能。

何必看着这个来分析要买K8或者扣肉呢……

作者: xreal 时间: 2006-9-12 23:43
:huh: 不过 solaris10强过windows server2003，这一点没什么疑问。
w00t)

作者: FENG950 时间: 2006-9-12 23:59
测试的英特尔系统是哪个公司的啊？看起来更像是超微推销自己主板而DIY的。

作者: AFXIF 时间: 2006-9-13 00:12

原帖由 FENG950 于 2006-9-12 23:59 发表
测试的英特尔系统是哪个公司的啊？看起来更像是超微推销自己主板而DIY的。

恩，2路扣肉的最高成绩似乎是这个
http://www.spec.org/osg/cpu2000/ ... 20060612-06165.html

比楼主贴的这个高一些

作者: FENG950 时间: 2006-9-13 00:24

原帖由 AFXIF 于 2006-9-13 00:12 发表

恩，2路扣肉的最高成绩似乎是这个
http://www.spec.org/osg/cpu2000/ ... 20060612-06165.html

比楼主贴的这个高一些

最高是这个？配置不怎么样嘛，内存才8G。

作者: Edison 时间: 2006-9-13 00:37
cfp2000在4 user的时候，内存占用不会超过3GB，内存容量对于这里的测试系统来说根本不是问题。

作者: Prescott 时间: 2006-9-13 09:34
Sun的这种作弊的Specfp测试根本都可以无视。Sun在这么干下去，还不如直接把计算部分都跳过，直接输出结果算了。

不如让Sun把那个作弊的代码放到Woodcrest上面跑跑看看，就一切都清楚了。

[ 本帖最后由 Prescott 于 2006-9-13 09:39 编辑 ]

作者: roadrunner 时间: 2006-9-13 10:14
有证据吗?

SUN的测试即使是BASE成绩都很优秀. 你是否认为SUN的编译器并非通过编译开关激活作弊状态?

你能说一下SUN编译器如何判断需要激活作弊状态呢? 文件名比较还是源代码匹配?

又或者你能否列出一个国外论坛关于SUN编译器作弊的讨论的URL?

作者: roadrunner 时间: 2006-9-13 10:16
SUN的编译器在单U成绩下并不突出, 如果是作弊, 为什么单U不能把WOODCREST打得落花流水?

我觉得成绩提升来自对NUMA更有效的利用.

WOODCREST系统的内存带宽多少? 喂得饱4个单核SPECFP2000得分在2500以上的核心吗?

作者: Edison 时间: 2006-9-13 10:17
Intel的编译器还弄厂商识别呢。

作者: popwangyuII 时间: 2006-9-13 10:23
标题: 回复 #3 hbdavidlee 的帖子
卡吧的问题无非还是线程优先级的问题,把他的优先级降低,K8和P4HT差不多.说P4的指令性能比K8好,那倒不至于,指令性能好不好,游戏一测就知道.

不过楼主这个帖子倒是

作者: locksmith 时间: 2006-9-13 10:32
如果没有作弊的话，sun编译器的这个patch真的很厉害，比较下面两个链接：
http://www.spec.org/osg/cpu2000/ ... 20051114-05067.html
http://www.spec.org/osg/cpu2000/ ... 20060815-06997.html
软硬件配置基本相同，但是这个patch硬是把成绩提高了40%。:funk:
这是单U的成绩：
http://www.spec.org/osg/cpu2000/ ... 20060815-07000.html
双U+16G内存 vs 单U + 4G内存，成绩提高超过了100%

作者: AFXIF 时间: 2006-9-13 11:01
2218和285毕竟是不同的……

这测试本来就沾内存的光。

作者: roadrunner 时间: 2006-9-13 11:23
其中art一项测试，打了patch后快了11倍!

即使是base，也比没有patch的peak快了5倍多!

这的确太象作弊了, 但是作弊能把base成绩提升那么多, 也够不简单的, 但是如果是作弊的话, 要抓它证据应该很轻松吧, 比抓gpu驱动作弊简单多了, 国外应该老早有讨论才是

作者: roadrunner 时间: 2006-9-13 11:58
pathscale的成绩也不弱

http://www.spec.org/osg/cpu2000/ ... 20060721-06583.html

pathscale 2.3 CPU是2.8G, base得分87.9 peak得分96.0

也足够击败woodcrest了, 应当说Opteron在多路浮点上可以轻松击败woodcrest是没有疑问的了.

而且woodcrest得分85分的那个测试中是混用了pathscale的编译器和icc编译器, 更没有pathscale作弊使k8得利的可能了

作者: xreal 时间: 2006-9-13 12:59
:huh:
wintel组合显然在服务器上搞不过sun+amdw00t)

作者: Prescott 时间: 2006-9-13 13:09
在specfp，尤其是art子项上“优化”各大厂商都有，只不过是程度问题。“优化”过度了也就变成了作弊。

双U，4Core系统中，Woodcrest的Specfp成绩确实不是很突出，这是系统的问题。这项上面也是唯一一个Opteron没有被Woodcrest打得满地找牙的项目了。

4U，8Core系统，就不谈了，没什么可说的，只能等2008吧，2008的夏天和2006的夏天一样会值得激动。

另外SpecCPU2006已经出来了。

[ 本帖最后由 Prescott 于 2006-9-13 13:13 编辑 ]

作者: roadrunner 时间: 2006-9-13 13:14
安腾跑art还只需要13秒呢, 如果Opteron跑16秒是作弊的话, 那么安腾作弊也是没有疑问的了

作者: Prescott 时间: 2006-9-13 13:23

原帖由 roadrunner 于 2006-9-13 13:14 发表
安腾跑art还只需要13秒呢, 如果Opteron跑16秒是作弊的话, 那么安腾作弊也是没有疑问的了

你知道art是干什么的吗？怎么“优化”吗？就敢下这样的结论。

Itanium的体系结构中有些其他处理器都没有达到的指标。

作者: roadrunner 时间: 2006-9-13 13:31
specCPU 2006我觉得在fp rates方面依旧会很依赖内存带宽

比较一下P4EE 3.73G双核心和Xeon 3.8G双U的成绩

3.73P4EE: http://www.spec.org/cpu2006/resu ... 20060513-00011.html

3.8GXeon: http://www.spec.org/cpu2006/resu ... 20060513-00025.html

两者用同样的编译器, Xeon主频更高, 但是P4EE反而分数高出15%, 明显是赢在内存上. 可见spec CPU 2006 FP RATES一样是对内存带宽十分敏感, 多路Opteron依旧会有好表现

至于2008, 也实在远了点吧

作者: roadrunner 时间: 2006-9-13 13:37

原帖由 Prescott 于 2006-9-13 13:23 发表

你知道art是干什么的吗？怎么“优化”吗？就敢下这样的结论。

Itanium的体系结构中有些其他处理器都没有达到的指标。

你最好能讲得清楚为何Itanium的13秒成绩不算作弊, 而Opteron的16秒成绩为何必然是作弊, 你讲不清楚就算了, 没必要再在这扯废话.

现在很明显的情况是: 即使换用相同的编译器, WoodCrest在4核2路跑fp rates也不是Opteron的对手.

作者: Edison 时间: 2006-9-13 13:40
A64 5000+使用Intel ICC 9.1 二进制代码：
http://www.pcinlife.com/article/ ... 4158113d191_26.html

作者: Prescott 时间: 2006-9-13 16:08

原帖由 roadrunner 于 2006-9-13 13:37 发表

你最好能讲得清楚为何Itanium的13秒成绩不算作弊, 而Opteron的16秒成绩为何必然是作弊, 你讲不清楚就算了, 没必要再在这扯废话.

现在很明显的情况是: 即使换用相同的编译器, WoodCrest在4核2路跑fp rates也 ...

小同学，不懂就虚心请教。

虽然你这么不懂礼貌，我还是大人不记小人过，告诉你算了：179.art的footprint很小，6M的L3就够把所有需要的数据全部装进去。而且art访问内存的方式相当不规律，当cache比较小的时候，miss rate非常高。所以，Itanium的128个寄存器，单周期L1D，5cycle L2，加上6ML3跑得快就很正常了。

[ 本帖最后由 Prescott 于 2006-9-13 16:30 编辑 ]

作者: dennis 时间: 2006-9-13 16:35

原帖由 roadrunner 于 2006-9-13 13:14 发表
安腾跑art还只需要13秒呢, 如果Opteron跑16秒是作弊的话, 那么安腾作弊也是没有疑问的了

这样推导的结果绝对是错误的。Itanium还是有很多独得的地方，如果真的要优化Itanium2的成绩恐怕还不用13秒。

P.S 突然发现RR、Prescott重出江湖，让我想起2004年那场IA大战:lol:

[ 本帖最后由 dennis 于 2006-9-13 16:37 编辑 ]

作者: Edison 时间: 2006-9-13 16:43
这是用Itanium 1 733MHz跑的一些执行时间占用百分比，可以看出它跑art时候的data cache miss rate占用的时间相当高。

Hans的测试中缺乏这方面的细节。

作者: Edison 时间: 2006-9-13 16:48
几个架构使用一个简单数据布局优化获得的效果比较：

作者: graphiccard 时间: 2006-10-1 14:51

原帖由 NONO 于 2006-9-12 12:14 发表
弱弱的問一下各位DX
在遊戲中是強調CPU的浮点還是整數???
如果是浮點，那照理說A64在遊戲中並不會几乎完敗Conroe吧
還是說以K8的架構要多way才能体現出浮點的优勢??:unsure:

浮点分两种,一种是SIMD的浮点,另一种是X87浮点

P4```不说其深流水线的问题，就算不是这个问题,他的X87浮点也很明显是弱化了的!比起K8来说有一定差距!弱化X87是业界制定的标准与目标,未来完成形态的64bitCPU是不需要什么硬件协助处理器的!未来一条SIMD足以代替,N个X87的效能,相对起来~X87这种东西又占地方又多消耗成本```是属于该蜕化腐朽玩意!

不过如今不是又有个问题!听高人侃过,说SSE2浮点在如今游戏中,还没有谁对其做针对优化也不容易做到全局优化,如今游戏都还是主要靠X87浮点,所以````P4比K8差是很正常的!

欢迎光临 POPPUR爱换 (https://we.poppur.com/)