POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
123
返回列表 发新帖
楼主: Edison
打印 上一主题 下一主题

不用等到07年年中,现在最快的Woodcrest在浮点上已经被2.6GHz Opteron打死了

[复制链接]
41#
发表于 2006-9-13 13:14 | 只看该作者
安腾跑art还只需要13秒呢, 如果Opteron跑16秒是作弊的话, 那么安腾作弊也是没有疑问的了
回复 支持 反对

使用道具 举报

42#
发表于 2006-9-13 13:23 | 只看该作者
原帖由 roadrunner 于 2006-9-13 13:14 发表
安腾跑art还只需要13秒呢, 如果Opteron跑16秒是作弊的话, 那么安腾作弊也是没有疑问的了

你知道art是干什么的吗?怎么“优化”吗?就敢下这样的结论。

Itanium的体系结构中有些其他处理器都没有达到的指标。
回复 支持 反对

使用道具 举报

43#
发表于 2006-9-13 13:31 | 只看该作者
specCPU 2006我觉得在fp rates方面依旧会很依赖内存带宽

比较一下P4EE 3.73G双核心和Xeon 3.8G双U的成绩

3.73P4EE: http://www.spec.org/cpu2006/resu ... 20060513-00011.html

3.8GXeon: http://www.spec.org/cpu2006/resu ... 20060513-00025.html

两者用同样的编译器, Xeon主频更高, 但是P4EE反而分数高出15%, 明显是赢在内存上. 可见spec CPU 2006 FP RATES一样是对内存带宽十分敏感, 多路Opteron依旧会有好表现

至于2008, 也实在远了点吧
回复 支持 反对

使用道具 举报

44#
发表于 2006-9-13 13:37 | 只看该作者
原帖由 Prescott 于 2006-9-13 13:23 发表

你知道art是干什么的吗?怎么“优化”吗?就敢下这样的结论。

Itanium的体系结构中有些其他处理器都没有达到的指标。


你最好能讲得清楚为何Itanium的13秒成绩不算作弊, 而Opteron的16秒成绩为何必然是作弊, 你讲不清楚就算了, 没必要再在这扯废话.

现在很明显的情况是: 即使换用相同的编译器, WoodCrest在4核2路跑fp rates也不是Opteron的对手.
回复 支持 反对

使用道具 举报

45#
 楼主| 发表于 2006-9-13 13:40 | 只看该作者
A64 5000+使用Intel ICC 9.1 二进制代码:
http://www.pcinlife.com/article/ ... 4158113d191_26.html
回复 支持 反对

使用道具 举报

46#
发表于 2006-9-13 16:08 | 只看该作者
原帖由 roadrunner 于 2006-9-13 13:37 发表


你最好能讲得清楚为何Itanium的13秒成绩不算作弊, 而Opteron的16秒成绩为何必然是作弊, 你讲不清楚就算了, 没必要再在这扯废话.

现在很明显的情况是: 即使换用相同的编译器, WoodCrest在4核2路跑fp rates也 ...


小同学,不懂就虚心请教。

虽然你这么不懂礼貌,我还是大人不记小人过,告诉你算了:179.art的footprint很小,6M的L3就够把所有需要的数据全部装进去。而且art访问内存的方式相当不规律,当cache比较小的时候,miss rate非常高。所以,Itanium的128个寄存器,单周期L1D,5cycle L2,加上6ML3跑得快就很正常了。

[ 本帖最后由 Prescott 于 2006-9-13 16:30 编辑 ]
回复 支持 反对

使用道具 举报

47#
发表于 2006-9-13 16:35 | 只看该作者
原帖由 roadrunner 于 2006-9-13 13:14 发表
安腾跑art还只需要13秒呢, 如果Opteron跑16秒是作弊的话, 那么安腾作弊也是没有疑问的了



这样推导的结果绝对是错误的。Itanium还是有很多独得的地方,如果真的要优化Itanium2的成绩恐怕还不用13秒。

P.S 突然发现RR、Prescott重出江湖,让我想起2004年那场IA大战:lol:

[ 本帖最后由 dennis 于 2006-9-13 16:37 编辑 ]
回复 支持 反对

使用道具 举报

48#
 楼主| 发表于 2006-9-13 16:43 | 只看该作者
这是用Itanium 1 733MHz跑的一些执行时间占用百分比,可以看出它跑art时候的data cache miss rate占用的时间相当高。

Hans的测试中缺乏这方面的细节。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

49#
 楼主| 发表于 2006-9-13 16:48 | 只看该作者
几个架构使用一个简单数据布局优化获得的效果比较:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

50#
发表于 2006-10-1 14:51 | 只看该作者
原帖由 NONO 于 2006-9-12 12:14 发表
弱弱的問一下各位DX
在遊戲中是強調CPU的浮点還是整數???
如果是浮點,那照理說A64在遊戲中並不會几乎完敗Conroe吧
還是說以K8的架構要多way才能体現出浮點的优勢??:unsure:



浮点分两种,一种是SIMD的浮点,另一种是X87浮点

P4```不说其深流水线的问题,就算不是这个问题,他的X87浮点也很明显是弱化了的!比起K8来说有一定差距!弱化X87是业界制定的标准与目标,未来完成形态的64bitCPU是不需要什么硬件协助处理器的!未来一条SIMD足以代替,N个X87的效能,相对起来~X87这种东西又占地方又多消耗成本```是属于该蜕化腐朽玩意!

不过如今不是又有个问题!听高人侃过,说SSE2浮点在如今游戏中,还没有谁对其做针对优化也不容易做到全局优化,如今游戏都还是主要靠X87浮点,所以````P4比K8差是很正常的!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-12-28 16:53

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表