POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: hopetoknow2
打印 上一主题 下一主题

AMD处理器的体系架构技术方面不行

[复制链接]
41#
 楼主| 发表于 2006-8-29 22:08 | 只看该作者
原帖由 RacingPHT 于 2006-8-29 21:52 发表


动作很快嘛.
mfencelfencesfence是一个指令, 作用和内存屏障完全是两回事. 这个指令大致是在乱序指令流中强制flush一下而已.

内存屏障在我的辞典中是memory barrier.

话说回来, 如果你写一篇详细的体 ...

测试已经不少了, 几种双核的加速比,并没有质的区别。 cinebench是有效支持双核的测试, PD和X2以及yonah还有core2,双核加速比都在1.8x左右。

你似乎真的, 走偏了路。 看些 和性能之间的关系,属于末位的东西。

我就怕你说不来, 哪个应用可以显示出,明显的双核加速比区别来。

[ 本帖最后由 hopetoknow2 于 2006-8-29 22:26 编辑 ]
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
42#
发表于 2006-8-29 22:24 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

43#
 楼主| 发表于 2006-8-29 22:34 | 只看该作者
原帖由 RacingPHT 于 2006-8-29 22:24 发表
x86不同实现没有太大区别也不奇怪。

前面原来提及Alpha, PPC这样的系统, 我还是希望讨论有所收获。很多问题我要了解还很困难。
实话说, 只是试探一下.

说到头, 为今后十年着想, 如果需要高性能软件, 已经不 ...

你根本就没和当前微体系架构中的关键性能部分,搭上钩。

现在SMP双核本质性能问题是什么? 并不是多处理器之间的正确同步,而是各个核是否足够强。
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
44#
发表于 2006-8-29 22:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

45#
 楼主| 发表于 2006-8-29 23:00 | 只看该作者
原帖由 RacingPHT 于 2006-8-29 22:46 发表


你说得没有错. 也没有指出我的错误.
我认为单个处理核心的主要问题是受制于内存(包括reg)的相依性而不能象GPU那样轻松伸缩运算单元
多个处理核心的问题则主要在于软件的任务分解. 至于我关心mb, 只是因为 ...

呵呵,是吗?
你也许不知道, 3DMark中的,软件模式测试, 就是CPU做了GPU的活, 结果是P4直杀的A64,无处藏身。
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
46#
发表于 2006-8-29 23:12 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

47#
 楼主| 发表于 2006-8-29 23:21 | 只看该作者
原帖由 RacingPHT 于 2006-8-29 23:12 发表


P4的运算资源本来就比A64多, 如果A64在这种测试中赢了, 我就奇怪了。我自己就写过P4比同频K8还快的程序.

问题是P4和GPU比怎样呢? 在这种测试中赢了, 我不觉得有什么意义. 因为有些事情本来就是应该由CPU做 ...

呵呵,你现在谈的Load/Store相关性, 和前面说的多处理器正确同步,就不是同一回事啦。
这in fly的Load/Store指令相关性的处理,是属于核心区了。

A64,P3,Core2,Alpha21264还有POWER5他们是怎么处理的?
回复 支持 反对

使用道具 举报

48#
 楼主| 发表于 2006-8-29 23:24 | 只看该作者
A64和P3 都是必须等到所有老操作的地址都计算出来ready了,做地址比较后,然后确定是否存在相关性。 如果有老操作的地址还没有出来, 那只能干等了。

core2要激进了, 不干等, 只要预测为无相关性直接就先执行了。 (因为有预测器预测着呢)

POWER5不搞预测的, 就是和那些已经地址ready的老操作,做地址对比,如果有的老操作的地址还没有出来, 那不管,就当不相关了。 若没有发现相关, 就先执行再说了。

Alpha有简单的预测机制, 成为Store waiting Table。一开始一律都当成不相关了, 先执行再说了。如果实际是相关的,那么Store waiting Table会记录, 下次再执行这条指令时,都当成有相关性。这个"黑"记录要16K个cycle后才解除。

[ 本帖最后由 hopetoknow2 于 2006-8-29 23:46 编辑 ]
回复 支持 反对

使用道具 举报

49#
发表于 2006-8-30 00:31 | 只看该作者
太高深了,基本,不,应该是完全看不懂
回复 支持 反对

使用道具 举报

50#
发表于 2006-8-30 11:07 | 只看该作者
讨论下为什么Celeron的性能比Pentium 4 差那么多吧。
回复 支持 反对

使用道具 举报

51#
 楼主| 发表于 2006-8-30 11:09 | 只看该作者
原帖由 rfder 于 2006-8-30 11:07 发表
讨论下为什么Celeron的性能比Pentium 4 差那么多吧。

讨论下为什么A64的性能比Core2差那么多吧
回复 支持 反对

使用道具 举报

52#
 楼主| 发表于 2006-8-30 11:37 | 只看该作者
让我来先让你兴奋兴奋, Core2的整数是最厉害的

但是Core2只有3个ALU,2个AGU(一个AGU只能计算Load的地址、另一个只能计算Store的地址)

而A64有3个ALU,3个AGU(每个AGU均可计算Load或Store地址)。

为啥A64被打的大吐血。

SPECint2000 K8 2.6G 最高为1854,
E6700却高达2842, 领先53%多
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
53#
发表于 2006-8-30 11:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

54#
 楼主| 发表于 2006-8-30 12:00 | 只看该作者
原帖由 RacingPHT 于 2006-8-30 11:46 发表


你研究过int2000的代码么

CPU2006来了, AMD更跟不上时代了

CPU2006的base基准测试不准FDO优化了, 因而base基准的参考性大为增强

浮点测试SPECfp_base2006

3.73 GHz, 32位下,PentiumEE 965成绩高达12.7
http://www.spec.org/cpu2006/resu ... 20060513-00041.html
而3G的K8才12.7,还是64位下的成绩   (Pathscale2.4), 太差了
http://www.spec.org/cpu2006/resu ... 20060513-00023.html

仅需24%的主频优势,就拿下K8了

按这个势头,长远看,PD9xx比X2要有前途。
回复 支持 反对

使用道具 举报

55#
 楼主| 发表于 2006-8-30 12:09 | 只看该作者
原帖由 RacingPHT 于 2006-8-30 11:46 发表


你研究过int2000的代码么

Specint2000是给多种通用CPU使用的, 是不准通过修改源代码来优化的。
而不是专门给Intel的处理器使用优化的。

几乎所有历史上的高性能通用CPU, 都要去测试。

给你身边举例,gcc的代码:Specint中还有编译器gcc的源码, 2.6G的K8在gcc项才1933,而E6600确高达3096,领先60%之多。
回复 支持 反对

使用道具 举报

56#
发表于 2006-8-30 12:09 | 只看该作者
:whistling:
intel本来就比amd有实力,amd赚小钱, intel赚大钱。这个情况很难改观。
回复 支持 反对

使用道具 举报

57#
发表于 2006-8-31 10:35 | 只看该作者
原帖由 hopetoknow2 于 2006-8-30 11:09 发表

讨论下为什么A64的性能比Core2差那么多吧


好啊,详细谈谈吧。找个小板凳坐下。
回复 支持 反对

使用道具 举报

头像被屏蔽
58#
发表于 2006-9-12 15:32 | 只看该作者
我觉得
产能和技术储备
Intel无疑是领先的
但是,技术方向的领导上,无疑走了歪路
先是RD对DDR的失败,是失败,完败,不是失误
后来又是P4在一味的提高频率和保持价格上的失误
现在,core虽然带来了当前的优势,
但是,我仍然坚信,价格是唯一翘动目前市场竞争天平的重量级砝码
因为,就目前而言,core的优越还仅仅体现在无尽的pai上面
就一般应用而言,价格体系才是真正的竞争力
完毕
回复 支持 反对

使用道具 举报

59#
发表于 2006-10-7 20:42 | 只看该作者
听HOPE大虾发言获益匪浅啊:p :p :p
小弟顶啦。不知道pOWER 5和Cell跑成什么烂样w00t) w00t) ??
小弟认为现在计算资源不是问题,构造大量计算单元没难度,但提高计算效率就难了,谁做的好,谁的性能就强,原来是k8现在终于到INTEL了:wub: :wub:

[ 本帖最后由 complexmind 于 2006-10-7 20:47 编辑 ]
回复 支持 反对

使用道具 举报

60#
发表于 2006-10-24 22:13 | 只看该作者
新技术不如完善的系统工程
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-5-11 02:29

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表