POPPUR爱换

标题: AMD肝胆俱裂: Haswell性能首曝,同频率下大幅领先IvB [打印本页]

作者: gtx5    时间: 2013-1-30 13:08
标题: AMD肝胆俱裂: Haswell性能首曝,同频率下大幅领先IvB
测试的是一款B0步进的Haswell处理器,频率2.8GHz,对比的则是同样降频到2.8GHz的Core  i7-3770K。


[attach]2162358[/attach]

[attach]2162359[/attach]

[attach]2162360[/attach]


有可能是因为主板BIOS的问题,反正随便就能找个理由解释了,毕竟是测试版。


作者: NETCARMEN    时间: 2013-1-30 13:10
这幅度……再等等吧
作者: Tempestglen    时间: 2013-1-30 13:19
提示: 作者被禁止或删除 内容自动屏蔽
作者: qqisqq    时间: 2013-1-30 13:19
作图水平真高。
作者: xm-2000    时间: 2013-1-30 13:24
主要是给领导看!
作者: qwased    时间: 2013-1-30 13:27
Edison爆尿说haswell会非常好超
作者: moonfacesdo    时间: 2013-1-30 13:31
好‘大’的幅度
作者: amd```fans    时间: 2013-1-30 13:39
楼主是典型的I黑
作者: itany    时间: 2013-1-30 13:41
无非就是跑跑PI罢了
如果PI顶用赛扬就去杀AMD全家了
作者: the_god_of_pig    时间: 2013-1-30 13:45
LZ笑得好开心哦
作者: 为爱琳    时间: 2013-1-30 13:48
本帖最后由 为爱琳 于 2013-1-30 13:50 编辑

13秒也太慢了吧
作者: gtx5    时间: 2013-1-30 13:50
为爱琳 发表于 2013-1-30 13:48
13秒也太慢了吧

不慢已经秒AMD全家了
作者: 为爱琳    时间: 2013-1-30 13:51
本帖最后由 为爱琳 于 2013-1-30 13:55 编辑
[attach]2162420[/attach]gtx5 发表于 2013-1-30 13:50
不慢已经秒AMD全家了


我说 是谁被秒看清楚这个速度只能跟速龙X4
羿龙2 X4玩了

作者: f0f0f0    时间: 2013-1-30 13:52
你以为是推土机再世么
作者: 很闹心    时间: 2013-1-30 13:56
amd```fans 发表于 2013-1-30 13:39
楼主是典型的I黑[rolleyes>

明显是典型的非A即黑,只要是AMD的竞争对手都黑,IN都一样
作者: f0f0f0    时间: 2013-1-30 14:01
  1. 有可能是因为主板BIOS的问题,反正随便就能找个理由解释了,毕竟是测试版。
复制代码
也是,反正随便找个理由就能开黑了

作者: itany    时间: 2013-1-30 14:02
本帖最后由 itany 于 2013-1-30 14:04 编辑
为爱琳 发表于 2013-1-30 13:51
我说 是谁被秒看清楚这个速度只能跟速龙X4
羿龙2 X4玩了

看清楚是降频的,没准是单通道



作者: amd```fans    时间: 2013-1-30 14:03
很闹心 发表于 2013-1-30 13:56
明显是典型的非A即黑,只要是AMD的竞争对手都黑,IN都一样

兄台所言极是
作者: 为爱琳    时间: 2013-1-30 14:05
itany 发表于 2013-1-30 14:02
看清楚是降频的,没准是单通道

加上酷频都3.7还不是跟X6一样
作者: amd```fans    时间: 2013-1-30 14:06
为爱琳 发表于 2013-1-30 13:51
我说 是谁被秒看清楚这个速度只能跟速龙X4
羿龙2 X4玩了

你把转贴机的部署全搞乱了,x一样的队友哇
作者: the_god_of_pig    时间: 2013-1-30 14:07
这某人又高潮个什么劲儿,没看见同频比3770k强吗?3770k的性能都清楚吧
作者: itany    时间: 2013-1-30 14:07
本帖最后由 itany 于 2013-1-30 14:14 编辑
为爱琳 发表于 2013-1-30 14:05
加上酷频都3.7还不是跟X6一样

那是啊,Intel一个核心杀你一个半,这还是最不拿手的wPrime
不能一个杀两个,就算Intel没给力


另外你家x6把你家大打桩机干的死去活来,你们大AMD真有前途:


作者: itany    时间: 2013-1-30 14:11
the_god_of_pig 发表于 2013-1-30 14:07
这某人又高潮个什么劲儿,没看见同频比3770k强吗?3770k的性能都清楚吧

可怜的Pro-A从来都不知道先去看看自家压路机的性能就跳出来自取其辱了
作者: 为爱琳    时间: 2013-1-30 14:11
本帖最后由 为爱琳 于 2013-1-30 14:17 编辑
[attach]2162437[/attach]itany 发表于 2013-1-30 14:07
那是啊,Intel一个核心杀你一个半,这还是最不拿手的wPrime
不能一个杀两个,就算Intel没给力


切 拿个阉割浮点还计算单元小一个的U来说事
我服死了呢,这个wPrime
软件测试什么 你不会不知道吧[attach]2162436[/attach]
推土机阉割的东西 想快都难
这个就是X6  6个浮点跟四个浮点的区别
还要我说  无语
x6现在连FX6300都赢不了 压谁啊
作者: itany    时间: 2013-1-30 14:18
为爱琳 发表于 2013-1-30 14:11
切 拿个阉割浮点还计算单元小一个的U来说事
我服死了呢,这个wPrime
软件测试什么 你不会不知道吧

没有二货压缩软件用浮点算法的
显然这是SSE整数性能,而且是偏重于Load/Store

So, 能说明什么问题么?
有多少用户是经常用zip压缩文件的? 搞笑

作者: the_god_of_pig    时间: 2013-1-30 14:22
为爱琳 发表于 2013-1-30 14:11
切 拿个阉割浮点还计算单元小一个的U来说事
我服死了呢,这个wPrime
软件测试什么 你不会不知道吧

只是共享浮点单元而已,大可以把它的浮点单元当成一人一半嘛,这样就相当于两个k10核心,还是死


另外某网站的GCC编译的娱乐套件就不要拿出来了,就没准过,虽然你贴的这张图上的项目还算正常

作者: nfs14    时间: 2013-1-30 14:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: gtx5    时间: 2013-1-30 14:33
nfs14 发表于 2013-1-30 14:32
Haswell 默认电压稳超 5G。 你们等着吧。

太可怕了
作者: 小美哦    时间: 2013-1-30 14:35
本帖最后由 小美哦 于 2013-1-30 14:35 编辑
qwased 发表于 2013-1-30 13:27
Edison爆尿说haswell会非常好超

你难道忘了热量散不出吗?
作者: 小美哦    时间: 2013-1-30 14:37
nfs14 发表于 2013-1-30 14:32
Haswell 默认电压稳超 5G。

你们等着吧。

你难道忘了热量散不出吗?
作者: qwased    时间: 2013-1-30 14:40
小美哦 发表于 2013-1-30 14:35
你难道忘了热量散不出吗?

拭目以待
其实我还挺想趁着haswell换本子的
作者: sheipashei    时间: 2013-1-30 14:44
本帖最后由 sheipashei 于 2013-1-30 14:47 编辑

haswell的看点是性能和功耗的进一步平衡和不断增强的集显性能还有新指令集和新转码单元,也是下一代surface 2想要成功的唯一推力。就是在笔记本和平板上会逆天。haswell是微软的一根救命稻草。
作者: cenxuebin    时间: 2013-1-30 14:48
sheipashei 发表于 2013-1-30 14:44
haswell的看点是性能和功耗的进一步平衡和不断增强的集显性能还有新指令集和新转码单元,也是下一代surface ...

4770k功耗比3770k还高啊。。。
作者: lzjery    时间: 2013-1-30 14:56
CPU性能进步不明显,不要紧
消息证明了Intel在Haswell的核芯显卡中下了不小的功夫
不管你信不信,Haswell都将在功耗上超越前作
敬请期待


作者: acqwer    时间: 2013-1-30 15:01
本帖最后由 acqwer 于 2013-1-30 15:01 编辑
itany 发表于 2013-1-30 14:07
那是啊,Intel一个核心杀你一个半,这还是最不拿手的wPrime
不能一个杀两个,就算Intel没给力


wPrime推土机明明干的过X6



作者: itany    时间: 2013-1-30 15:07
acqwer 发表于 2013-1-30 15:01
wPrime推土机明明干的过X6

唉,算了,我不应该找无节操的国内成绩的
作者: Cherbim    时间: 2013-1-30 15:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: kinno    时间: 2013-1-30 15:32
黑的漂亮
作者: PRAM    时间: 2013-1-30 15:40
我听说单线程同频性能提高15%
作者: cenxuebin    时间: 2013-1-30 15:50
PRAM 发表于 2013-1-30 15:40
我听说单线程同频性能提高15%

我听说是30%
作者: kakaku.bj.cn    时间: 2013-1-30 15:51
本帖最后由 kakaku.bj.cn 于 2013-1-30 15:52 编辑
PRAM 发表于 2013-1-30 15:40
我听说单线程同频性能提高15%

这个真心悬,初期能过5%就谢天谢地了
作者: Tempestglen    时间: 2013-1-30 16:53
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2013-1-30 16:55
Tempestglen 发表于 2013-1-30 16:53
arm笑了,haswell是在等A57吗?

Atom还没等到A57呢
请问A57是打算和Haswell比功耗吧
作者: the_god_of_pig    时间: 2013-1-30 16:56
Tempestglen 发表于 2013-1-30 16:53
arm笑了,haswell是在等A57吗?

连atom都赢不了的烂货就不要刷存在感了

作者: G70    时间: 2013-1-30 16:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: PRAM    时间: 2013-1-30 16:59
S性能比57会高一些 幅度不是很大 不过57面对的应该不是S了
作者: Tempestglen    时间: 2013-1-30 17:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: seslove    时间: 2013-1-30 17:04
itany 发表于 2013-1-30 16:55
Atom还没等到A57呢
请问A57是打算和Haswell比功耗吧

绝对是价格
作者: raini    时间: 2013-1-30 17:09
Tempestglen 发表于 2013-1-30 17:02
四核A15 vs 双核ivb 的好戏即将开演

2014年;四核A57 vs 双核haswell更轻松了,因为i u进步幅度不如ar ...

麻痹的进步幅度不大,那也不是arm能够赶超的
脑子坏掉就赶紧去看医生!
还更轻松?你就祈祷功耗不要炸掉就不错了
作者: itany    时间: 2013-1-30 17:09
Tempestglen 发表于 2013-1-30 17:02
四核A15 vs 双核ivb 的好戏即将开演

2014年;四核A57 vs 双核haswell更轻松了,因为i u进步幅度不如ar ...

双核高频A15被800M小羊随便摁死,您还敢叫嚣啊
作者: itany    时间: 2013-1-30 17:11
Tempestglen 发表于 2013-1-30 17:02
四核A15 vs 双核ivb 的好戏即将开演

2014年;四核A57 vs 双核haswell更轻松了,因为i u进步幅度不如ar ...

Intel现在是高考700总分,每涨10分都比较困难
Arm现在是高考70总分,随便多蒙对几个选择就能上100分了
作者: Tempestglen    时间: 2013-1-30 17:47
提示: 作者被禁止或删除 内容自动屏蔽
作者: G70    时间: 2013-1-30 18:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: acqwer    时间: 2013-1-30 18:08
Tempestglen 发表于 2013-1-30 17:47
这个倒是在理,原本arm只有ivb一半 ipc,如今65%了。

那个测试ARM有同频IVB的65%?T神拿出来给大家开开眼啊
作者: itany    时间: 2013-1-30 18:39
Tempestglen 发表于 2013-1-30 17:47
这个倒是在理,原本arm只有ivb一半 ipc,如今65%了。

神啊,您这是双核A15 vs 最弱的SNB菜羊都到不了50%,差不多也就是1/3罢了
您再怎么样也不至于把SNB偷偷换成IVB吧?
作者: PRAM    时间: 2013-1-30 19:04
itany 发表于 2013-1-30 18:39
神啊,您这是双核A15 vs 最弱的SNB菜羊都到不了50%,差不多也就是1/3罢了
您再怎么样也不至于把SNB偷偷换 ...

我记得T神好像说过A9相当于COER2 50%? 可以肯定的说 单线程方面 HAS 性能是同频A57 2.5倍以上
作者: itany    时间: 2013-1-30 19:41
PRAM 发表于 2013-1-30 19:04
我记得T神好像说过A9相当于COER2 50%? 可以肯定的说 单线程方面 HAS 性能是同频A57 2.5倍以上

等A57能实测,最早也要等到明年了
作者: PRAM    时间: 2013-1-30 19:59
itany 发表于 2013-1-30 19:41
等A57能实测,最早也要等到明年了

A57有数据了  SPEC06的 算起来 差不多就是这回事
作者: itany    时间: 2013-1-30 20:13
PRAM 发表于 2013-1-30 19:59
A57有数据了  SPEC06的 算起来 差不多就是这回事

A57现在就有实物了?
不会是模拟器跑出来的吧
作者: gtx5    时间: 2013-1-30 20:21
PRAM 发表于 2013-1-30 19:59
A57有数据了  SPEC06的 算起来 差不多就是这回事

求地址
作者: Tempestglen    时间: 2013-1-30 20:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: PRAM    时间: 2013-1-30 20:45
itany 发表于 2013-1-30 20:13
A57现在就有实物了?
不会是模拟器跑出来的吧

ARM的数据应该是最理想的情况 估计实际性能还达不到 所以 HSW 性能有可能是A57的3倍 安A57的时间看面对的 应该是 BROWELL了吧
作者: itany    时间: 2013-1-30 20:45
Tempestglen 发表于 2013-1-30 20:36
在我看来ipc方面snb=ivb=haswell。

那些avx指令集,对javascript性能没啥促进吧,对平板来说,数值计算 ...

除非你认为A57=A15
作者: the_god_of_pig    时间: 2013-1-30 20:50
本帖最后由 the_god_of_pig 于 2013-1-30 20:55 编辑
Tempestglen 发表于 2013-1-30 17:47
这个倒是在理,原本arm只有ivb一半 ipc,如今65%了。

65%?  把A15堆个4打1,差不多吧

作者: the_god_of_pig    时间: 2013-1-30 20:54
Tempestglen 发表于 2013-1-30 20:36
在我看来ipc方面snb=ivb=haswell。

那些avx指令集,对javascript性能没啥促进吧,对平板来说,数值计算 ...

对于垃圾ARM平板来讲,确实也只能跑跑娱乐蜘蛛YY一下,毕竟是太监设备正经事都干不了
作者: frankincense    时间: 2013-1-30 21:53
PRAM 发表于 2013-1-30 19:04
我记得T神好像说过A9相当于COER2 50%? 可以肯定的说 单线程方面 HAS 性能是同频A57 2.5倍以上

T神是认定被开除的特瓜2有Core2桌面版的一半
作者: role17    时间: 2013-1-30 22:04
和大家之前的预计比较相符合...
作者: itany    时间: 2013-1-30 22:35
PRAM 发表于 2013-1-30 20:45
ARM的数据应该是最理想的情况 估计实际性能还达不到 所以 HSW 性能有可能是A57的3倍 安A57的时间看面对的 ...

不知道Intel在03年就发布的PARROT异构管线还能不能最终出现了~



据说当年的Conroe就是备胎,还有更厉害的正选。
因为AMD比较萎,所以就拿出备胎给AMD当头一木棒,真正的狼牙棒藏在身后。
结果没想到AMD就一直萎下去了……

作者: raini    时间: 2013-1-30 22:43
itany 发表于 2013-1-30 22:35
不知道Intel在03年就发布的PARROT异构管线还能不能最终出现了~

10年过去了!
作者: the_god_of_pig    时间: 2013-1-30 22:50
itany 发表于 2013-1-30 22:35
不知道Intel在03年就发布的PARROT异构管线还能不能最终出现了~

这个应该已经没戏了,I社现在是稳健路线
另外最近有个奇葩公司歪打正着出了个思路和这个有点点像的玩艺,虽然技术层次上低了几个数量级




作者: Tempestglen    时间: 2013-1-30 23:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2013-1-30 23:07
本帖最后由 itany 于 2013-1-30 23:08 编辑
Tempestglen 发表于 2013-1-30 23:03
奇葩公司正在统治手机平板市场,每年7亿台。包括猪神你也在用奇葩公司cpu的手机。

i棍总是质问我用什 ...

呵呵,论坛运行在x86服务器上

话说所谓的little big根本就不是这思路,你根本没有理解所谓的冷热管线是怎么运行的

作者: the_god_of_pig    时间: 2013-1-30 23:24
Tempestglen 发表于 2013-1-30 23:03
奇葩公司正在统治手机平板市场,每年7亿台。包括猪神你也在用奇葩公司cpu的手机。

i棍总是质问我用什 ...

到一边意银去,别人正说别的呢你打什么岔,不把你脑补的东西说出来就浑身不自在对吧

作者: the_god_of_pig    时间: 2013-1-30 23:35
itany 发表于 2013-1-30 23:07
呵呵,论坛运行在x86服务器上

话说所谓的little big根本就不是这思路,你根本没有理解所谓的冷热管线是 ...

鹦鹉没出现估计也是效率上得不偿失吧,构造越弄越复杂往往都是反效果。现在EPIC逐渐完蛋,OoO增加发射也代价巨大,大家都去玩堆核,甚至出现推土机拿俩核当一个"核"凑数的情况,感觉IPC提升越来越没希望
PS:ARM还是充满希望的嘛,虽然提升个40%性能功耗就翻了几翻,毕竟10瓦离100瓦还是有距离的,潜力大大地



作者: itany    时间: 2013-1-30 23:37
the_god_of_pig 发表于 2013-1-30 23:24
到一边意银去,别人正说别的呢你打什么岔,不把你脑补的东西说出来就浑身不自在对吧

我觉得完全可以搞 3宽度的前端-3宽度的冷管线,6宽度的热管线
对于手机平板上比较弱的,把热管线阉了就是了
作者: itany    时间: 2013-1-30 23:44
the_god_of_pig 发表于 2013-1-30 23:35
鹦鹉没出现估计也是效率上得不偿失吧,构造越弄越复杂往往都是反效果。现在EPIC逐渐完蛋,OoO增加发射也代 ...

堆核并不是免费的。
AMD这样搞,其实很大程度上,只见过4核心,最多是6核心的。在多AMD的交换单元就搞不定了……
现在Opteron也是,2核心共享L2缓存就减少了一半的压力,搞胶水还能再减小一半的压力。
没有Intel的环形总线,堆核心就那么容易?
即便是Intel,环形总线所占的面积和功耗,也不是免费的。

Arm可以向更多核心、更宽的管线要性能,但是同样的资源、管线,和x86相比呢?
效率低得很。
堆资源当然比较容易,但是进行精调优化就难了。
当年AMD靠堆资源能得意一时,但是过了堆资源的拐点,悲剧马上降临
现在Arm就站在当年K8到K10的拐点上,往前一步就是万丈深渊。
作者: the_god_of_pig    时间: 2013-1-30 23:48
itany 发表于 2013-1-30 23:37
我觉得完全可以搞 3宽度的前端-3宽度的冷管线,6宽度的热管线
对于手机平板上比较弱的,把热管线阉了就是 ...

瞎猜把指令分开很费资源吧,目测堪比OoO的消耗量,实际性能上还有各种损失,各方面都不如堆核划算






作者: the_god_of_pig    时间: 2013-1-30 23:55
itany 发表于 2013-1-30 23:44
堆核并不是免费的。
AMD这样搞,其实很大程度上,只见过4核心,最多是6核心的。在多AMD的交换单元就搞不 ...

这个A15已经现端倪了,4核性能增量已经损失不小,8核以上应该恶化得更严重
不过当初Conroe用FSB的时候也是很惨的,但现在还是秒飞一切了,arm怕是没那能耐


摩尔定律也挺不了几年了,"晶体管怎么用"这种奢侈的烦恼估计也快没了,这几年堆堆核、搞搞GPU也就糊弄过去了,大家都不大折腾了





作者: itany    时间: 2013-1-31 00:04
the_god_of_pig 发表于 2013-1-30 23:35
鹦鹉没出现估计也是效率上得不偿失吧,构造越弄越复杂往往都是反效果。现在EPIC逐渐完蛋,OoO增加发射也代 ...

鹦鹉的结构并不复杂,甚至更简单。在现在管芯面积可以富裕的情况下完全可以应用。
现在的主要矛盾就是,如果管线比较宽,比如说6发射,那么在大量低IPC的程序情况下资源就浪费严重;如果是比较窄,比如2发射,那么在某些能达到高IPC的情况下性能就很差。Intel通过超线程进行掩盖,效果是明显的;AMD干脆切成两半,但是在很多应用上表现的一塌糊涂,本质上还是太窄了。

要做到需要宽的时候能宽,要窄的时候能窄,只有宽窄两条异构流水线才可以。
窄流水线是全能型的,在执行的时候检测程序的循环和IPC。
当程序的进入循环,指令是宽流水线执行单元的子集,并且IPC足够高的时候,将线程迁移到宽流水线执行。
宽流水线没有前端,用追踪缓存供应微操作指令。宽流水线只要做循环分支就可以。追踪缓存里边是挂在窄流水线上优化器重排之后的微操作,宽流水线不用做重排和冲突检测,只要最简单的执行就行了,因而电路结构和功耗都可以做到最优。

窄,但复杂的冷管线+宽,但简单的热管线,就是鹦鹉的精髓。
作者: itany    时间: 2013-1-31 00:15
本帖最后由 itany 于 2013-1-31 00:16 编辑
the_god_of_pig 发表于 2013-1-30 23:55
这个A15已经现端倪了,4核性能增量已经损失不小,8核以上应该恶化得更严重
不过当初Conroe用FSB的时候也 ...

摩尔定律至少还能撑10年,没准是20年

现在最主要的问题还是,Intel搞统一架构,除了Atom,从平板到服务器、台式机都用一种架构覆盖。
在低功耗制约下,很多提高性能的手段被放弃了。

另外一方面就是现在缺乏足够的竞争压力。
Intel估计会优先搞Atom。

作者: itany    时间: 2013-1-31 00:20
本帖最后由 itany 于 2013-1-31 00:21 编辑
the_god_of_pig 发表于 2013-1-30 23:48
瞎猜把指令分开很费资源吧,目测堪比OoO的消耗量,实际性能上还有各种损失,各方面都不如堆核划算

循环充其量执行两圈就能放进热管线里边了。
第一圈记录IPC,检查循环体长度,检查是不是有不适合的指令;第二圈启动优化器,往追踪缓存里边填微操作。之后摘下寄存器物理文件挂在热管线上,冷管线就不用管了,扔给热管线去执行就好了。
在超线程的帮助下,热管线忙着的时候,冷管线还能执行其他线程。
作者: the_god_of_pig    时间: 2013-1-31 00:22
itany 发表于 2013-1-31 00:04
鹦鹉的结构并不复杂,甚至更简单。在现在管芯面积可以富裕的情况下完全可以应用。
现在的主要矛盾就是, ...

嗯?我记着鹦鹉是靠不同管线对其对应的指令进行针对性优化来提高执行效率的吧?本质不是为了解决加宽前端的代价问题,而是为了在宽度一定的情况下提高实际性能可以达到的效率?

貌似记着是这样,我是被科普水平,不太清楚~

作者: the_god_of_pig    时间: 2013-1-31 00:29
itany 发表于 2013-1-31 00:15
摩尔定律至少还能撑10年,没准是20年

现在最主要的问题还是,Intel搞统一架构,除了Atom,从平板到服务 ...

在往高端就剩个power了,不过拿Core对付着也还可以,Intel是不会再去搞针锋相对的超高端架构了,虽然安腾一直闲呆在那儿
作者: itany    时间: 2013-1-31 00:31
本帖最后由 itany 于 2013-1-31 00:32 编辑
the_god_of_pig 发表于 2013-1-31 00:22
嗯?我记着鹦鹉是靠不同管线对其对应的指令进行针对性优化来提高执行效率的吧?本质不是为了解决加宽前端 ...


追踪缓存(Tracing Cache)能且只能在循环的时候起作用么,而且这时候完全能甩掉前端么。
当年P4怎么只用一个解码器就实现3发射的?

其实就是Intel三个微架构,Core、Netburst、Itanium各取所长合并在一起
所谓按照指令,显然没法把一个线程从中间拆开让不同的指令进不同的管线么。

作者: the_god_of_pig    时间: 2013-1-31 00:53
itany 发表于 2013-1-31 00:31
追踪缓存(Tracing Cache)能且只能在循环的时候起作用么,而且这时候完全能甩掉前端么。
当年P4怎么只 ...

貌似指令被分为冷/热的判别条件并不是看IPC,而且这个判别也是要消耗代价未知的资源的

鹦鹉的主要思路是把代码分为两类,分别进入针对各自特点优化的管线从而提高效率,这个并不是说要把指令拆开,依然是要么走冷管线要么走热管线,只是因为指令总能被更高效的流水线执行(相对于常规架构)所以能大大提高执行效率,代价是分析指令的开销,对提高宽度可能帮助不大(其实鹦鹉提高管线效率也能有利于加宽~,好吧我错乱了)

作者: itany    时间: 2013-1-31 11:58
the_god_of_pig 发表于 2013-1-31 00:53
貌似指令被分为冷/热的判别条件并不是看IPC,而且这个判别也是要消耗代价未知的资源的

鹦鹉的主要思路 ...

关键是您说的代码分为两类是怎么一个分发?
作者: recruitbj    时间: 2013-1-31 12:14
2550k小超到4.8G,感觉还行还行哈
作者: the_god_of_pig    时间: 2013-1-31 13:02
本帖最后由 the_god_of_pig 于 2013-1-31 13:03 编辑
itany 发表于 2013-1-31 11:58
关键是您说的代码分为两类是怎么一个分发?

额,不清楚,N久以前在科普读物上看的,大概说的就是我说的那个意思,也可能作者本身就不懂~

作者: ifu    时间: 2013-1-31 14:07
看来ivb还能挺到下下代再升级
作者: PRAM    时间: 2013-1-31 17:26
http://we.pcinlife.com/thread-2037985-1-1.html
作者: 发动机    时间: 2013-1-31 18:28
P4时代看到过parrot的介绍,冷热管线概念引人眼球,据说后来的conroe也用到了parrot的部分技术,具体就不得而知了。
作者: 发动机    时间: 2013-1-31 18:28
本帖最后由 发动机 于 2013-1-31 18:45 编辑

那篇文章中提到了应用80/20法则,将占程序指令80%的常用指令由“热”管线执行,剩下的20%指令由“冷”管线处理。这样看来确实比将所有指令一视同仁先进,就是不知道这个“80%”的常用指令是怎么统计出来的,在单线程时代的统计结果是否适合多线程?
作者: hunzhang    时间: 2013-1-31 18:37
作图水平实在是高。
作者: PRAM    时间: 2013-1-31 19:02
据说SPEC2006下 性能提升有15%
作者: the_god_of_pig    时间: 2013-1-31 19:11
PRAM 发表于 2013-1-31 19:02
据说SPEC2006下 性能提升有15%

单线程么?
SPEC的话相当于还是重新编译了,老程序能有多大提升还很难说

作者: PRAM    时间: 2013-1-31 19:17
the_god_of_pig 发表于 2013-1-31 19:11
单线程么?
SPEC的话相当于还是重新编译了,老程序能有多大提升还很难说

单线程 多线程估计比这个大
作者: gtx5    时间: 2013-1-31 19:19
PRAM 发表于 2013-1-31 19:17
单线程 多线程估计比这个大

单线程15%
多线程不敢想啊
作者: gtx5    时间: 2013-1-31 19:19
PRAM 发表于 2013-1-31 19:17
单线程 多线程估计比这个大

单线程15%
多线程不敢想啊
作者: the_god_of_pig    时间: 2013-1-31 19:32
PRAM 发表于 2013-1-31 19:17
单线程 多线程估计比这个大

15%要是出来后真能达到还是很牛的

作者: itany    时间: 2013-1-31 19:37
PRAM 发表于 2013-1-31 19:02
据说SPEC2006下 性能提升有15%

如果单线程15%,肯定是之前啥瓶颈了
要么就是之前的两个l/s端口瓶颈了,第三个端口起了作用
要么就是分支大改了
要么就是内存延迟缩短了……




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4