POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: gtx5
打印 上一主题 下一主题

AMD肝胆俱裂: Haswell性能首曝,同频率下大幅领先IvB

[复制链接]
81#
发表于 2013-1-31 00:20 | 只看该作者
本帖最后由 itany 于 2013-1-31 00:21 编辑
the_god_of_pig 发表于 2013-1-30 23:48
瞎猜把指令分开很费资源吧,目测堪比OoO的消耗量,实际性能上还有各种损失,各方面都不如堆核划算

循环充其量执行两圈就能放进热管线里边了。
第一圈记录IPC,检查循环体长度,检查是不是有不适合的指令;第二圈启动优化器,往追踪缓存里边填微操作。之后摘下寄存器物理文件挂在热管线上,冷管线就不用管了,扔给热管线去执行就好了。
在超线程的帮助下,热管线忙着的时候,冷管线还能执行其他线程。
回复 支持 反对

使用道具 举报

82#
发表于 2013-1-31 00:22 | 只看该作者
itany 发表于 2013-1-31 00:04
鹦鹉的结构并不复杂,甚至更简单。在现在管芯面积可以富裕的情况下完全可以应用。
现在的主要矛盾就是, ...

嗯?我记着鹦鹉是靠不同管线对其对应的指令进行针对性优化来提高执行效率的吧?本质不是为了解决加宽前端的代价问题,而是为了在宽度一定的情况下提高实际性能可以达到的效率?

貌似记着是这样,我是被科普水平,不太清楚~
回复 支持 反对

使用道具 举报

83#
发表于 2013-1-31 00:29 | 只看该作者
itany 发表于 2013-1-31 00:15
摩尔定律至少还能撑10年,没准是20年

现在最主要的问题还是,Intel搞统一架构,除了Atom,从平板到服务 ...

在往高端就剩个power了,不过拿Core对付着也还可以,Intel是不会再去搞针锋相对的超高端架构了,虽然安腾一直闲呆在那儿
回复 支持 反对

使用道具 举报

84#
发表于 2013-1-31 00:31 | 只看该作者
本帖最后由 itany 于 2013-1-31 00:32 编辑
the_god_of_pig 发表于 2013-1-31 00:22
嗯?我记着鹦鹉是靠不同管线对其对应的指令进行针对性优化来提高执行效率的吧?本质不是为了解决加宽前端 ...


追踪缓存(Tracing Cache)能且只能在循环的时候起作用么,而且这时候完全能甩掉前端么。
当年P4怎么只用一个解码器就实现3发射的?

其实就是Intel三个微架构,Core、Netburst、Itanium各取所长合并在一起
所谓按照指令,显然没法把一个线程从中间拆开让不同的指令进不同的管线么。
回复 支持 反对

使用道具 举报

85#
发表于 2013-1-31 00:53 | 只看该作者
itany 发表于 2013-1-31 00:31
追踪缓存(Tracing Cache)能且只能在循环的时候起作用么,而且这时候完全能甩掉前端么。
当年P4怎么只 ...

貌似指令被分为冷/热的判别条件并不是看IPC,而且这个判别也是要消耗代价未知的资源的

鹦鹉的主要思路是把代码分为两类,分别进入针对各自特点优化的管线从而提高效率,这个并不是说要把指令拆开,依然是要么走冷管线要么走热管线,只是因为指令总能被更高效的流水线执行(相对于常规架构)所以能大大提高执行效率,代价是分析指令的开销,对提高宽度可能帮助不大(其实鹦鹉提高管线效率也能有利于加宽~,好吧我错乱了)
回复 支持 反对

使用道具 举报

86#
发表于 2013-1-31 11:58 | 只看该作者
the_god_of_pig 发表于 2013-1-31 00:53
貌似指令被分为冷/热的判别条件并不是看IPC,而且这个判别也是要消耗代价未知的资源的

鹦鹉的主要思路 ...

关键是您说的代码分为两类是怎么一个分发?
回复 支持 反对

使用道具 举报

87#
发表于 2013-1-31 12:14 | 只看该作者
2550k小超到4.8G,感觉还行还行哈
回复 支持 反对

使用道具 举报

88#
发表于 2013-1-31 13:02 | 只看该作者
本帖最后由 the_god_of_pig 于 2013-1-31 13:03 编辑
itany 发表于 2013-1-31 11:58
关键是您说的代码分为两类是怎么一个分发?

额,不清楚,N久以前在科普读物上看的,大概说的就是我说的那个意思,也可能作者本身就不懂~
回复 支持 反对

使用道具 举报

89#
发表于 2013-1-31 14:07 | 只看该作者
看来ivb还能挺到下下代再升级
回复 支持 反对

使用道具 举报

90#
发表于 2013-1-31 17:26 | 只看该作者
回复 支持 反对

使用道具 举报

91#
发表于 2013-1-31 18:28 | 只看该作者
P4时代看到过parrot的介绍,冷热管线概念引人眼球,据说后来的conroe也用到了parrot的部分技术,具体就不得而知了。
回复 支持 反对

使用道具 举报

92#
发表于 2013-1-31 18:28 | 只看该作者
本帖最后由 发动机 于 2013-1-31 18:45 编辑

那篇文章中提到了应用80/20法则,将占程序指令80%的常用指令由“热”管线执行,剩下的20%指令由“冷”管线处理。这样看来确实比将所有指令一视同仁先进,就是不知道这个“80%”的常用指令是怎么统计出来的,在单线程时代的统计结果是否适合多线程?
回复 支持 反对

使用道具 举报

93#
发表于 2013-1-31 18:37 来自手机 | 只看该作者
作图水平实在是高。
回复 支持 反对

使用道具 举报

94#
发表于 2013-1-31 19:02 | 只看该作者
据说SPEC2006下 性能提升有15%
回复 支持 反对

使用道具 举报

95#
发表于 2013-1-31 19:11 | 只看该作者
PRAM 发表于 2013-1-31 19:02
据说SPEC2006下 性能提升有15%

单线程么?
SPEC的话相当于还是重新编译了,老程序能有多大提升还很难说
回复 支持 反对

使用道具 举报

96#
发表于 2013-1-31 19:17 | 只看该作者
the_god_of_pig 发表于 2013-1-31 19:11
单线程么?
SPEC的话相当于还是重新编译了,老程序能有多大提升还很难说

单线程 多线程估计比这个大
回复 支持 反对

使用道具 举报

97#
 楼主| 发表于 2013-1-31 19:19 | 只看该作者
PRAM 发表于 2013-1-31 19:17
单线程 多线程估计比这个大

单线程15%
多线程不敢想啊
回复 支持 反对

使用道具 举报

98#
 楼主| 发表于 2013-1-31 19:19 | 只看该作者
PRAM 发表于 2013-1-31 19:17
单线程 多线程估计比这个大

单线程15%
多线程不敢想啊
回复 支持 反对

使用道具 举报

99#
发表于 2013-1-31 19:32 | 只看该作者
PRAM 发表于 2013-1-31 19:17
单线程 多线程估计比这个大

15%要是出来后真能达到还是很牛的
回复 支持 反对

使用道具 举报

100#
发表于 2013-1-31 19:37 | 只看该作者
PRAM 发表于 2013-1-31 19:02
据说SPEC2006下 性能提升有15%

如果单线程15%,肯定是之前啥瓶颈了
要么就是之前的两个l/s端口瓶颈了,第三个端口起了作用
要么就是分支大改了
要么就是内存延迟缩短了……
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-6 18:34

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表