POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: gtx5
打印 上一主题 下一主题

AMD肝胆俱裂: Haswell性能首曝,同频率下大幅领先IvB

[复制链接]
头像被屏蔽
61#
发表于 2013-1-30 20:36 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

62#
发表于 2013-1-30 20:45 | 只看该作者
itany 发表于 2013-1-30 20:13
A57现在就有实物了?
不会是模拟器跑出来的吧

ARM的数据应该是最理想的情况 估计实际性能还达不到 所以 HSW 性能有可能是A57的3倍 安A57的时间看面对的 应该是 BROWELL了吧
回复 支持 反对

使用道具 举报

63#
发表于 2013-1-30 20:45 | 只看该作者
Tempestglen 发表于 2013-1-30 20:36
在我看来ipc方面snb=ivb=haswell。

那些avx指令集,对javascript性能没啥促进吧,对平板来说,数值计算 ...

除非你认为A57=A15
回复 支持 反对

使用道具 举报

64#
发表于 2013-1-30 20:50 | 只看该作者
本帖最后由 the_god_of_pig 于 2013-1-30 20:55 编辑
Tempestglen 发表于 2013-1-30 17:47
这个倒是在理,原本arm只有ivb一半 ipc,如今65%了。

65%?  把A15堆个4打1,差不多吧
回复 支持 反对

使用道具 举报

65#
发表于 2013-1-30 20:54 | 只看该作者
Tempestglen 发表于 2013-1-30 20:36
在我看来ipc方面snb=ivb=haswell。

那些avx指令集,对javascript性能没啥促进吧,对平板来说,数值计算 ...

对于垃圾ARM平板来讲,确实也只能跑跑娱乐蜘蛛YY一下,毕竟是太监设备正经事都干不了
回复 支持 反对

使用道具 举报

66#
发表于 2013-1-30 21:53 来自手机 | 只看该作者
PRAM 发表于 2013-1-30 19:04
我记得T神好像说过A9相当于COER2 50%? 可以肯定的说 单线程方面 HAS 性能是同频A57 2.5倍以上

T神是认定被开除的特瓜2有Core2桌面版的一半
回复 支持 反对

使用道具 举报

67#
发表于 2013-1-30 22:04 | 只看该作者
和大家之前的预计比较相符合...
回复 支持 反对

使用道具 举报

68#
发表于 2013-1-30 22:35 | 只看该作者
PRAM 发表于 2013-1-30 20:45
ARM的数据应该是最理想的情况 估计实际性能还达不到 所以 HSW 性能有可能是A57的3倍 安A57的时间看面对的 ...

不知道Intel在03年就发布的PARROT异构管线还能不能最终出现了~



据说当年的Conroe就是备胎,还有更厉害的正选。
因为AMD比较萎,所以就拿出备胎给AMD当头一木棒,真正的狼牙棒藏在身后。
结果没想到AMD就一直萎下去了……
回复 支持 反对

使用道具 举报

69#
发表于 2013-1-30 22:43 | 只看该作者
itany 发表于 2013-1-30 22:35
不知道Intel在03年就发布的PARROT异构管线还能不能最终出现了~

10年过去了!
回复 支持 反对

使用道具 举报

70#
发表于 2013-1-30 22:50 | 只看该作者
itany 发表于 2013-1-30 22:35
不知道Intel在03年就发布的PARROT异构管线还能不能最终出现了~

这个应该已经没戏了,I社现在是稳健路线
另外最近有个奇葩公司歪打正着出了个思路和这个有点点像的玩艺,虽然技术层次上低了几个数量级



回复 支持 反对

使用道具 举报

头像被屏蔽
71#
发表于 2013-1-30 23:03 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

72#
发表于 2013-1-30 23:07 | 只看该作者
本帖最后由 itany 于 2013-1-30 23:08 编辑
Tempestglen 发表于 2013-1-30 23:03
奇葩公司正在统治手机平板市场,每年7亿台。包括猪神你也在用奇葩公司cpu的手机。

i棍总是质问我用什 ...

呵呵,论坛运行在x86服务器上

话说所谓的little big根本就不是这思路,你根本没有理解所谓的冷热管线是怎么运行的
回复 支持 反对

使用道具 举报

73#
发表于 2013-1-30 23:24 | 只看该作者
Tempestglen 发表于 2013-1-30 23:03
奇葩公司正在统治手机平板市场,每年7亿台。包括猪神你也在用奇葩公司cpu的手机。

i棍总是质问我用什 ...

到一边意银去,别人正说别的呢你打什么岔,不把你脑补的东西说出来就浑身不自在对吧
回复 支持 反对

使用道具 举报

74#
发表于 2013-1-30 23:35 | 只看该作者
itany 发表于 2013-1-30 23:07
呵呵,论坛运行在x86服务器上

话说所谓的little big根本就不是这思路,你根本没有理解所谓的冷热管线是 ...

鹦鹉没出现估计也是效率上得不偿失吧,构造越弄越复杂往往都是反效果。现在EPIC逐渐完蛋,OoO增加发射也代价巨大,大家都去玩堆核,甚至出现推土机拿俩核当一个"核"凑数的情况,感觉IPC提升越来越没希望
PS:ARM还是充满希望的嘛,虽然提升个40%性能功耗就翻了几翻,毕竟10瓦离100瓦还是有距离的,潜力大大地


回复 支持 反对

使用道具 举报

75#
发表于 2013-1-30 23:37 | 只看该作者
the_god_of_pig 发表于 2013-1-30 23:24
到一边意银去,别人正说别的呢你打什么岔,不把你脑补的东西说出来就浑身不自在对吧

我觉得完全可以搞 3宽度的前端-3宽度的冷管线,6宽度的热管线
对于手机平板上比较弱的,把热管线阉了就是了
回复 支持 反对

使用道具 举报

76#
发表于 2013-1-30 23:44 | 只看该作者
the_god_of_pig 发表于 2013-1-30 23:35
鹦鹉没出现估计也是效率上得不偿失吧,构造越弄越复杂往往都是反效果。现在EPIC逐渐完蛋,OoO增加发射也代 ...

堆核并不是免费的。
AMD这样搞,其实很大程度上,只见过4核心,最多是6核心的。在多AMD的交换单元就搞不定了……
现在Opteron也是,2核心共享L2缓存就减少了一半的压力,搞胶水还能再减小一半的压力。
没有Intel的环形总线,堆核心就那么容易?
即便是Intel,环形总线所占的面积和功耗,也不是免费的。

Arm可以向更多核心、更宽的管线要性能,但是同样的资源、管线,和x86相比呢?
效率低得很。
堆资源当然比较容易,但是进行精调优化就难了。
当年AMD靠堆资源能得意一时,但是过了堆资源的拐点,悲剧马上降临
现在Arm就站在当年K8到K10的拐点上,往前一步就是万丈深渊。
回复 支持 反对

使用道具 举报

77#
发表于 2013-1-30 23:48 | 只看该作者
itany 发表于 2013-1-30 23:37
我觉得完全可以搞 3宽度的前端-3宽度的冷管线,6宽度的热管线
对于手机平板上比较弱的,把热管线阉了就是 ...

瞎猜把指令分开很费资源吧,目测堪比OoO的消耗量,实际性能上还有各种损失,各方面都不如堆核划算





回复 支持 反对

使用道具 举报

78#
发表于 2013-1-30 23:55 | 只看该作者
itany 发表于 2013-1-30 23:44
堆核并不是免费的。
AMD这样搞,其实很大程度上,只见过4核心,最多是6核心的。在多AMD的交换单元就搞不 ...

这个A15已经现端倪了,4核性能增量已经损失不小,8核以上应该恶化得更严重
不过当初Conroe用FSB的时候也是很惨的,但现在还是秒飞一切了,arm怕是没那能耐


摩尔定律也挺不了几年了,"晶体管怎么用"这种奢侈的烦恼估计也快没了,这几年堆堆核、搞搞GPU也就糊弄过去了,大家都不大折腾了




回复 支持 反对

使用道具 举报

79#
发表于 2013-1-31 00:04 | 只看该作者
the_god_of_pig 发表于 2013-1-30 23:35
鹦鹉没出现估计也是效率上得不偿失吧,构造越弄越复杂往往都是反效果。现在EPIC逐渐完蛋,OoO增加发射也代 ...

鹦鹉的结构并不复杂,甚至更简单。在现在管芯面积可以富裕的情况下完全可以应用。
现在的主要矛盾就是,如果管线比较宽,比如说6发射,那么在大量低IPC的程序情况下资源就浪费严重;如果是比较窄,比如2发射,那么在某些能达到高IPC的情况下性能就很差。Intel通过超线程进行掩盖,效果是明显的;AMD干脆切成两半,但是在很多应用上表现的一塌糊涂,本质上还是太窄了。

要做到需要宽的时候能宽,要窄的时候能窄,只有宽窄两条异构流水线才可以。
窄流水线是全能型的,在执行的时候检测程序的循环和IPC。
当程序的进入循环,指令是宽流水线执行单元的子集,并且IPC足够高的时候,将线程迁移到宽流水线执行。
宽流水线没有前端,用追踪缓存供应微操作指令。宽流水线只要做循环分支就可以。追踪缓存里边是挂在窄流水线上优化器重排之后的微操作,宽流水线不用做重排和冲突检测,只要最简单的执行就行了,因而电路结构和功耗都可以做到最优。

窄,但复杂的冷管线+宽,但简单的热管线,就是鹦鹉的精髓。
回复 支持 反对

使用道具 举报

80#
发表于 2013-1-31 00:15 | 只看该作者
本帖最后由 itany 于 2013-1-31 00:16 编辑
the_god_of_pig 发表于 2013-1-30 23:55
这个A15已经现端倪了,4核性能增量已经损失不小,8核以上应该恶化得更严重
不过当初Conroe用FSB的时候也 ...

摩尔定律至少还能撑10年,没准是20年

现在最主要的问题还是,Intel搞统一架构,除了Atom,从平板到服务器、台式机都用一种架构覆盖。
在低功耗制约下,很多提高性能的手段被放弃了。

另外一方面就是现在缺乏足够的竞争压力。
Intel估计会优先搞Atom。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-4 10:02

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表