POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: kojiboku
打印 上一主题 下一主题

关于 Sandy Bridge 的情报

[复制链接]
61#
发表于 2009-12-3 00:11 | 只看该作者
一个核心两个整数调度单元, 这两个单元是同一个decode前端,所以只能把它俩看成一个核心 你上面的数据得* ...
ifu 发表于 2009-12-2 17:14


按照AMD的说法,一个整数核心就算一个核心,两个整数核心加上浮点叫做一个模组
就算你整个执行资源比Core多,可是你必须在两个线程之间分享,而且分支预测、内部调度的效率问题是制约AMD的关键因素,而不是执行单元的数量。
AMD素来有以更多执行单元而被打的满地找牙的光荣传统
Yonah两个ALU就能灭K8了
回复 支持 反对

使用道具 举报

62#
发表于 2009-12-3 00:25 | 只看该作者
这个人是bd架构主设计师,也是power4的主设计师。我不认为以他的造诣会没有根据的判断bd的单线程性能。
hammerking 发表于 2009-12-2 22:36


当年Power 4也是牛皮吹的比较大的
另外这个是吹风会,是个人都要上去吹的。当年Barcelona还说要领先Intel 40% 的,结果被Q6600杀全家。

整数管线也没什么神秘的。看看这个就知道了:


四个发射口变出花样来也就是两个ALU,一个Load,一个Store
这个没有必要不承认
回复 支持 反对

使用道具 举报

63#
发表于 2009-12-3 09:26 | 只看该作者
按照AMD的说法,一个整数核心就算一个核心,两个整数核心加上浮点叫做一个模组
就算你整个执行资源比C ...
itany 发表于 2009-12-3 00:11

一个整数核心就算一个核心只不过是宣传策略罢了,按照正规CPU结构的理解它的所谓一个模组才是一个完整的CPU核心。至于为什么这么宣传我猜测是为了配合扯淡的“逆超线程”。
这两个单元可以跑两线程不等于它只能跑两独立线程。我前面也提到了粗粒度SMT, 你把它看成粗粒度SMT 就能很好理解推土机结构。
你说的其实也就是发掘更多指令级并行使得更有效利用执行单元的问题,这的确是个挑战。AMD的3发射K10从大幅落后做到如今和同频4发射的扣肉差不多的性能也说明1.AMD在这方面是进步的 2.扣肉也并没让4发射满负荷运转可见4发射还有很大性能提升空间。 而k10的3发射使得它的最大并行执行始终不如intel,这属于先天缺陷。所以推土机搞了4发射并且增加执行资源 我们有理由相信它单线程能力比目前的k10有所提升,至于提升多大  只有天晓得......
回复 支持 反对

使用道具 举报

64#
发表于 2009-12-3 09:28 | 只看该作者
当年Power 4也是牛皮吹的比较大的
另外这个是吹风会,是个人都要上去吹的。当年Barcelona还说要领先In ...
itany 发表于 2009-12-3 00:25

呵呵 你贴的是AMD对应atom档次的新内核,既然atom档次都已经是两个ALU,一个Load,一个Store。你不会认为推土机的单线程执行能力也就atom对手水平吧:)
回复 支持 反对

使用道具 举报

65#
发表于 2009-12-3 09:53 | 只看该作者
一个整数核心就算一个核心只不过是宣传策略罢了,按照正规CPU结构的理解它的所谓一个模组才是一个完整的C ...AMD的3发射K10从大幅落后做到如今和同频4发射的扣肉差不多的性能也说明1.AMD在这方面是进步的
ifu 发表于 2009-12-3 09:26


同频和什么版本的酷睿性能差不多?
回复 支持 反对

使用道具 举报

66#
发表于 2009-12-3 09:54 | 只看该作者
zz:
"The only bad thing is that some guys I know at AMD say that Bulldozer is
not really all that great a product, but is shipping just because AMD
needs a model refresh. "Sometimes you just gotta ship what you got." "
呵呵 你贴的是AMD对应atom档次的新内核,既然atom档次都已经是两个ALU,一个Load,一个Store。你不会认为 ...
ifu 发表于 2009-12-3 09:28
回复 支持 反对

使用道具 举报

67#
发表于 2009-12-3 09:55 | 只看该作者
我现在比较感兴趣,推土机能跑到什么频率 :D
回复 支持 反对

使用道具 举报

68#
发表于 2009-12-3 09:58 | 只看该作者
本帖最后由 bessel 于 2009-12-3 10:00 编辑

我的感觉是intel更注重发掘单线程的性能.
ht即使是在nehalem上表现也一般般.
intel这帮人暂时不会走cmt这条路
AMD搞CMT,Intel就不能搞了?
SMT的前端+加倍的执行资源+独立L1D+共享L2D缓存,怎么看怎么像Intel的套路
如果Intel想搞,很容易搞出一个更强悍的来。
Intel有工艺和设计的优势,而且还搞过安腾这种超宽的大家伙。

但是有没有必要呢? 执行资源真的是紧缺的么?
整个前后端就是4指令宽度,中间用得上那么宽么?3个ALU究竟够不够用呢?我觉得真正可能瓶颈的反而是Load能力,但是Sandy Bridge明确表示Load能力会加倍,Store会不会还不知道,可能也会。这样我认为就OK拉。
itany 发表于 2009-12-2 17:01
回复 支持 反对

使用道具 举报

69#
发表于 2009-12-3 10:00 | 只看该作者
本帖最后由 AMD11 于 2009-12-3 10:01 编辑
实现多线程又不是只有超线程一种方式,amd已经多次声明不认为超线程是最好的多线程解决方案,为什么非要a ...
hammerking 发表于 2009-12-2 21:20


(1)不是非要AMD用超线程,而是目前看来超线程是才最小代价下能够实现同一核心SMT的技术,以5%左右的代价实现了多线程下10~40%的性能提升,这个还不够说服力吗?
(2)超线程的技术方面,AMD应该有靠山的,IBM玩超线程娴熟程度,目前比Intel好。但是AMD却用两个物理核心来做模组,这与两两多核有多大区别?推广的情况下,实际与多核有有什么区别?资源浪费问题如何解决?难道AMD自信自己所用到的工艺比Intel的好,能够降低足够的成本?
回复 支持 反对

使用道具 举报

70#
发表于 2009-12-3 10:08 | 只看该作者
那个图可能不是捆绑两个物理核心的意思。
解码单元覆盖所有管线,
这个宽带很牛逼的说。(是真牛逼 ...
potomac 发表于 2009-12-2 18:15

按照你的理解,我是不是可以这样说,AMD想走center switch的方式,可是在解码调度阶段已经能够做到了,何必再多此一举?难道想实现执行前的动态调度?这样问题由来,这个调度只能在模组内调度,不能全局调度,当模组发生异常是,如何处理这种例外?放在模组内还是直接跳转到全局?数据要不要重新加载?或者干脆走滞后的精确例外处理?
回复 支持 反对

使用道具 举报

71#
发表于 2009-12-3 10:14 | 只看该作者
这个人是bd架构主设计师,也是power4的主设计师。我不认为以他的造诣会没有根据的判断bd的单线程性能。
hammerking 发表于 2009-12-2 22:36


(1)在分析师会议上夸海口是一个比较正常的商业行为,真的做不了准。另外,Power4的单线程能力并不咋的。
(2)我觉得AMD目前最好能够给出相应的运行图(不是诸如以前K10模拟图,而是实际运行图),这样才有说服力。
回复 支持 反对

使用道具 举报

72#
发表于 2009-12-3 11:04 | 只看该作者
AMD的3发射K10从大幅落后做到如今和同频4发射的扣肉差不多的性能也说明1.AMD在这方面是进步的 2.扣肉也并没让4发射满负荷运转可见4发射还有很大性能提升空间。 ifu 发表于 2009-12-3 09:26

K10大幅落后的是频率吧,同频最多差了10%。

说起来,对Core2的时候,内存性能上的优势当年不是天天说的吗,现在怎么就忘记了?
回复 支持 反对

使用道具 举报

73#
发表于 2009-12-3 11:06 | 只看该作者
呵呵 你贴的是AMD对应atom档次的新内核,既然atom档次都已经是两个ALU,一个Load,一个Store。你不会认为 ...
ifu 发表于 2009-12-3 09:28

AMD自己画了性能提升的图,如果和12核对比的是最强的推土机的话,看上去也不怎么强啊。
回复 支持 反对

使用道具 举报

74#
发表于 2009-12-3 11:22 | 只看该作者
同频和什么版本的酷睿性能差不多?
Asuka 发表于 2009-12-3 09:53

ok,差不这个说法不妥。改为接近


回复 支持 反对

使用道具 举报

75#
发表于 2009-12-3 11:27 | 只看该作者
zz:
"The only bad thing is that some guys I know at AMD say that Bulldozer is
not really all that  ...
bessel 发表于 2009-12-3 09:54

没看出你这zz和我贴中内容有啥关系
回复 支持 反对

使用道具 举报

76#
发表于 2009-12-3 11:30 | 只看该作者
楼上真不容易啊,几十个项目中硬能找到几个出彩的
回复 支持 反对

使用道具 举报

77#
发表于 2009-12-3 11:44 | 只看该作者
楼上真不容易啊,几十个项目中硬能找到几个出彩的
elisha 发表于 2009-12-3 11:30


:)是不容易
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
78#
发表于 2009-12-3 12:21 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

79#
发表于 2009-12-3 12:49 | 只看该作者
.......根本不是这样

推土机要解决的是核心复杂度与核心数量之间的关系
Asuka 发表于 2009-12-2 14:42



    这个问题早就被cell解决了吧
回复 支持 反对

使用道具 举报

hammerking 该用户已被删除
80#
发表于 2009-12-3 12:52 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-4-9 07:16

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表