POPPUR爱换

标题: 关于 Sandy Bridge 的情报 [打印本页]

作者: kojiboku    时间: 2009-11-27 11:57
标题: 关于 Sandy Bridge 的情报
本帖最后由 kojiboku 于 2009-11-27 12:03 编辑

SandyBridge 代号核心的桌面CPU有两种,分别是高端平台的 SandyBridgeB2 以及主流平台 SandyBridge H2。前者的SandyBridge B2 作为 LGA1366CPU 后继,后者则是采用了新的 LGA1155 接口。(LGA1156短命了 - -?)

IDF 公开的 SandyBridgeH2 的核心示意图




关于 SandyBridge H2
SandyBridge H2 采用了新的 LGA1155 接口。核心数2~4个,支持超线程并且集成图形性核心。 配备了平均每个核心 1.5MB 的共享L3 Cache。
(也就是 2核3MB, 4核 6MB)。 设计有支持 20 个通道的 PCI-Express 控制器,但是桌面平台方面只有16个有效,所以可以组成一条 PCI-Express x16 或者两条 PCI-Express x8。
CPU和芯片组采用 DMI Gen.2x4 通信、带宽有4GB/s。配套的芯片组代号为 Couger Point。原生支持 S-ATA6.0Gbps。但是并不支持 USB3.0。可能 USB 3.0 要等到2012年左右问世的对应 IvyBridge 处理器核心的芯片组了。

SandyBridge H2 预计会出现分为4核和2核两个通常版本,预计的4核心版本的 TDP 是 95W,2核心版本是则是 65W。稍后一些应该会有节能版本问世,节能版4核心版本为45W,2核心版本则是20W。
另外,省略集成的图形核心,提高处理器频率的型号也在计划之中。

内存方面, 集成的内存控制器将会支持双通道的 DDR3-1333。


关于 SandyBridge B2
虽然 SandyBridge B2 仍然使用了和 Bloomfield 核心的 i7 一样的 LGA1366 接口,但是 CPU 和芯片组之间却不再使用 QPI 通信了,和主流平台一样采用了DMI Gen.2x4 通信, 因此现在的 X58 芯片组无望升级支持新核心了。 SandyBridgeB2 没有集成图形核心,核心数为6~8个,支持超线程。平均每个核心配备 2.5MB 的共享L3 Cache。 集成的内存控制器将会支持三通道的 DDR3-1600。
设计有支持 24 个通道的 PCI-Express 控制器。SandyBridge B2配套的芯片组代号为 Patsburg, 不过基本上和主流平台的 Couger Point 差不多,因为大部分功能都集成在处理器内了吧。
预计在服务器和工作站市场方面,也会使用同样的核心与平台。
也有消息说,INTEL也许会推出LGA1155接口的6核心  SandyBridge B2 产品



根据OEM业者得的传言,
由于AMD Bulldozer架构来势汹汹,如果 Bulldozer 性能很强的情况下, 很可能 INTEL 通过强化 Sandy Bridge B2 核心,以及 22nm 制程的 Ivy Bridge 核心来进行对抗。



消息来源: http://www.expertspc.com/report.php?report_no=37&;page_no=0
作者: panda_qb    时间: 2009-11-27 12:18
x58和p55都悲剧了
作者: bwdinlife    时间: 2009-11-27 12:25
过段时间都可以上图了
作者: zacard    时间: 2009-11-27 12:34
提示: 作者被禁止或删除 内容自动屏蔽
作者: 本人.拉登    时间: 2009-11-27 12:47
又要换呀,Bulldozer架构不知如何?
作者: yylyn    时间: 2009-11-27 13:00
令人吃惊,也许AMD会有机会了~

需要广告啊
作者: xeon-pan    时间: 2009-11-27 13:08
接口换不换你都不用想,之前还说是1156的时候就说了 p55不兼容
作者: sleuth    时间: 2009-11-27 13:44
接口换不换你都不用想,之前还说是1156的时候就说了 p55不兼容
xeon-pan 发表于 2009-11-27 13:08


之前的说法是,桌面的Sandy Bridge还是1156接口,不过需要新的芯片组支持。
现在好了,看来Intel就算连一根针的成本也是要省到底的。

原先还以为Sandy Bridge能支持1600规格的DDR3呢?失望。

LGA1156接口已经杯具了,会不会LGA1156的散热风扇标准也快杯具了。
作者: sleuth    时间: 2009-11-27 13:48
本帖最后由 sleuth 于 2009-11-27 13:51 编辑

之前的报道是这样的,差距不小啊。最终能用上什么Intel的U,同样得看AMD的脸色。

Intel下一代微架构Sandy Bridge核心照/参数泄露
发表于2009-07-06 13:00
  Sandy Bridge是Intel 32nm Westmere处理器的下一代产品,预计2011年第一季度上市,据称基于Intel下一代微架构Sandy Bridge的产品已经于六月份早些时候完成了流片设计。按PC Canard网站得到的消息,目前这款处理器的样品已经制成,而他们也得到了这款处理器的核心图片。这块Sandy Bridge样品采用四核设计,支持超线程技术,支持AES扩展指令集并追加了新的AVX扩展指令集。
  Sandy Bridge处理器的每个核心都将配备256KB二级缓存,并共享8MB三级缓存,由于使用了Ring架构,因此核心访问三级缓存的延迟将被缩小到25个时钟周期左右。
  另外,Sandy Bridge核心的北桥功能部分还集成了PCI-E控制器,并集成DDR3-1600规格的双通道内存控制器。
  核心中还集成了原生GPU核心,同样采用32nm制程制作.据称这款集成显卡的性能可与ATI/Nvidia届时上市的显卡性能相近。
  Sandy Bridge核心的尺寸大约是225平方毫米(每个CPU核心面积为20平方毫米左右),TDP功耗则为85W左右。
  频率部分,初步估计会在2.8-3.4GHz左右,而开启Turbo mode之后工作频率则可以达到3.8-4GHz。
  不过,这次介绍的四核Sandy Bridge样品并不是最高端的型号,实际上市时的Sandy Bridge可能会有2-8核心的几个版本,三级缓存容量则在4-16MB间变化。
  虽然我们仍无法透露有关这款处理器的更多细节。但按此前从主板厂商那里泄露出来的说法,这款处理器届时将采用与Clarkdale处理器一样的LGA1156插槽,但需要与新的芯片组产品进行配合。
  另外,Sandy Bridge集成的显卡核心将基于Intel GMA集显技术,而不会基于Larabee。集显核心的工作频率将在1.2GHz左右,预计将支持DX11.而核心集成的PCI-E控制器则据称会包含20个PCI-E2.0通道(可能采用16x+4x的配置).
  最后,据Intel内部工作人员泄露的消息,Intel即将上市的Lynnfield处理器已经完成了产品包装工作,并已经完成了了大量上市的最后准备。而基于32nm Westmere核心的处理器今年早些时候也已经完成了流片设计工作,目前这款处理器的样品在Intel的研发实验室中工作状况良好。预计采用32nm制程Westmere核心和六核Gulftown处理器将于2010年五月份上市,这款处理器将配备12MB三级缓存,并采用LGA1366插槽,可与现有的X58芯片组兼容。

作者: xeon-pan    时间: 2009-11-27 14:55
之前的说法是,桌面的Sandy Bridge还是1156接口,不过需要新的芯片组支持。
现在好了,看来Intel就算连一根针的成本也是要省到底的。

原先还以为Sandy Bridge能支持1600规格的DDR3呢?失望。

LGA1156接口 ...
sleuth 发表于 2009-11-27 13:44


本人预测 1155和1156的扣具不会有什么改变。事实上改扣具孔径对于intel来说没什么意义。散热器的钱又不是他赚的

至于更换主板,本来就已经是了,所以我也不觉得这个有啥悲剧

至于架构么,我也有一点小失望(但是其实真正架构细节好像并不多),不过既然有人说 ivybridge能毫无悬念打败推土机的话,只好期待了
作者: lemonninja    时间: 2009-11-27 14:58
我靠~ 这接口换来换去的
作者: eva00    时间: 2009-11-27 15:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2009-11-27 17:24
这个消息是假消息
作者: 河蟹万岁    时间: 2009-11-27 22:01
刚集成内存控制器是会一直换的  参考AMD
作者: 河蟹万岁    时间: 2009-11-27 22:07
不过感觉这是假新闻
L3 1.5M 明显不是INTEL风格
作者: Buffer    时间: 2009-11-27 22:22
LGA1155,................



小步舞曲:只差一步
作者: bessel    时间: 2009-11-27 23:50
证明?

这个消息是假消息
itany 发表于 2009-11-27 17:24

作者: lemonninja    时间: 2009-11-27 23:50
小步舞曲:只差一步
Buffer 发表于 2009-11-27 22:22


经典的曲子!1156 1155 永远只差一步
作者: 游泳    时间: 2009-11-28 07:09
散热器能用775的就好了
作者: kojiboku    时间: 2009-11-28 08:31
假的最好啦!
感觉改进太少...
作者: xeon-pan    时间: 2009-11-28 09:47
不过感觉这是假新闻
L3 1.5M 明显不是INTEL风格
河蟹万岁 发表于 2009-11-27 22:07


这个倒是。。
作者: sleuth    时间: 2009-11-29 19:19
本帖最后由 sleuth 于 2009-11-29 19:20 编辑
这个消息是假消息
itany 发表于 2009-11-27 17:24


原来是假消息,太好了。
作者: zzaz001    时间: 2009-11-29 21:12
关注。。。。。。。。。。。。。。
作者: scowl    时间: 2009-11-29 23:52
又换接口了??

INTEL还真是要把抢钱贯彻到底啊..........................
作者: scowl    时间: 2009-11-29 23:54
刚集成内存控制器是会一直换的  参考AMD
河蟹万岁 发表于 2009-11-27 22:01



AMD一年后就统一到AM2了

然后一直兼容到今天

多少年了

你还想怎么样?
作者: logMsg    时间: 2009-11-30 09:09
接口全换,就是1366信号定义也是不一样,现在这代平台都杯具了
作者: elisha    时间: 2009-11-30 10:21
AMD一年后就统一到AM2了

然后一直兼容到今天

多少年了

你还想怎么样?
scowl 发表于 2009-11-29 23:54


AM2不支持AM3的,谢谢
作者: hammerking    时间: 2009-11-30 16:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: deepabyss    时间: 2009-11-30 18:55
136X ??? 什么意思??  暂定为杯具

看来到2010年 目前所有平台全部歇菜,升级=基本全换, 妈|的还不如买个品牌机拆了自己加显卡内存来的便宜 反正现在有的品牌机可以不买显示器
作者: langgs    时间: 2009-11-30 19:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: elisha    时间: 2009-11-30 19:45
am2+可以插am2,am3+可以插am3,第一代bulldozer可以用在现在的am3板子上,谢谢。
hammerking 发表于 2009-11-30 16:11

也只能支持一代啊,你叫那些买了AM2的人怎么升级新U啊
作者: boris_lee    时间: 2009-11-30 22:32
AMD一年后就统一到AM2了

然后一直兼容到今天

多少年了

你还想怎么样?
scowl 发表于 2009-11-29 23:54

Most AM2 Motherboards Not Phenom Ready
作者: bessel    时间: 2009-12-1 08:03
我觉得这个新闻里多数很有可能是真的。

他就是证明啊,intel发言人的话你还不信啊?
Seraphlich 发表于 2009-11-29 23:57

作者: AMD11    时间: 2009-12-1 11:13
由于AMD Bulldozer架构来势汹汹,如果 Bulldozer 性能很强的情况下, 很可能 INTEL 通过强化 Sandy Bridge B2 核心,以及 22nm 制程的 Ivy Bridge 核心来进行对抗。”

我个人觉得比较奇怪,怎么这么多人会对AMD的Bulldozer这么看好?有哪些点能够支撑他们的看法?这些年来(2007年以后吧,免得口水)AMD在CPU领域作出那些可以大幅度提高性能的工作?在分析师日里展现的幻灯片并没有什么值得YY的东西。
或许我跟不上形势了。
作者: AMD11    时间: 2009-12-1 11:19
我个人还是认为AMD的Bulldozer能够与32nm的Westmere比肩就不错了,科学技术这东西想大跃进,很难很难,除非找到了具有颠覆性的原理发现和实现方法。
当然,希望AMD能够打我的脸,到时候后Snady Bridge将AVX指令拆分的方式又要合并了,算是进步吧。
作者: AMD11    时间: 2009-12-1 11:20
我个人还是认为AMD的Bulldozer能够与32nm的Westmere比肩就不错了,科学技术这东西想大跃进,很难很难,除非找到了具有颠覆性的原理发现和实现方法。
当然,希望AMD能够打我的脸,到时候后Snady Bridge将AVX指令拆分的方式又要合并了,算是进步吧。
作者: potomac    时间: 2009-12-1 12:23
提示: 作者被禁止或删除 内容自动屏蔽
作者: hammerking    时间: 2009-12-1 13:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: elisha    时间: 2009-12-1 14:55
你还嫌不够啊,1156能升级吗?
hammerking 发表于 2009-12-1 13:22

现在快发布的32nm的U,不是新一代的1156吗
作者: ifu    时间: 2009-12-1 15:05
看目前流出来的图片,推土机的变化应该是自k7出来后最大的一次。颇有k6-->k7风范。从执行单元规格上来看已然超过了Nehalem,不过cpu这玩意和gpu不一样不是直接堆执行单元就能提高性能,希望推土机不要太渣
作者: Hyins    时间: 2009-12-1 18:39
如果真出LGA1155估计也得兼容LGA1156
作者: Sakray    时间: 2009-12-1 22:16
“由于AMD Bulldozer架构来势汹汹,如果 Bulldozer 性能很强的情况下, 很可能 INTEL 通过强化 Sandy Bridg ...
AMD11 发表于 2009-12-1 11:13

AMD很多年没动过架构了  bulldozer自然让很多人寄予厚望  当然这个架构有人看好也有人不看好  第一代bulldozer可能性能上没有多少惊喜   但是不能否认这个架构是一个颠覆  日后有很多的发展空间  比如模块化堆叠之类的  总之  如果感兴趣就去找找资料   总好过瞎猜  现目前这个架构还有很多的谜
作者: AMD11    时间: 2009-12-2 13:50
AMD很多年没动过架构了  bulldozer自然让很多人寄予厚望  当然这个架构有人看好也有人不看好  第一代bull ...
Sakray 发表于 2009-12-1 22:16


(1)我个人并不看好所谓两个物理核心捆绑成一个基本模块的方式,除非AMD真的能够提供所谓的“逆超线程”的天顶星技术。这样模块在调度上多了一级,应该比超线程的单纯切换要慢,不能充分利用核心资源,与现在的多核心相比,多线程处理能力并没有实质的区别。
(2)所谓模块化或说堆叠方式,现在Nehalem就是这个思路,而且已经实现了三年多了。
(3)FPU上,并不是每个核心两个FMAC的问题,本质上还是每个时刻占用的问题,如果不能提供具有天顶星技术的“逆超线程”,等于摆设。
作者: AMD11    时间: 2009-12-2 13:51
AMD很多年没动过架构了  bulldozer自然让很多人寄予厚望  当然这个架构有人看好也有人不看好  第一代bull ...
Sakray 发表于 2009-12-1 22:16

还有一个问题,在现在AMD好像不怎么提超线程的问题,是不是AMD本身就没有办法在Bulldozer上实现?
作者: AMD11    时间: 2009-12-2 14:00
AMD很多年没动过架构了  bulldozer自然让很多人寄予厚望  当然这个架构有人看好也有人不看好  第一代bull ...
Sakray 发表于 2009-12-1 22:16

另外,Intel的Sandy Bridge的AVX执行宽度是2*256位,按照现在128bit的SSE方式,宽度增大了一倍(每个执行宽度,不是说两个执行宽度),在宽度上比AMD的2*128bit大了一倍多。执行指令效率上应该高出不少。
因此,我个人还是这样的一个观点,Bulldozer能够与westmere差不多,不会有什么YY可取之处。当然其集成GPU可能是一个亮点。
作者: dreamz3    时间: 2009-12-2 14:34
sandy bridge的cpu应该是很强,集成的gpu可能还是会悲剧。。。
作者: Asuka    时间: 2009-12-2 14:42
看目前流出来的图片,推土机的变化应该是自k7出来后最大的一次。颇有k6-->k7风范。从执行单元规格上来看已然超过了Nehalem,不过cpu这玩意和gpu不一样不是直接堆执行单元就能提高性能,希望推土机不要太渣
ifu 发表于 2009-12-1 15:05



.......根本不是这样

推土机要解决的是核心复杂度与核心数量之间的关系
作者: ifu    时间: 2009-12-2 15:08
.......根本不是这样

推土机要解决的是核心复杂度与核心数量之间的关系
Asuka 发表于 2009-12-2 14:42

没看出执行单元规格和你提的有啥冲突.  流出的图片上看推土机应该是以高效率多线程处理能力为主顺带提供相对彪悍的单线程能力
作者: scowl    时间: 2009-12-2 16:37
也只能支持一代啊,你叫那些买了AM2的人怎么升级新U啊
elisha 发表于 2009-11-30 19:45



很多AM2不能升级AM2+的CPU   唯一的原因是主板当年的设计因素    毕竟太多年了

跟接口没有关系

这不还有06年的NF550成功升级P2 940的么??

这不AM2+上还有伟大的FX5000+么
作者: itany    时间: 2009-12-2 16:48
本帖最后由 itany 于 2009-12-2 17:02 编辑
没看出执行单元规格和你提的有啥冲突.  流出的图片上看推土机应该是以高效率多线程处理能力为主顺带提供相 ...
ifu 发表于 2009-12-2 15:08


请问Bulldozer怎么提高单线程性能的?
一个整数核心现在只有两个ALU+1 Load+1 Store,现在的Barcelona是3个ALU,Core也是3个,明明就是削弱
如果算资源,单个线程的前端、执行单元、内存访问都削弱了,怎么说能实现更高的单线程性能呢?

如果从一个模组来看,那确实是执行资源比Intel更丰富,但是问题是Barcelona除了是3发射之外,执行资源并不比Core架构少,但是和Nehalem相比,常常发生单路Nehalem打双路Shanghai的情况。可见,这不是执行资源的问题,这是执行效率的问题。

AMD不是缺执行资源,而是调度的问题。
作者: itany    时间: 2009-12-2 17:01
AMD搞CMT,Intel就不能搞了?
SMT的前端+加倍的执行资源+独立L1D+共享L2D缓存,怎么看怎么像Intel的套路
如果Intel想搞,很容易搞出一个更强悍的来。
Intel有工艺和设计的优势,而且还搞过安腾这种超宽的大家伙。

但是有没有必要呢? 执行资源真的是紧缺的么?
整个前后端就是4指令宽度,中间用得上那么宽么?3个ALU究竟够不够用呢?我觉得真正可能瓶颈的反而是Load能力,但是Sandy Bridge明确表示Load能力会加倍,Store会不会还不知道,可能也会。这样我认为就OK拉。
作者: ifu    时间: 2009-12-2 17:14
请问Bulldozer怎么提高单线程性能的?
一个整数核心现在只有两个ALU+1 Load+1 Store,现在的Barcelona ...
itany 发表于 2009-12-2 16:48

一个核心两个整数调度单元, 这两个单元是同一个decode前端,所以只能把它俩看成一个核心 你上面的数据得*2
作者: potomac    时间: 2009-12-2 18:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: hammerking    时间: 2009-12-2 21:20
提示: 作者被禁止或删除 内容自动屏蔽
作者: hammerking    时间: 2009-12-2 21:23
提示: 作者被禁止或删除 内容自动屏蔽
作者: exiaoran    时间: 2009-12-2 22:00
实现多线程又不是只有超线程一种方式,amd已经多次声明不认为超线程是最好的多线程解决方案,为什么非要a ...
hammerking 发表于 2009-12-2 21:20



    声明100次也没用

就算超线程不是最好的解决方案

你连最差的解决方案都没有

瞎j b叫唤什么呢?
作者: hammerking    时间: 2009-12-2 22:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: xeon-pan    时间: 2009-12-2 22:25
关于一个整数执行核的4pipeline到底是什么配置,amd还没有透露。不过Bulldozer主设计师Chuck Moore在现场讲 ...
hammerking 发表于 2009-12-2 21:23

没有根据的说单线程性能好  那和没说没啥区别啊,夸海口谁不会。。
作者: hammerking    时间: 2009-12-2 22:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: ifu    时间: 2009-12-2 23:06
实现多线程又不是只有超线程一种方式,amd已经多次声明不认为超线程是最好的多线程解决方案,为什么非要a ...
hammerking 发表于 2009-12-2 21:20

简单来讲推土机就是粗粒度SMT
作者: itany    时间: 2009-12-3 00:11
一个核心两个整数调度单元, 这两个单元是同一个decode前端,所以只能把它俩看成一个核心 你上面的数据得* ...
ifu 发表于 2009-12-2 17:14


按照AMD的说法,一个整数核心就算一个核心,两个整数核心加上浮点叫做一个模组
就算你整个执行资源比Core多,可是你必须在两个线程之间分享,而且分支预测、内部调度的效率问题是制约AMD的关键因素,而不是执行单元的数量。
AMD素来有以更多执行单元而被打的满地找牙的光荣传统
Yonah两个ALU就能灭K8了
作者: itany    时间: 2009-12-3 00:25
这个人是bd架构主设计师,也是power4的主设计师。我不认为以他的造诣会没有根据的判断bd的单线程性能。
hammerking 发表于 2009-12-2 22:36


当年Power 4也是牛皮吹的比较大的
另外这个是吹风会,是个人都要上去吹的。当年Barcelona还说要领先Intel 40% 的,结果被Q6600杀全家。

整数管线也没什么神秘的。看看这个就知道了:


四个发射口变出花样来也就是两个ALU,一个Load,一个Store
这个没有必要不承认
作者: ifu    时间: 2009-12-3 09:26
按照AMD的说法,一个整数核心就算一个核心,两个整数核心加上浮点叫做一个模组
就算你整个执行资源比C ...
itany 发表于 2009-12-3 00:11

一个整数核心就算一个核心只不过是宣传策略罢了,按照正规CPU结构的理解它的所谓一个模组才是一个完整的CPU核心。至于为什么这么宣传我猜测是为了配合扯淡的“逆超线程”。
这两个单元可以跑两线程不等于它只能跑两独立线程。我前面也提到了粗粒度SMT, 你把它看成粗粒度SMT 就能很好理解推土机结构。
你说的其实也就是发掘更多指令级并行使得更有效利用执行单元的问题,这的确是个挑战。AMD的3发射K10从大幅落后做到如今和同频4发射的扣肉差不多的性能也说明1.AMD在这方面是进步的 2.扣肉也并没让4发射满负荷运转可见4发射还有很大性能提升空间。 而k10的3发射使得它的最大并行执行始终不如intel,这属于先天缺陷。所以推土机搞了4发射并且增加执行资源 我们有理由相信它单线程能力比目前的k10有所提升,至于提升多大  只有天晓得......
作者: ifu    时间: 2009-12-3 09:28
当年Power 4也是牛皮吹的比较大的
另外这个是吹风会,是个人都要上去吹的。当年Barcelona还说要领先In ...
itany 发表于 2009-12-3 00:25

呵呵 你贴的是AMD对应atom档次的新内核,既然atom档次都已经是两个ALU,一个Load,一个Store。你不会认为推土机的单线程执行能力也就atom对手水平吧:)
作者: Asuka    时间: 2009-12-3 09:53
一个整数核心就算一个核心只不过是宣传策略罢了,按照正规CPU结构的理解它的所谓一个模组才是一个完整的C ...AMD的3发射K10从大幅落后做到如今和同频4发射的扣肉差不多的性能也说明1.AMD在这方面是进步的
ifu 发表于 2009-12-3 09:26


同频和什么版本的酷睿性能差不多?
作者: bessel    时间: 2009-12-3 09:54
zz:
"The only bad thing is that some guys I know at AMD say that Bulldozer is
not really all that great a product, but is shipping just because AMD
needs a model refresh. "Sometimes you just gotta ship what you got." "
呵呵 你贴的是AMD对应atom档次的新内核,既然atom档次都已经是两个ALU,一个Load,一个Store。你不会认为 ...
ifu 发表于 2009-12-3 09:28

作者: Asuka    时间: 2009-12-3 09:55
我现在比较感兴趣,推土机能跑到什么频率 :D
作者: bessel    时间: 2009-12-3 09:58
本帖最后由 bessel 于 2009-12-3 10:00 编辑

我的感觉是intel更注重发掘单线程的性能.
ht即使是在nehalem上表现也一般般.
intel这帮人暂时不会走cmt这条路
AMD搞CMT,Intel就不能搞了?
SMT的前端+加倍的执行资源+独立L1D+共享L2D缓存,怎么看怎么像Intel的套路
如果Intel想搞,很容易搞出一个更强悍的来。
Intel有工艺和设计的优势,而且还搞过安腾这种超宽的大家伙。

但是有没有必要呢? 执行资源真的是紧缺的么?
整个前后端就是4指令宽度,中间用得上那么宽么?3个ALU究竟够不够用呢?我觉得真正可能瓶颈的反而是Load能力,但是Sandy Bridge明确表示Load能力会加倍,Store会不会还不知道,可能也会。这样我认为就OK拉。
itany 发表于 2009-12-2 17:01

作者: AMD11    时间: 2009-12-3 10:00
本帖最后由 AMD11 于 2009-12-3 10:01 编辑
实现多线程又不是只有超线程一种方式,amd已经多次声明不认为超线程是最好的多线程解决方案,为什么非要a ...
hammerking 发表于 2009-12-2 21:20


(1)不是非要AMD用超线程,而是目前看来超线程是才最小代价下能够实现同一核心SMT的技术,以5%左右的代价实现了多线程下10~40%的性能提升,这个还不够说服力吗?
(2)超线程的技术方面,AMD应该有靠山的,IBM玩超线程娴熟程度,目前比Intel好。但是AMD却用两个物理核心来做模组,这与两两多核有多大区别?推广的情况下,实际与多核有有什么区别?资源浪费问题如何解决?难道AMD自信自己所用到的工艺比Intel的好,能够降低足够的成本?
作者: AMD11    时间: 2009-12-3 10:08
那个图可能不是捆绑两个物理核心的意思。
解码单元覆盖所有管线,
这个宽带很牛逼的说。(是真牛逼 ...
potomac 发表于 2009-12-2 18:15

按照你的理解,我是不是可以这样说,AMD想走center switch的方式,可是在解码调度阶段已经能够做到了,何必再多此一举?难道想实现执行前的动态调度?这样问题由来,这个调度只能在模组内调度,不能全局调度,当模组发生异常是,如何处理这种例外?放在模组内还是直接跳转到全局?数据要不要重新加载?或者干脆走滞后的精确例外处理?
作者: AMD11    时间: 2009-12-3 10:14
这个人是bd架构主设计师,也是power4的主设计师。我不认为以他的造诣会没有根据的判断bd的单线程性能。
hammerking 发表于 2009-12-2 22:36


(1)在分析师会议上夸海口是一个比较正常的商业行为,真的做不了准。另外,Power4的单线程能力并不咋的。
(2)我觉得AMD目前最好能够给出相应的运行图(不是诸如以前K10模拟图,而是实际运行图),这样才有说服力。
作者: acqwer    时间: 2009-12-3 11:04
AMD的3发射K10从大幅落后做到如今和同频4发射的扣肉差不多的性能也说明1.AMD在这方面是进步的 2.扣肉也并没让4发射满负荷运转可见4发射还有很大性能提升空间。 ifu 发表于 2009-12-3 09:26

K10大幅落后的是频率吧,同频最多差了10%。

说起来,对Core2的时候,内存性能上的优势当年不是天天说的吗,现在怎么就忘记了?
作者: acqwer    时间: 2009-12-3 11:06
呵呵 你贴的是AMD对应atom档次的新内核,既然atom档次都已经是两个ALU,一个Load,一个Store。你不会认为 ...
ifu 发表于 2009-12-3 09:28

AMD自己画了性能提升的图,如果和12核对比的是最强的推土机的话,看上去也不怎么强啊。
作者: ifu    时间: 2009-12-3 11:22
同频和什么版本的酷睿性能差不多?
Asuka 发表于 2009-12-3 09:53

ok,差不这个说法不妥。改为接近



作者: ifu    时间: 2009-12-3 11:27
zz:
"The only bad thing is that some guys I know at AMD say that Bulldozer is
not really all that  ...
bessel 发表于 2009-12-3 09:54

没看出你这zz和我贴中内容有啥关系
作者: elisha    时间: 2009-12-3 11:30
楼上真不容易啊,几十个项目中硬能找到几个出彩的
作者: ifu    时间: 2009-12-3 11:44
楼上真不容易啊,几十个项目中硬能找到几个出彩的
elisha 发表于 2009-12-3 11:30


:)是不容易
作者: potomac    时间: 2009-12-3 12:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: knightmaster    时间: 2009-12-3 12:49
.......根本不是这样

推土机要解决的是核心复杂度与核心数量之间的关系
Asuka 发表于 2009-12-2 14:42



    这个问题早就被cell解决了吧
作者: hammerking    时间: 2009-12-3 12:52
提示: 作者被禁止或删除 内容自动屏蔽
作者: hammerking    时间: 2009-12-3 12:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: hammerking    时间: 2009-12-3 13:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: Prescott    时间: 2009-12-3 16:54
一句话,BD没前途
over
作者: hammerking    时间: 2009-12-3 17:17
提示: 作者被禁止或删除 内容自动屏蔽
作者: naze    时间: 2009-12-3 18:49
一句话,BD没前途
over
Prescott 发表于 2009-12-3 16:54

P大 给分析下呗
作者: AMD11    时间: 2009-12-3 19:22
一句话,BD没前途
over
Prescott 发表于 2009-12-3 16:54


老P,你就这样扔下一句话,很多人会恶意揣度的,甚至会泼水的。
作者: ifu    时间: 2009-12-3 19:53
AMD自己画了性能提升的图,如果和12核对比的是最强的推土机的话,看上去也不怎么强啊。
acqwer 发表于 2009-12-3 11:06

哪里的图?
作者: itany    时间: 2009-12-3 20:10
一个整数核心就算一个核心只不过是宣传策略罢了,按照正规CPU结构的理解它的所谓一个模组才是一个完整的C ...
ifu 发表于 2009-12-3 09:26


不可能只能跑两个线程? 你以为一个线程还能分布在两个整数核心上执行么?
要是这样搞,效率注定是低下的,尤其是分散的L1缓存之间还需要同步,两个调度器也需要同步,这样还不如做个大的。

在多线程的情况下,nehalem有7个发射口,Bulldozer有8个,但是:
1 对于ILP很低的程序,比如IPC只有1.x的,执行单元根本不是瓶颈
2 对于ILP比价高的程序,取指、译码、回写是瓶颈,增加执行单元没啥用。反而,因为AMD分割了执行单元,所以还会损害单线程的执行能力
作者: itany    时间: 2009-12-3 20:16
呵呵 你贴的是AMD对应atom档次的新内核,既然atom档次都已经是两个ALU,一个Load,一个Store。你不会认为 ...
ifu 发表于 2009-12-3 09:28


那不是AMD和Atom对阵的,而是和CULV对阵的
你说CULV同频和nehalem单线程性能能差多少呢?

四个发射口,除了两个ALU、一个Load、一个Store,还能怎么组织?
总要有常识吧
AMD有能力为Bobcat设计一个“全新”的内核么?
Bobcat单线程性能受制于频率。和CULV类似
作者: itany    时间: 2009-12-3 20:18
ok,差不这个说法不妥。改为接近
ifu 发表于 2009-12-3 11:22


找内存带宽瓶颈和劣质的SSE应用很爽么?
内存瓶颈和重度SIMD应用都是Sandy Bridge的长处,AMD更没有机会了
作者: hammerking    时间: 2009-12-3 21:27
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2009-12-3 21:33
bobcat与bd存在相同点,那就是都是x86的。除此以外不要以bobcat来推测bd。
hammerking 发表于 2009-12-3 21:27


呵呵,阁下一到这个时候,就会犯右倾主义错误
当年Bacelona性能和缓存延迟的教训还不够么
作者: hammerking    时间: 2009-12-3 21:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: ifu    时间: 2009-12-4 00:12
不可能只能跑两个线程? 你以为一个线程还能分布在两个整数核心上执行么?
要是这样搞,效率注定是低下 ...
itany 发表于 2009-12-3 20:10

最笨的方法进行投机,能赚一点是一点。所以我也只认为是"顺带"提供相对彪悍的单线程能力, 主要重点还是多线程能力。一个大调度器当然好不过复杂度上升了并且投入产出比不划算。
nehalem是6个好不,推土机是10个。这个差距还是挺大的,当然这两者微码都不一样不能完全比数目

anandtech说法:
AMD is also careful to mention that the integerthroughput of one of these integer cores is greater than that of thePhenom II's integer units.
如果同描述这样彪悍,那还真有可能一个线程只绑死一个整数单元。但这整数单元恐怕就不是你提的两个ALU+1 Load+1 Store
作者: ifu    时间: 2009-12-4 00:22
那不是AMD和Atom对阵的,而是和CULV对阵的
你说CULV同频和nehalem单线程性能能差多少呢?

四个发射 ...
itany 发表于 2009-12-3 20:16

AMD自己官方的说法
Very low power design
– Sub one-watt capable
啥时候CULV功耗这么低了?

未找到官方出处的描述:
Bobcat is an out-of-order processor that can dispatch up to twoinstructions per cycle from its front-end to the integer and/orfloating-point schedulers.

这玩意怎么看都更像是atom档次的
作者: Prescott    时间: 2009-12-4 00:38
老P,你就这样扔下一句话,很多人会恶意揣度的,甚至会泼水的。
AMD11 发表于 2009-12-3 19:22

波水,随便啦
其实BD没什么特别的地方啊,一个这样的Module能打得过一个Ivy Bridge with SMT就不错了。
作者: AMD11    时间: 2009-12-4 09:21
波水,随便啦
其实BD没什么特别的地方啊,一个这样的Module能打得过一个Ivy Bridge with SMT就不错了。
Prescott 发表于 2009-12-4 00:38

这样的话,还得二打一。我真希望AMD的技术再强一点,迫使Intel的技术革新快一点,应用在产品上多一点,不要像现在这样挤牙膏似的。老P,你不会说俺们这样的用户贪心吧。
作者: itany    时间: 2009-12-4 09:25
本帖最后由 itany 于 2009-12-4 09:30 编辑
有些东西,如果你留意去搜集,是会知道哪些人,是什么身份,已经给了什么确切信息的。性能方面现在的说 ...
hammerking 发表于 2009-12-3 21:36


除非某社搞了倍速ALU,否则四个发射口还不如P4呢
如果AMD有什么火星技术的话,我当然喜闻乐见。我之前说过,AMD的专利技术也是Intel的专利技术
另外,我没有任何背景的说,我要说对了是我IQ高,说错了是正常的
后藤和Anand还经常胡说八道呢
作者: hammerking    时间: 2009-12-4 10:35
提示: 作者被禁止或删除 内容自动屏蔽
作者: Prescott    时间: 2009-12-4 14:29
为什么是ivy bridge而不是sandy bridge
hammerking 发表于 2009-12-4 10:35


因为2011年是ivy bridge啊




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4