POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 17343|回复: 91

[独家中文] Nehalem 微架构改进与互联方式官方揭露!(多方资料更新)

[复制链接]
发表于 2008-3-18 11:23 | 显示全部楼层 |阅读模式
来自:http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=3264&p=2
Intel在IDF之前放出了Nehalem的微架构改进与互联架构的说明

Nehalem的概览
2核心-8核心,4指令执行宽度下的微架构改进,集成内存控制器,QPI总线互联,共享的蕴含式(inlusive) L3缓存,动态功率管理,SSE 4.2指令集,2008 Q4上市


Nehalem的高度模块化,可以搭配不同的核心数量,缓存大小,内存控制器,QPI总线接口数量。不仅核心可以从2-8,还可以集成GPU
8核心的Nehalem有可能仍然是原生设计的,并共享L3缓存


Nehalem在Core2的基础上进行了微架构的改进,突出性能和功耗的优化:

1  Nehalem的重排序缓冲(Re-order Buf)从Penryn的96项增加到128项,执行单元可以看到更多的微指令,大大提升指令的并行度。
2  提升了非对齐缓冲访问的速度。在Penryn中,SSE指令和缓存边界对齐的话,执行的更快;在Nehalem中,是不是对齐,都可以执行的很快。视频编码将从中受益良多。
3  2级分支预测。像L1缓存和L2缓存的关系一样,L1分支存储的执行历史数据比较少,能够更快的做出判断,但是精度稍差;L2分支存储的历史数据较多,对于分支的判断更加精确,但是速度较慢。这样,一般情况下L1分支预测工作,保证核心取指通畅进行,在L1分支拿不准的情况下,L2分支进行判断,这样可以有效避免分支预测失败引起的性能下降。
4  重命名返回栈。在Core2中,在执行中发生调用时,会将返回地址压入返回栈中,这样在调用过程结束之后线程可以尽快返回执行,但是在分支预测失败的情况下,错误的地址将被压入返回栈。Nehalem解决了这个问题,返回栈中的地址总是正确的。
5  在Penryn集成的SSE4.1的基础上扩展为SSE 4.2,增加了7条新的指令,主要着眼于在处理文本时的性能,对于提高搜索引擎的工作效率,在处理XML时候的性能,都是很有好处的
6  提升了线程同步原语的执行效能。这个改进在Penryn上边就已经开始了,而Nehalem仍将继续,这样对于多线程应用程序在进行内存访问的时候所消耗的处理器时间会进一步缩短,大大提升如Java虚拟机等应用上的效能。

Nehalem支持超线程,而且由于更短的管线和更多的执行资源,性能非Netburst可以同日而语。


Nehalem的缓存结构:

L1I 32KB;L1D 32KB;L2 256KB;L3 8MB
个人认为,之前看到的截图基本准确,然而L1D是16KB的,有可能是超线程导致软件的误判,将L1D平分给了两个逻辑核心
L2容量减小,但是延迟也大大降低
Nehalem增加了二级旁视缓存(TLB),这样在进行段页地址转换的时候,首先在L1 TLB里边检索,如果不命中,再到L2 TLB里边检索,再不命中,从缓存中读取页表,和缓存的工作方式类似。这样提高了段页地址转换的效率,对服务器很有帮助。

Nehalem的系统互联:

双路服务器和桌面高端结构比较一致,都含有三通道的DDR3 内存控制器,每通道支持3 DIMM,这样应该是每核心支持36GB内存,双路支持72GB。内存最高支持到DDR3 1333 。CPU和北桥通过QPI总线连接。这样,Tylersburg就身无旁骛,堆PCIe控制器好了……

Nehalem的内存控制器,强调了低延迟:


[ 本帖最后由 itany 于 2008-3-28 00:28 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
发表于 2008-3-18 11:58 | 显示全部楼层
:loveliness:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

发表于 2008-3-18 12:01 | 显示全部楼层
:a)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

发表于 2008-3-18 12:04 | 显示全部楼层
:wub:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

发表于 2008-3-18 12:19 | 显示全部楼层
头牌:devil:
回复 支持 反对

使用道具 举报

发表于 2008-3-18 12:21 | 显示全部楼层
华丽啊~~有说到功耗么?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-3-18 12:23 | 显示全部楼层
多谢站长了!不然很快又沉了~
回复 支持 反对

使用道具 举报

发表于 2008-3-18 12:38 | 显示全部楼层
不错,就等测试
回复 支持 反对

使用道具 举报

发表于 2008-3-18 12:48 | 显示全部楼层
主流桌面版没有集成MC,想来也不会有那么大的L3,极限频率估计也比不上现在的45nm肉,intel现在不出高频CPU莫非就是这个原因?
回复 支持 反对

使用道具 举报

发表于 2008-3-18 12:55 | 显示全部楼层
这样说还是在Core架构上改的?
回复 支持 反对

使用道具 举报

发表于 2008-3-18 12:55 | 显示全部楼层
据说有好多东西要到IDF上说,搞的人家心痒痒的:a)
回复 支持 反对

使用道具 举报

发表于 2008-3-18 13:06 | 显示全部楼层
估计八核心默认频率算100m pi 小于10 's了,很黄,很陈冠希:lol:
回复 支持 反对

使用道具 举报

发表于 2008-3-18 13:09 | 显示全部楼层
4月上海见! :lol:
回复 支持 反对

使用道具 举报

头像被屏蔽
发表于 2008-3-18 13:11 | 显示全部楼层
说了半天就是没提到跑得频率

初期能不能过得去2.6G呢
回复 支持 反对

使用道具 举报

头像被屏蔽
发表于 2008-3-18 13:29 | 显示全部楼层
由于台式机版本没有集成mc,nehalem对penryn的改进都可以忽略不计,或看成penryn的新步进。这种改进带来的性能提升说不定还没有南桥改进的贡献明显.

对服务器,就是天壤之别。
回复 支持 反对

使用道具 举报

发表于 2008-3-18 13:29 | 显示全部楼层
第一页不行了~:(
回复 支持 反对

使用道具 举报

发表于 2008-3-18 13:30 | 显示全部楼层
看这个结构45NM Nehalem VS 45NM K10不会出现65NM CORE2 VS 65NM K8时那么大的差距。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-3-18 13:33 | 显示全部楼层
原帖由 acqwer 于 2008-3-18 12:48 发表
主流桌面版没有集成MC,想来也不会有那么大的L3,极限频率估计也比不上现在的45nm肉,intel现在不出高频CPU莫非就是这个原因?


谁说主流桌面没有集成MC和8M L3了啊?
回复 支持 反对

使用道具 举报

发表于 2008-3-18 13:42 | 显示全部楼层
这个员工好像口罩没戴好啊,扣他工资:lol:
回复 支持 反对

使用道具 举报

发表于 2008-3-18 13:50 | 显示全部楼层
赞啊:thumbsup:
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-3-29 05:45

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表