|
今天比较高兴
谈一下近期英特尔披露的信息里,可提取一些比较受关心的话题:
1.nehalem的效能与功耗效率相对上代的提升幅度有多大? 英特尔承诺是提升可观,具体幅度约相当于CORE2对比Dothan(90nm Pentium-M)的提升。
2.nehalem是基于CORE2发展而来,而nehalem的分支开销将低于CORE2。如此看来nehalem分支预测性能进步很大或流水线长度变化较为有限。
3.nehalem的同时多线程效率? 英特尔承诺是大约提升20-30%。
4.nehalem的乱序执行能力得到进一步扩大,例如:重排序缓冲区(ROB)提升33%由96提高到128。 而保留站RS的容量也将扩大(猜测由32提高到48), 并暗示LODA/STORE BUFFER的容量也将扩大(猜测LOAD BUFFER由32提高到48,STORE BUFFER由24提高到32)。 而LOAD-STORE调度能力会得到进一步改进。
5.多级缓存:L1D 32KB, L1I 32KB, 而L2延迟极低,容量256KB, L3 8MB。 (有些安腾IA64的影子? 安腾L2就是256KB,而L3很大)要是如此看来,集成内存控制器就有点多余。可能是因为FSB的带宽有些小吧?若FSB带宽低于3通道DDR3,跑内存带宽型应用还是受到了限制的。 看了核心大图,有点个人猜想, 32KB的L1I似乎是2X16KB,双前端有两个指令缓存,一个线程分配一个16KB的L1I; 或者说对于单线程软件,其看到的nehalem是16KB的L1I指令缓存, 32KB的L1D数据缓存, 256KB的L2, 8MB的L3。
6.点对点QPI(CSI)接口:QPI链路带宽的速度6.4GB,系统总带宽可达25GB。 可靠性自适应能力强,自我维护性很好, 甚至可以热插拔。 |
|