POPPUR爱换
标题: 秒杀上代旗舰 英特尔SNB-E处理器首测 [打印本页]
作者: 别整没用的 时间: 2011-11-15 09:52
标题: 秒杀上代旗舰 英特尔SNB-E处理器首测
时隔三年 旗舰平台迎来升级
◇ 时隔三年 旗舰平台迎来升级
这是一款早在一年前就放出消息的处理器、这是一艘新的处理器“旗舰”、这是一款针脚数接近上一代旗舰两倍的处理器,这就是今天的主角——Sandy Bridge-E。2011年11月14日(北京时间2011年11月15日),英特尔将正式发布Sandy Bridge-E处理器,这款处理器将沿袭Sandy Bridge架构,采用崭新的LGA 2011接口标准。在时隔三年之后,X58也终于迎来了第一次升级——旗舰芯片组X79也将在同一时间面世,玩家们期待的性能盛宴也即将开始。
上一次我们编写这样的文章还是在2008年,届时正是第一代Nehalem架构酷睿i7处理器发布的时候,采用三通道内存系统的X58和酷睿i7平台的确是给我们带来了惊人的性能升级,而这次英特尔发布Sandy Bridge-E 酷睿i7处理器和X79芯片组平台又将带来怎样的性能变化呢?带着这最大的疑问,我们将对其展开一系列评测。
6核12线程 旗舰CPU规格对比
◇ 6核12线程 旗舰CPU规格对比
首先确定的是首批发布的新一代Sandy Bridge-E处理器的旗舰型号Core i7-3960X将采用六颗物理核心的设计,和上一代的旗舰型号Core i7 990X的物理核心数量持平,而超线程技术也依然提供了支持,所以旗舰版的Core i7 3960X处理器将拥有六颗物理核心和十二线程。
Core i7 3960X处理器的频率为3.3GHz,其中外频为100MHz,倍频为33x,而二级缓存为每颗物理核心独享256KB,三级缓存为15MB,TDP(热功耗)为130瓦特,接口标准是LGA 2011。而此前的Core i7 980X和Core i7 990X以及更前一代的i7旗舰产品参数将在下面的表格中详细展示。
Core i7 3960X Extreme Edition 核心架构示意图
比较显眼的是Core i7 3960X采用了新的接口,内存通道也由之前的三通道升级为四通道。当然,三级缓存的扩大也能给Core i7 3960X带来不小的性能提升。
首批发布的Sandy Bridge-E产品有三款,分别是Core i7-3820、Core i7-3930K和Core i7-3960X Extreme Edition,其中Core i7-3820为四核八线程设计,拥有10MB的L3缓存,主频为3.6GHz,动态加速频率最高达3.9GHz;Core i7-3930K和Core i7-3960X为六核十二线程设计,分别拥有12MB和15MB的L3缓存,主频为3.2GHz和3.3GHz,动态加速频率最高可达3.8GHz及3.9GHz。三款处理器的TDP均为130W,需搭配X79芯片主板使用。
超线程依然支持 多任务依然给力
◇ 超线程依然支持 多任务依然给力
Core i7-3960X Extreme Edition并未单纯的六核心处理器,实际上我们在由Core i7-3960X Extreme Edition所构架的系统中能够看到十二条线程在工作,这就是英特尔的超线程技术在起作用(Intel HyperThreading)。
那么超线程的机制是什么?首先我们都知道CPU在运行任务时通常不会是所有管线全负荷运作——这就造成了一种资源的浪费,这是不利于工作效率提高的,而英特尔的HyperThreading技术则将这些空余的管线集中起来识别为另一颗核心。
十二线程同时工作
系统也识别出了十二颗CPU核心
基于这项技术,在实际工作中HyperThreading通过特殊的处理方式将一颗物理核心识别为两颗逻辑核心,一分为二,六颗物理核心的处理器自然也就变成了拥有十二颗逻辑核心的“十二核心处理器”。
十二颗核心同时渲染的盛况
六核心十二线程,Core i7 3960X Extreme Edition实际上已经不能说是简单的六核心处理器了,在实际测试中她的性能也超过了正常六核心的性能。在当前软件对多线程的支持度越来越高的情况下,六核心十二线程乃至更多核心和线程的产品才是未来的真正趋势。
睿频技术仍然在 自动超频很省心
◇ 睿频技术仍然在 自动超频很省心
其实睿频加速技术在2008年就已经发布,最早出现在英特尔Nehalem架构Core i7平台上,睿频加速技术的核心在于:在控制功耗不超过Intel限定范围的前提下最优化计算机的资源利用。睿频加速技术能够在需要的时候将频率自动提升,而在不需要的时候将频率和电压降低以节省消耗。
睿频技术示意
在负载低时自动降低频率
在执行单任务的时候Core i7 3960X Extreme Edition会将单颗核心的频率提升到最高睿频频率,这样能够最优化单核心(双线程)的性能,而其他核心则降低频率以避免不必要的功耗浪费;而在执行高负载多任务时Core i7 3960X Extreme Edition则将六颗核心(十二线程)分别提升至一个较低的频率上,这样则能够在控制功耗的同时最优化程序执行性能。
双通道不算啥 SNB-E四通道Ready
◇ 双通道不算啥 SNB-E四通道Ready
在2004年至2005年间,DDR内存的双通道系统出现,双通道内存系统带来的位宽和带宽的提升是明显的,也正是在那个时候,DDR内存才被所有消费者认可为最强的内存系统。也不过就过去了三年,X58和Nehalem处理器所带来的三通道DDR3内存构架正式被Intel所推出,而双通道的顶级性能也被三通道所带来的强大性能提升所取代,最强内存性能的代表转移到了三通道内存上。
而历史貌似总是惊人地相似,同样是在时隔三年之后的现在,Core i7 3960X Extreme Edition和X79芯片组所带来的将是完全超越三通道的四通道内存架构,这又将引起新一轮的性能升级。
X79处理器上的内存接口非常壮观
内存通道变成了“Quad”
英特尔原厂X79主板的设计风格更偏向于高端DIY主板的风格,事实上三大一线厂商所推出的X79主板基本上都采用了同样的内存通道布局,这一“王”字布局法更加适合于X79芯片组的内存架构发挥。
四通道内存系统非常显眼
内存的作用就是交换数据,事实上三级缓存和二级缓存的作用也是类似,而四通道内存系统的升级也让内存带宽更加接近三级缓存的带宽,如果刨去验证机制,那么四通道内存的性能也已经和三级缓存性能非常接近了,即使是未来某一天三级缓存因为内存过分强大的性能而失去应有的作用(或成为性能瓶颈),那么我们也不用对此过分惊讶。
四通道实装 64位系统将成主流?
◇ 四通道实装 64位系统将成主流?
四通道带来的性能提升是显而易见的,不过同时也存在一些问题,那就是目前的32位系统最多只能支持到3.2GB容量的内存,而四通道情况下即使都采用单挑1GB的内存条也将达到4GB容量,所以32位系统对于Core i7 3960X Extreme Edition和X79芯片组来说已经不再适用了。
32位系统连使用双通道内存都有困难
64位的Windows系统将成大趋势
所以,对高规格硬件支持度更高的64位Windows系统在Sandy Bridge-E时代理应成为必然。64位系统早在6年之前就已经发布了,而32位系统则也已经逐渐走到了悬崖边,被淘汰也已经成为必然,而Sandy Bridge-E处理器的发布也进一步敲响了32位时代的“丧钟”。
指令集提升 更新多媒体指令集加入
◇ 指令集提升 更新多媒体指令集加入
在Sandy Bridge处理器发布之初,我们就已经介绍过AVX指令集的加入,AVX是在之前的128bit扩展到和256bit的SIMD(Single Instruction, Multiple Data)。而Sandy Bridge的SIMD演算单元扩展到256bits的同时数据传输也获得了提升,所以从理论上看CPU内核浮点运算性能提升到了2倍。
AVX指令集的特点:
>>从128bit扩展到256bit的SIMD运算单元;
>>增强的数据重排,单个操作可同时处理8个32-bit共256bit数据
>>单条指令支持3操作数和4操作数
>>支持弹性的访存地址不对齐
>>AVX指令支持VEX前缀
AVX指令集
这些运算逻辑上的技术细节让人头大,落实到应用上,AVX主要针对密集型浮点运算,3D游戏、CAD/CAM、数字内容创建等应用是这类计算的代表。Intel宣称,Sandy Bridge的AVX进行矩阵计算的时候将比SSE技术快90%!
核心面积的精简正是AVX指令(SNB最主要革新之一)集得以实现并保证良好性能的关键所在。以最小的核心面积代价,Intel将所有SIMD单元都转向了256-bit。
AVX指令集
AVX支持256-bit操作数,相当消耗晶体管与核心面积,而RPF的使用加大了乱序执行缓冲,能够很好地满足更高吞吐量的浮点引擎。
SNB允许256-bit AVX指令借用128-bit的整数SIMD数据路径,这就使用最小的核心面积实现了双倍的浮点吞吐量,每个时钟可以进行两个256-bit AVX操作。另外执行硬件和路径的上位128-bit是受电源栅极(Power Gate)控制的,标准128-bit SSE操作不因为256-bit扩展增加功耗。
环形总线优势延续
◇ 环形总线优势延续
Nehalem/Westmere每个核心都与三级缓存单独相连,都需要大约1000条连线,而这种做法的缺点是如果频繁访问三级缓存,效果可能不会太好。
SNB又整合了GPU图形核心、视频转码引擎,并共享三级缓存。Intel并没有沿用此前的做法,再增加2000条连线,而是像服务器版的Nehalem-EX、Westmere-EX那样,引入了环形总线(Ring Bus),每个核心、每一块三级缓存(LLC)、集成图形核心、媒体引擎、系统助手(System Agent)都在这条线上拥有自己的接入点,形象地说就是个“站台”。
第二代智能酷睿处理器核心架构
这条环形总线由四条独立的环组成,分别是数据环(DT)、请求环(QT)、响应环(RSP)、侦听环(SNP)。每条环的每个站台在每个时钟周期内都能接受32字节数据,而且环的访问总会自动选择最短的路径,以缩短延迟。随着核心数量、缓存容量的增多,缓存带宽也随时同步增加,因而能够很好地扩展到更多核心、更大服务器集群。
三级缓存的延迟也从大约36个周期减少到26-31个周期。此前预览的时候我们就已经感觉到了这一点,现在终于有了确切的数字。三级缓存现在被划分成多个区块,分别对应一个CPU核心,都在环形总线上有自己的接入点和完整缓存管线。每个核心都可以访问全部三级缓存,只是延迟不同。此前三级缓存只有一条缓存管线,所有核心的请求都必须通过它,现在很大程度上分而治之了。
和以前不同的是,三级缓存的频率现在也和核心频率同步,因而速度更快,不过缺点是三级缓存也会随着核心而降频,所以如果CPU降频的时候GPU又正好需要访问三级缓存,速度就慢下来了。
2011年接口升级 2011接口出台
◇ 2011年接口升级 2011接口出台
由于规格的大范围升级,内部晶体管数量增多等等原因,LGA 1155和LGA 1366接口俨然已经不够用了,所以英特尔在Sandy Bridge-E平台上隆重推出了接口针脚数高达2011个之多的LGA 2011接口标准,巧合的是今年也正好是2011年,真不知道这是英特尔刻意为之还是真的只是一个巧合……
其实仔细观察一下LGA 1155接口的第二代英特尔智能酷睿处理器的背面就可以发现:处理器背面的触点真的已经是到了密密麻麻的程度了,而LGA 2011接口几乎比LGA 1155接口的触点数量多了一倍,所以处理器的体积自然也是增大了不少。

LGA 2011接口的Core
i7 3960X Extreme Edition

LGA 1366的上代旗舰和上上代旗舰处理器
接口改变 底座也相应变得复杂了不少
当然,上面的CPU背部触点的照片并非真实大小的对比,只是让大家对LGA 2011的触点有一个认识而已,实际上Core i7 3960X Extreme Edition处理器的面积比之前Core i7 980X Extreme Edition处理器面积大了约三分之一,这也和她们之间的CPU触点数量对比基本吻合。
最后,这意味着之前的主板都无法兼容Sandy Bridge-E处理器,想要升级处理器就必须要将CPU和主板一并升级才行,就是同期发布的X79芯片组。
规格更强大 X79平台简介
◇ 规格更强大 X79平台简介
随同Sandy Bridge-E处理器发布的是英特尔X79芯片组,正如处理器方面的旗舰换代一样,X79芯片组的发布正是为了取代此前的旗舰芯片组X58,实际上从LGA 775平台开始,X系列的芯片组就是英特尔旗舰平台的代表,而除此之外的其他同时代芯片组最多被称为高端,而无法被称为旗舰。
LGA 2011接口成为新一代的旗舰接口
首先,X79大大增加了阵脚数量,达到了惊人的LGA2011接口。针脚数相比于6系列主板增加了接近一倍,即使LGA1366接口相比也增加了645个。事实上在此前,LGA 1366接口也正是英特尔旗舰平台的载体,而LGA 1155接口则依然是英特尔入门及主流平台的标准接口(Ivy Bridge据称也采用了LGA 1155接口标准)。
原厂X79主板的背部I/O接口
英特尔在X79芯片组的南桥I/O方面并未做出特别大的改进,这与英特尔一贯的谨慎作风脱不开关系,实际上X79南桥并未提供USB 3.0的原生支持,而市面上所有提供USB 3.0接口的主板都采用了第三方的解决方案;同样的,X79整个平台也并未提供PCI-E 3.0的支持。虽然有些遗憾,但事实上是USB3.0可以通过第三方解决方案来提供支持,而PCI-E 3.0通道目前也看不出有任何优势,所以我们完全可以忽略这些接口规格,而将目光完全投到处理器本身的性能上。
SLI/CS 多显卡系统继续支持
◇ SLI/CS 多显卡系统继续支持
在X58刚刚发布的时候,从未将SLI放入支持列表的英特尔终于公开表示将在X58芯片组上全面支持SLI系统,这对当时的NVIDIA粉丝们来说绝对是一个好消息。事实上英特尔一直和ATI之间有着授权合作的良好关系,英特尔历代的主板芯片组都直接提供了CrossFire交火系统的支持,而X58时代加入SLI系统的进化也代表着英特尔再一次巩固了对硬件平台的掌控力,而对于消费者来说,谁会嫌弃功能太多呢?
SNB-E和X79平台提供了40个PCI-E 2.0通道
PCI-E系统可根据主板厂商需求自由组合
从上面的图中,我们看到SNB-E处理器提供了40个PCI-E 2.0通道,而这些通道可以做相对自由的组合,具体解决方案还是主板厂商来决定,比如:16+16+8的组合、16+8+8+8组合、16+8+8+4+4的组合等等都完全没有问题。

四通道内存系统所带来的提升是显而易见的,在这一项目的测试中,Core i7 3960X处理器获得了2618的高分,这一得分比此前Core i7 980X的得分高出了20%之多。
PCMark Vantage—整机效能
◇ PCMark Vantage—整机效能
PCMark Vantage可以衡量各种类型PC的综合性能。从多媒体家庭娱乐系统到笔记本,从专业工作站到高端游戏平台,无论是在专业人士手中,还是属于普通用户,都能在PCMark Vantage里了解透彻,从而发挥最大性能。在这里,我们需要注意的不仅仅是PCMark Vantage的总分,还需要注意其Communications(通讯)子项。

《
作者: mooncocoon 时间: 2011-11-15 10:04
intel再次严令我们不准与推土机平台进行对比,因此所有的AMD平台成绩均未出现。
抱歉了诸位……
作者: xf-108 时间: 2011-11-15 10:23
芯片面积高达435mm2,提升了75.4%,晶体管数目高达22.7亿,提升了94%。
就这么点性能提升,我觉得太不值当了。
作者: acqwer 时间: 2011-11-15 10:40
xf-108 发表于 2011-11-15 10:23 
芯片面积高达435mm2,提升了75.4%,晶体管数目高达22.7亿,提升了94%。
就这么点性能提升,我觉得太不值当 ...
屏蔽了2个核心的结果。
作者: xf-108 时间: 2011-11-15 10:51
acqwer 发表于 2011-11-15 10:40 
屏蔽了2个核心的结果。
所以太亏太亏了,这么大面积。
作者: shuhingking 时间: 2011-11-15 11:07
b表示荷包压力太大!!
作者: amd```fans 时间: 2011-11-15 11:20
xf-108 发表于 2011-11-15 10:51 
所以太亏太亏了,这么大面积。
确实如此。完整版应该是8C 20M L3
同为32nm的Gulftown面积只有2xxmm2
6C SNB-E每mm2性能反而倒退了
作者: itany 时间: 2011-11-15 12:01
本帖最后由 itany 于 2011-11-15 12:01 编辑
我上一个图来对照一下就知道核心面积是怎么用掉的了。
这个是Sandy Bridge E和普通4C的对照。(比例已经调整过了)
[attach]1686382[/attach]
其实可以看出,E和4C的面积主要差在Sys Agent和Mem Ctrl上边了。
从双通道内存增加到4通道内存,面积并不是简单增加,而是增加到4倍。
我认为,主要是由于增加一切企业级的特性导致的,比如ECC等。
另外考虑到核心有阉割版,L3缓存也有,但是内存通道并没有,所以很可能是有冗余的。
另外SA也几乎增加到原来的四倍。我认为:
PCIe 3.0和2.0的编码方式有所不同,保持向下兼容需要增加较多的面积。
另外由于是双路系统,还有至少一根QPI总线,也占了部分面积。
部分企业级特性等。
冗余
再加上L3缓存稍微增加了一些,总之占了原本属于iGP的管芯面积。
所以,最后从4核心到8核心面积翻翻。我认为这也是Intel的计划之中的事情……
作者: itany 时间: 2011-11-15 12:03
amd```fans 发表于 2011-11-15 11:20 
确实如此。完整版应该是8C 20M L3
同为32nm的Gulftown面积只有2xxmm2
6C SNB-E每mm2性能反而倒退了
废料利用不算浪费……
要考虑良率呢
作者: readma 时间: 2011-11-15 12:20
快出来吧
作者: aibo 时间: 2011-11-15 12:40
这货就是给服务器用的
民用一般用不上这么大的缓存,2条QPI也毫无用处
作者: pikaqiuuuu 时间: 2011-11-15 12:53
提示: 作者被禁止或删除 内容自动屏蔽
作者: lacri 时间: 2011-11-15 13:05
总的来说,我认为没有老I7经典。
作者: cobra_woo 时间: 2011-11-15 14:08
26K 25k也没出现的说
作者: KeyGen 时间: 2011-11-15 14:13
太强大了,用不到,不浪费。
作者: 东方未明 时间: 2011-11-15 15:09
mooncocoon 发表于 2011-11-15 10:04 
intel再次严令我们不准与推土机平台进行对比,因此所有的AMD平台成绩均未出现。
抱歉了诸位……
推土机还需要对比
作者: genesisx 时间: 2011-11-15 15:35
话说我看到有介绍e3-1230支持“双通道pcie”而26k不支持,这是什么意思?不会是指双路or单路吧?跟文章里说的40个通道的pcie有没有一样?
作者: greedningg 时间: 2011-11-15 16:02
没有2600K的对比,看来和2600K差距不算太大了!
作者: redblue 时间: 2011-11-15 17:36
和楼上同问与2600k的性能对比!
作者: xf-108 时间: 2011-11-16 11:08
本帖最后由 xf-108 于 2011-11-16 11:10 编辑
amd```fans 发表于 2011-11-15 11:20 
确实如此。完整版应该是8C 20M L3
同为32nm的Gulftown面积只有2xxmm2
6C SNB-E每mm2性能反而倒退了
就算去掉多余的两个核和缓存,剩下的面积依然有370吧,原生6核370,上一代的6核才240……
按道理,SNB相比WSM,核心+缓存基本一样,性能提升15%-20%,结果却落得这个下场……
作者: amx004 时间: 2011-11-16 11:36
性能还凑合, 不过没什么吸引力的说
看22nm了
作者: itany 时间: 2011-11-16 11:42
xf-108 发表于 2011-11-16 11:08 
就算去掉多余的两个核和缓存,剩下的面积依然有370吧,原生6核370,上一代的6核才240……
按道理,SNB ...
Sandy Bridge是集成北桥的,多了PCIe,增加了一个电源控制单元,多了内存驱动和Agent
作者: frankincense 时间: 2011-11-16 11:49
xf-108 发表于 2011-11-16 11:08 
就算去掉多余的两个核和缓存,剩下的面积依然有370吧,原生6核370,上一代的6核才240……
按道理,SNB ...
你要考虑,一颗SandyBridge-E相当于一颗Westmere-EP+X58。
3路40条PCI-E总线控制器以及增加的一通道内存控制器,尤其是PCI-E控制器面积可不比一个核心少哦
作者: xdy13 时间: 2011-11-16 12:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: Sirlion 时间: 2011-11-16 12:07
真的,连q8都出来战了,怎么snb平台一个都没出现?intel还勒令不许和snb平台一起比较么?
作者: xf-108 时间: 2011-11-16 13:11
itany 发表于 2011-11-16 11:42 
Sandy Bridge是集成北桥的,多了PCIe,增加了一个电源控制单元,多了内存驱动和Agent
不过X58北桥是65nm制程?
如你所说,那个内存控制器实在太变态太庞大了……
作者: itany 时间: 2011-11-16 15:06
xf-108 发表于 2011-11-16 13:11 
不过X58北桥是65nm制程?
如你所说,那个内存控制器实在太变态太庞大了……
北桥的各种驱动电路是模拟的,随着制程缩小的比例不如CPU内核那样好
作者: greedningg 时间: 2011-11-16 19:52
xdy13 发表于 2011-11-16 12:00 
都把2600k秒飞了。。。等降价入手,一次到位的时候快到了
4核对4核应该不会秒飞吧!
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) |
Powered by Discuz! X3.4 |