POPPUR爱换

标题: 惊现】缺失SEE4指令集 奔腾双核E5200性能暴降 [打印本页]

作者: xgdg    时间: 2009-2-8 14:43
标题: 惊现】缺失SEE4指令集 奔腾双核E5200性能暴降
测试前言:近期Intel奔腾E5200可谓风光无限,这款超频悍将一上市就受到了玩家们的追捧,视为千元内最具购买价值的产品,超频后性能更是直追老大哥E7200。与Intel E7200相比,E5200缺失的是1M的二级缓存,0.03G的主频差距以及SEE4.1指令集的支持。就应用而言,主频的差距体现到性能上几乎可以忽略不计,1M二级缓存的差距也是微乎其微,而对于很多普通的用户而言,缺失SEE4.1指令集到底意味着什么呢?貌似在主流的应用中,SEE4.1指令集的作用并不明显。那么,SEE4.1指令集到底是不是可有可无的鸡肋呢?SEE4.1指令集是什么,缺失了SEE4.1指令集,对于E5200的性能发挥有着什么样的影响?为此,我们IT世界网CPU/存储频道特别组织了本次评测,力求在实际的应用中,为大家证明SEE4.1指令集的实用意义所在。Intel挥刀自宫,奔腾双核E5200独缺SSE4.1
  在广大玩家的热切期盼下,Intel终于发布了定位主流的45nm双核处理器,型号为奔腾双核E5200。与中高端的E8200、E7200一样,奔腾双核E5200基于45nm Wolfdale核心,主频高达2.5GHz,外频和倍频分别为200MHz和12.5X。二级缓存从E7200的3MB削减至2MB,核心内部晶体管数量则保持不变。
奔腾双核E5200伴随削减诞生,这符合Intel削减硬件规格达到区分产品档次的习惯。然而让玩家没有想到的是,与往常削减二级缓存不同,奔腾双核E5200没有集成SSE4.1指令集。这种剥夺某种属性的做法,让人想起了被夺去了二级缓存的第一代赛扬。
  按照Intel的Tick-Tock策略,45nm Prenyn架构改良自65nm Conroe架构。其中45nm工艺使晶体管数量达到4.1亿个、High-K金属栅极减少了晶体管间的漏电现象、16位除法器的增加以及加强多媒体性能SSE4.1指令集,是45nm Prenyn架构明显区别于65nm Conroe架构的主要特点
不少玩家反映,奔腾双核E5200并不是严格意义上的45nm Prenyn架构处理器。那么SSE4.1指令集的缺失,会给奔腾双核E5200带来多大的性能损失,消费者有没有必要为这个指令集掏更多的腰包呢?下面,就让笔者带领大家探访一下神奇的指令集世界。

比缓存更重要,指令集的发展
  处理器的运作是通过指令完成的,通过程序员编写的各式指令,处理器可以完成各种任务,因此高效的指令是提高微处理器性能的最有效途径之一。在计算机早期的发展过程中,各种程序需要相配合的指令都集成到CPU中。但是随着技术的发展,处理器集成的指令越来越多,其架构亦越发臃肿。而技术人员在研究过程中发现,约有80%的程序只用到了20%的指令。为了避免冗余的指令影响到了处理器的工作效率,精简指令集的概念诞生了。
 精简指令集RISC是(Reduced Instruction Set Computing)的缩写,RISC指令集的指令数目少,而且每条指令采用相同的字节长度,一般长度为4个字节,并且在字边界上对齐,字段位置固定,特别是操作码的位置。另外,RISC指令集采用寄存器到寄存器的操作方式,只以简单的Load(读取)和Sotre(存储)操作访问内存地址。因此,每条指令中访问的内存地址不会超过1个,指令访问内存的操作不会与算术操作混在一起。精简指令集可以大大简化处理器的控制器和其他功能单元的设计。
现在的桌面处理器都基于X86指令集,为了让处理器拥有更强的性能,Intel和AMD都为其产品开发扩展指令集。MMX、SSE、SSE2、SSE3、SSSE3、3DNow!等都是我们熟悉的扩展指令集,增强了处理器在多媒体、图形图象和网络等应用的处理能力。为了方便记忆,我们通常将这些都统称为处理器的指令集。
  有了这些指令集,程序员在编写软件的过程中可以直接调用相关的指令,精简了大量的语句,极大地提高了处理器的工作效率。相信熟悉处理器发展的资深玩家都记得,当年MMX指令集的采用,让奔腾处理器拥有了流畅解码VCD和MP3的能力。

术业有专攻,SSE4.1增强多媒体性能
  而此次讨论的主角SSE4.1,是SSE4(Streaming SIMD Extension 4)指令集的第一个版本,Intel宣称是2001年以来最重要的媒体指令集架构的改进。除扩展Intel 64指令集架构外,还加入有关图形、视频编码及处理、三维成像及游戏应用等指令,令涉及音频、图像和数据编码算法的应用程序大幅受益。
Intel指出,加入的SSE4指令集让45nm Penryn处理器增加了2个不同的32Bit向量整数乘法运算单元,并加入8位无符号(Unsigned)最小值及最大值运算,以及16Bit及32Bit有符号 (Signed) 运算。在面对支持SSE4指令集的软件时,可以有效的改善编译器效率及提高向量化整数及单精度代码的运算能力。同时,SSE4改良插入、提取、寻找、离散、跨步负载及存储等动作,令向量运算进一步专门化。
  SSE4还计入了六条浮点运算指令,支持单精度、双精度浮点运算及浮点产生操作,可立即转换其路径模式,大大减少延误,这些支持将会在3D游戏及对浮点运算能力非常敏感的领域起到积极的效果。
  此外,SSE4指令集还加入了串流式负载指令,能够提升帧缓冲区的读取数据频宽,理论上可获取完整的快取缓存行,即每次读取64Bit而非8Bit,并可以将其保存在临时缓冲区内,让支持SSE4指令集的读取频宽效能提升最高至8倍。
SSE4指令集进一步强讯编码效果,例如可同时处理8个4-byte宽度的SAD(Sums of Absolute Differences)运算,常用于新一代高清影像编码如VC.1及H.264等规格中,令视频编码速度进一步提升。这是Intel宣称双核处理器软解高清视频,同样可以获得流畅、高质量播放效果的原因。


SSE4到底有多高效,下面这个例子可以告诉你
  据了解,在进行视频编码时需要进行动态预测(Motion Estimation)及差分编码方式去除相邻2张影像之相关性,这是一个非常复杂的运算动作。在没有SSE4指令集时,完成一个步骤需要以下指令语句。
for (int moveblock=0;moveblock<16;moveblock++)
for(int line=0; line<16; line++) // Does the 16 pixels large in 4 iteration
{
int i=0;
sum0+=abs( pBlock1[j]-pBlock2)+abs(pBlock1[j+1]-pBlock2[i+1])+abs(pBlock1[j+2]-pBlock2[i+2])+abs(pBlock1[j+3]-pBlock2[i+3]); // Compare with 0 pixel offset
sum1+=abs(pBlock1[j+1]-pBlock2)+abs(pBlock1[j+2]-pBlock2[i+1])+abs(pBlock1[j+3]-pBlock2[i+2])+abs(pBlock1[j+4]-pBlock2[i+3]); // Compare with 1 pixel offset
sum2+=abs(pBlock1[j+2]-pBlock2)+abs(pBlock1[j+3]-pBlock2[i+1])+abs(pBlock1[j+4]-pBlock2[i+2])+abs(pBlock1[j+5]-pBlock2[i+3]); // Compare with 2 pixel offset
sum3+=abs(pBlock1[j+3]-pBlock2)+abs(pBlock1[j+4]-pBlock2[i+1])+abs(pBlock1[j+5]-pBlock2[i+2])+abs(pBlock1[j+6]-pBlock2[i+3]); // Compare with 3 pixel offset
sum4+=abs(pBlock1[j+4]-pBlock2)+abs(pBlock1[j+5]-pBlock2[i+1])+abs(pBlock1[j+6]-pBlock2[i+2])+abs(pBlock1[j+7]-pBlock2[i+3]); // Compare with 4 pixel offset
sum5+=abs(pBlock1[j+5]-pBlock2)+abs(pBlock1[j+6]-pBlock2[i+1])+abs(pBlock1[j+7]-pBlock2[i+2])+abs(pBlock1[j+8]-pBlock2[i+3]); // Compare with 5 pixel offset
sum6+=abs(pBlock1[j+6]-pBlock2)+abs(pBlock1[j+7]-pBlock2[i+1])+abs(pBlock1[j+8]-pBlock2[i+2])+abs(pBlock1[j+9]-pBlock2[i+3]); // Compare with 6 pixel offset
sum7+=abs(pBlock1[j+7]-pBlock2)+abs(pBlock1[j+8]-pBlock2[i+1])+abs(pBlock1[j+9]-pBlock2[i+2])+abs(pBlock1[j+10]-pBlock2[i+3]); // Compare with 7 pixel offset
i=4;
j=moveblock+4;

… }
}
   一大串的指令极度浪费处理器资源,而在支持SSE4指令集的处理器上,只需要采用4 SAD运算指令:
MPSADBW xmm0,xmm1,0
  便完全代替了以上繁复的指令串,大幅提升动态预测(Motion Estimation)及差分编码的运算速度。
  可以看到,SSE4指令集可以大大提高处理器的工作效率。而对于程序员来说,编写基于SSE4指令集的软件不但节省精力,而且可以获得更为高效的软件产品。那么SSE4.1的缺阵,会给奔腾双核E5200带来怎样的性能影响呢?

测试平台和测试说明硬件测试平台
CPUIntel Pentium Dual-Core E5200(2.5GHz,200MHz,2MB L2)
Intel Pentium Dual-Core E7200(2.53GHz,266MHz,3MB L2)
内存威刚 红色威龙 DDR2-800 2GB×2(5-5-5-18)
硬盘西数 Caviar Black WD1001FALS 1TB 32MB
主板微星 P45 Platinum
显卡Nvidia 8800GT 512MB
电源TT 700W
软件测试平台
操作系统English Windows Vista SP1 (DirectX 10 Ready)
主板驱动Intel Chipset Device Software 9.0.0.1011
显卡驱动NVIDIA Geforce 179.16 For Vista 32bit WHQL
测试项目
系统性能测试 PCMark Vantage
高清视频编码VirtualDubMod
  为了测试SSE4.1指令集被削减,对奔腾双核E5200带来的影响,笔者选择了拥有SSE4.1指令集的Core 2 Duo E7200作为对比。由于Core 2 Duo E7200的二级缓存只有3MB,仅比奔腾双核E5200多出1MB,这可以减少二级缓存带来的误差。同时为了减少前端总线带来的误差,笔者将奔腾双核E5200超频至2.53GHz(266MHz×9.5),此时主频比默认提高30MHz。
  为了彻底除去二级缓存带来的误差,笔者首先用PCMark Vantage,以上测试内容均不支持SSE4.1指令集。随后,笔者通过视频编码软件VirtualDubMod,将指定时间长度的1080P高清视频压缩。在此使用了Divx 6.8编码器,它是第一款支持SSE4.1指令集的编码器。

系统性能测试——二级缓存影响甚微
  PCMark Vantage完全基于Vista操作系统,更加全面地衡量PC的综合性能,其中处理器测试基于数据加密、解密、压缩、解压缩、图形处理、音频和视频解码、文本编辑、网页渲染、邮件功能、处理器人工智能游戏测试、联系人创建与搜索,将日常遇到的应用都考虑在内;另外图形测试得到了增强,高清视频播放成为重点考虑对象,并加入了3DMark的一些游戏测试项目。
在不支持SSE4.1指令集的测试中,1MB二级缓存差异,并没有使主频相同的E5200与E7200出现较大差距。即使是差距最大的游戏子项中,奔腾双核E5200亦仅落后4%。笔者可以相信,奔腾双核E5200削减SSE4.1指令集,是为了拉大其与中高端处理器的性能差距。

高清视频编码——奔腾双核E5200成绩暴跌14%
 SSE4.1指令集着重于改善处理器在多媒体应用中的表现,特别是高清视频的软解码以及编码能力。而最新的Divx 6.8编码器除了加入多线程支持外,同时加入了SSE4.1指令集的支持。
  在测试中笔者将5分钟的1080P高清片段,压缩为分辨率640×480的视频。在Divx 6.8编码器的设置中,Core 2 Duo E7200可以激活设置中的SSE4.1选项。首先笔者测试了关闭SSE4.1指令集下,两款处理器编码视频的耗时,可以看到Core 2 Duo E7200获得了7秒的优势。
  而当笔者激活Core 2 Duo E7200的SSE4.1指令集后,整个编码耗时比奔腾双核E5200减少了53秒之多。也就是说,如果用户编码1小时左右的高清视频,将可以节省10分钟左右的时间(按之前测试的5分钟视频可节省1分钟。

测试总结和购买建议——E5200非唯一选择
  从测试成绩看到,一方面奔腾双核E5200凭借45nm工艺,获得了较高的主频。但在明显区别于已有奔腾双核外,与中高端产品相差无几的表现,让Intel显得相当尴尬。也就是说,仅仅削减二级缓存,已经不能在奔腾双核E5200身上起到划分市场定位的目的。
  由于软件的全面支持需要一段时间,因此SSE4.1指令集被削减后,奔腾双核E5200还能维持一段时间的性价比。而当奔腾双核E5200在应用中出现不足后,又可以驱使主流消费者再次投资。从笔者掌握的测试数据来看,在未来SSE4.1指令集被普遍支持的软件环境下,奔腾双核E5200将落后20%—25%左右。因为在实际使用中,还要算上二级缓存以及前端总线等带来的性能差异。
  对于打算体验45nm工艺的用户来说,目前报价635元的奔腾双核E5200性价比明显不高。因此,笔者建议直接购买散装Core 2 Duo E7200,目前售价仅750元,却拥有更为纯正的45mn Prenyn血统,从日后主流的应用来说,拥有SSE4.1指令集的E7200依然有相对于E5200的绝对优势,当然,如果你只想买一个玩游戏的CPU的话,那么选择E5200也无可厚非。
另外,虽然玩家可以通过超频让奔腾双核E5200提高性能,但是对于广大主流消费者来说,超频只是一个陌生的词语。
作者: coolkecool    时间: 2009-2-8 14:54
这种帖子最容易引起争吵
作者: china17    时间: 2009-2-8 14:58
等游戏和办公软件支持SSE4.1先
作者: wukefei1219    时间: 2009-2-8 15:01
这帖子,唉,一般用户谁能用的上那SSE4.1
作者: aijian    时间: 2009-2-8 15:37
按需购买。。。。。。
作者: fox990    时间: 2009-2-8 15:43
SSE4.1普及了,U也该换了.
作者: 飞鸟真    时间: 2009-2-8 15:48
那个粘了2个5200的奔腾四核什么时候出来?:a)
作者: Sirlion    时间: 2009-2-8 15:58
如果真的普及了,你别说什么5200,65nm系列全军覆没
什么Q6600 Q6700一样game over

别以为就5200死的惨……
作者: dos    时间: 2009-2-8 16:12
现在用不上,等不够了再换...
作者: L2S    时间: 2009-2-8 16:14
按照某MJ王的逻辑,Intel是在蒙骗消费者
作者: macblue    时间: 2009-2-8 16:17
8# Sirlion

E5是45nm,Q6已该停产了吧
作者: leangelle    时间: 2009-2-8 23:28
提示: 作者被禁止或删除 内容自动屏蔽
作者: leangelle    时间: 2009-2-8 23:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: michaelyao    时间: 2009-2-9 01:12
比较一般用户也不会去用家用机器去做什么高清编码。。大多数买回来也就一高级游戏机。能用的上SSE4.1的软件现在凤毛麟角,倒是L2缓存的大小是目前区分性能的主要因素。
作者: jizhuan001    时间: 2009-2-9 09:42
呵呵 等用上那个指令集了,5200也顶不上了
再说5200才多钱,到时候淘汰了在换E8就是了
作者: elisha    时间: 2009-2-9 10:21
目前报价635元的奔腾双核E5200?

这价格,太乱来了吧
作者: flashbear    时间: 2009-2-9 10:31
这是半年前的帖吧。。。
作者: NONO    时间: 2009-2-9 11:52
一般人不会在意有沒有SSE4.1
价格和主頻才是重奌~~
作者: mmxsse    时间: 2009-2-9 12:41
比较一般用户也不会去用家用机器去做什么高清编码。。大多数买回来也就一高级游戏机。能用的上SSE4.1的软件现在凤毛麟角,倒是L2缓存的大小是目前区分性能的主要因素。
michaelyao 发表于 2009-2-9 01:12



赞同,目前主要是 频率、缓存、核心数
作者: cake3344    时间: 2009-2-9 18:28
提示: 作者被禁止或删除 内容自动屏蔽
作者: lepton    时间: 2009-2-9 19:18
提示: 作者被禁止或删除 内容自动屏蔽
作者: wenxin99    时间: 2009-2-9 19:34
期待Q9650快点降价了。。
作者: tanlwowo    时间: 2009-2-9 20:16
635?现在都快下500了。SSE4.1对媒体才有点用,对其他也没啥影响。
作者: 蒋PJ    时间: 2009-2-9 20:23
看来以后SSe4.1成为区别高低的指标了,彻底L2 下台了,L3冒出来了!
作者: fit206    时间: 2009-2-9 20:40
看看好了~顶顶更健康!
作者: heidarren    时间: 2009-2-9 21:06
各有所需吧。。。。
作者: shylock_y    时间: 2009-2-10 20:04
等游戏和办公软件支持SSE4.1先
china17 发表于 2009-2-8 14:58



.................................................................................
作者: Megatron    时间: 2009-2-10 21:30
Intel是在蒙骗消费者
L2S 发表于 2009-2-8 16:14


Intel在自己产品的划分中舍弃某项功能,这是产品划分和销售策略的问题。真需要SSE4.1,就花SSE4.1的钱好了。全白送?你系乜春春啊,这么大脸?

这等同于AMD技术低能,没有能力搞出SSE2的K7和去盗版Intel SSE4.1的K10么?

为AMD开P股,肮脏到连起码的逻辑和廉耻都不要了。
作者: 那吗错币    时间: 2009-2-10 21:42
一切为了火药度!
作者: lobbiest    时间: 2009-2-10 22:06
俺弱弱的问一个,see4是?
sse4是intel的吧?貌似sse4.1是amd的?
作者: nicklu    时间: 2009-2-10 22:10
提示: 作者被禁止或删除 内容自动屏蔽
作者: 慕容小白    时间: 2009-2-10 22:10
SSE4.1普及时, i7也是家家都用的起的东西了~
作者: kuyet    时间: 2009-2-10 22:22
为了活跃度~~~
作者: itany    时间: 2009-2-10 22:36
俺弱弱的问一个,see4是?
sse4是intel的吧?貌似sse4.1是amd的?
lobbiest 发表于 2009-2-10 22:06


这个提法不对
SSE4现在分为4.1和4.2,前者在Penryn上实现,后者在Nehalem上实现
AMD自己搞了一个掩人耳目、自欺欺人的SSE4A
作者: allyqu    时间: 2009-2-10 23:36
按需所求吧!爱用什么用什么吧!
作者: 镭光闪烁    时间: 2009-2-10 23:56
这都啥时候的文章了,还出来现眼?
作者: sun_tomato    时间: 2009-2-10 23:57
一般用户谁能用的上那SSE4.1
作者: zaknafein    时间: 2009-2-11 00:08
要是sse4.1那么重要, amd全家连灰都不剩了
作者: yinyi777    时间: 2009-2-11 00:51
按需购买...
作者: flyingpluto    时间: 2009-2-11 03:14
半年一次升级。。。没感觉了
作者: xgdg    时间: 2009-2-11 14:39
呵呵!各有所需把
作者: skyfx    时间: 2009-2-11 16:13
过时的贴了
现在才400出头
性价比已经渐渐体现了
作者: xmnzkx    时间: 2009-2-11 16:33
普通应用,5200足以
作者: 明天更钱更好    时间: 2009-2-14 10:00
7# 飞鸟真
俺有两个5200,粘起来看看,啊呀,成功了,变q了,价钱上写着:一万元{lol:]
作者: sparkle    时间: 2009-2-14 10:19
家用机没几个做视频编码的,专业做视频编码的也不会去买e5200
作者: AlcatrazX    时间: 2009-2-14 10:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: zzz533    时间: 2009-2-15 18:40
64位得cpu不知道出了多少年,当年为个64位上当了1100买了个754得A64 2800+,结果至今也没用64位系统!!!{cry:]
作者: wangzhao92    时间: 2009-2-16 14:08
楼主的尽业精神实在让我服啊~~~~
作者: 善良的人    时间: 2009-2-16 14:41
价钱是最重要的 谁不知道有SEE4.1好啊
作者: sonicxz    时间: 2009-2-16 14:48
你们回复看下时间,兰州大烧饼发的结尾看见吗750元5200,那是什么时候的了,对比下当然不值得买了,现在什么价格。。。这性能差异不压视频的人基本无视,加上SSE4的软件少之又少,等全面普及了,U早就淘汰了,Q9XXX也就4,5百能买倒了
作者: huxpin    时间: 2009-2-16 14:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: lokimawen    时间: 2009-2-16 14:59
sse4倒是一般,关键是捆绑的l2太小,还是放弃了,还是选择84好些
作者: 风之力    时间: 2009-2-16 16:19
对于用户来讲,最重要的是够用即可
作者: L2S    时间: 2009-2-16 17:44
本帖最后由 L2S 于 2009-2-16 18:03 编辑
Intel在自己产品的划分中舍弃某项功能,这是产品划分和销售策略的问题。真需要SSE4.1,就花SSE4.1的钱好了。全白送?你系乜春春啊,这么大脸?

这等同于AMD技术低能,没有能力搞出SSE2的K7和去盗版Intel SSE4 ...
Megatron 发表于 2009-2-10 21:30


AMD打你骂你逼你买?K7是没SSE2,可AMD并没有隐瞒这个。消费者冲着C4的价格去买Althon xp 很合理,指望别人买前者才叫不~要~脸。:whistling:
作者: zerg6139    时间: 2009-2-16 18:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: laserain    时间: 2009-2-16 23:25
一切为了火药度!
作者: rainqqq    时间: 2009-2-17 19:47
便宜才是王道啊  !
作者: 327546775    时间: 2009-2-17 20:23
哎 除了专业人士  有多少能等到4.1出来还不换U呢。。。
作者: zqftiger2    时间: 2009-2-19 09:47
一切为了活跃度
作者: gumsulin    时间: 2009-2-19 10:33
漠视,路过,继续上E5200




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4