POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 2487|回复: 4
打印 上一主题 下一主题

OCP原创:HD4850双卡性能不如单卡?P35/P45/X48 CrossFire效能对比测试

[复制链接]
跳转到指定楼层
1#
发表于 2008-7-18 08:11 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
一,玩游戏,CPU/GPU谁更重要?



  我们来研究一下大家为什么会买更高端的显卡,除去少数只为了跑分而跑分的极限超频玩家,多数买这两张显卡的朋友实际是想让游戏变得流畅。除了一小部分FPS,例如QUAKE/CS需要100以上FPS才能保持高水平发挥(不过这些游戏由于太老,所以要求比较容易满足,根本不需要现在高端卡上场)以外,95%以上的游戏,只需要跑50FPS以上就可以满足流畅的需求,更高的FPS也只是一个数字而已。换句话说,什么情况下我们才需要高端显卡,只有当我们的显卡成为瓶颈的时候,我们才真正的需要双卡来缓解这些不足。如何判定显卡是瓶颈呢,FPS就是最好的证明,当FPS不足30的时候,就会有不流畅的感觉,这时候就需要更加强劲的显卡。

  从10到20FPS上升到20到40FPS,就是一个真正应用层面上的提升,也是雪中送炭。而从50到100FPS,那仅仅是锦上添花,在着重显卡性能的时候也开始要求一定的平台性能。而在高于100FPS以上时,显卡已经有剩余性能在浪费了,而此时CPU成为了瓶颈,显卡再强也完全没有了意义。当然这时候我们可以通过提高分辨率,提升游戏画质设置,更高的AA/AF来利用GPU剩余的性能,也使画质得到提升。所以我们要测试显卡的性能,当那些FPS高于50FPS的时候,参考的意义就不大,谁会为了从70FPS上升到200FPS去买一张显卡呢?也只有50FPS以下的重负载才是显卡表演的最佳场所,而也就是这个临界点,才让显卡有升级的意义。另外,正如nv所说的,CPU在游戏里的定位是越来越小,因为100FPS和200FPS没有区别,而在50FPS以下这个阶段上CPU完全帮不上忙,你既然超频了100%,有可能从34FPS涨到37FPS,还不如提升100MHZ GPU提升得更高。在越重负载的环境下,CPU的占用率就会越低,因为CPU一直在等待GPU,所以你换更快的CPU它还是得等待。


以下是相关测试: 引用:
虚幻竞技场3

CPU占用率 800×600 低画质

CPU占用率 1920×1200 高画质

通过对比不同画质下的内存使用率情况,低画质比高画质要少占用100MB以上,差距比较悬殊,不过在CPU占用率的测试中我们发现,高画质下的占用率竟然低于低画质的使用率,这也验证了在低画质下对CPU的依赖性更高。





二,多卡互连技术与市场主流


  在游戏里GPU扮演着越来越重要的角色,单卡性能无法满足现在游戏的高需求,为了满足这一需求,NVIDIA与ATI两家显卡芯片厂商各自发布了自家的多卡互连技术SLI(Scalable Link Interface)与CF(CrossFire),双卡性能的确非常强悍,理论性能可以达到单卡的1.8倍,为此游戏开发商都在努力的优化SLI与CF效能,而市场则给予了普及这两项技术充足的条件----时间。


  市场主流显卡,AMD(ATI)在今年下半年发布的HD4800系列显卡,HD4850显卡以其千元出头的价格提供强劲的3D性能,让对手NVIDIA不得不调整整一年的市场价格体系。

  然而,单卡提供的3D性能依然无法满足游戏玩家对高画质的需求,对于这类用户,组建SLI/CF是唯一最直接大幅度提高3D性能的方法。面对目前市场上可以实现不同的多卡互连硬件平台,Intel芯片组组建的CF无疑是最佳选择,两张HD4850在成本上不会付出太多,而在性能上则是超前。



三,Intel P35/P45/X48规格对比


  Intel芯片组从P965就加入对ATI CrossFire技术的支持,一直发展到现在最新的P45/X48,P965/P35/P45/X48在CrossFire性能上却有所差异,主要是主板PCI-E提供的带宽差别。



  P965/P35通过北桥提供一组PCI-E 1.0 16X以及从南桥引入的一组PCI-E 1.0 4X组成的16X+4X不对等CrossFire,中间数据传导还要经过南北桥通讯,先天注定在组建CrossFire时将被南北桥间的数据传导带宽所拖累。


  PCI-E 2.0相对1.0版本在信号传输速率上翻倍,从2.5GT/s提高到5GT/s,P45通过北桥分出的两组对等的8X PCI-E 2.0组成CrossFire系统,由于数据均通过北桥芯片处理,所以在双卡性能表现上要比P35优秀得多。


X48实现CrossFire的方式与P45一样,区别在显卡接口从上双8X提升到双16X,在高负载下性能上相信会有所增强。

  通过上面的理论分析了解了P35/P45/X48在组建CrossFire的区别,理论总规理论,那么不同的带宽在实际测试中有多大差异呢?下面我们对此做了相关测试。


四,测试平台及说明




测试说明:

1,借此次测试我们对本站的文章上做了一些规范,在表格上加以改进做到硬件信息全面。

2,CPU采用Itenl 四核处理器Q9450,并统一超频到3.6G主频,减少瓶颈存在,发挥显卡最佳性能,以便对比芯片组不同的PCI-E带宽带来的性能差距。

3,由于GIGABYTE EP45-DS4在超频时候内存分频方面存在一些问题,故测试的三款主板内存统一采用分频1:1方式进行测试,即DDR900 5-5-5-15。

4,往后测试平台操作系统基准更换为Windows Vista SP1。

5,显卡驱动方面采用ATI 8.7测试版。

6,此次测试采用的显示器为LG 42LB7RF液晶电视,由于显示器分辨率受限,3DMark Vantage只测试P级(1280*1024)性能,游戏部分测试分1600*1200以及1920*1080两种分辨率。

7,在游戏项目数量上,目前只调试好4个游戏测试,往后会增加更多游戏测试项目,对游戏测试项目有任何建议的请以论坛短信方式联系笔者。

8,所有测试均打上目前最新的游戏补丁,减少因版本问题造成的性能影响。

9,所有游戏测试,如在游戏中可设置AA/FF的则从游戏中设置,没有的则从显卡控制面板里设置。

10,考虑到游戏测试在多次测试中均有波动,每个游戏测试连续运行5次取最高值,3DMark Vantage则跑3次取最高值。

2#
 楼主| 发表于 2008-7-18 08:12 | 只看该作者
五,CrossFire实际工作带宽实测


首先是P35芯片组,此次测试我们采用的是GIGABYTE P35-DQ6做为测试主板之一,通过CPU-Z并无法查看显卡接口目前的实际带宽。


   同时运行两个最新版本GPU-Z则可以正确识别目前显卡接口工作的带宽状况,通过下图红圈部分了解到,主卡工作在PCI-E 16X模式,第二张显卡工作在PCI-E 4X模式。


接下来是P45芯片组,采用的是GIGABYTE EP45-DS4。

此时两张显卡均工作在PCI-E 2.0 8X模式下。


最后是X48芯片组,采用GIGABYTE X48-DQ6。

通过GPU-Z了解到此时两张显卡均工作在PCI-E 2.0 16X模式下。



六,测试性能与总结


  以下均为HD4850 CrossFire双卡性能对比。

3DMark Vantage测试,由于此次测试采用的液晶电视没有1680*1050以及1920*1200分辨率,所以只能测试Performance级(1280*1024)性能对比,在驱动控制面板里打开4AA 16AF。


P35提供的PCI-E 1.0带宽并且只是以16X+4X的方式在3DMark Vantage P级测试里性能与P45/X48有所差距,但性能损失并不算太严重,而P45双8X相对X48的双16X差距非常微小。





Unreal Tournament 3 (虚幻竞技场3) 测试,我们采用HOCbench的UT3测试工具,测试场景为负载较重的deimos flyby,驱动控制面板里开启4AA与16AF,运行5次取最高值。


在UT3测试中,P35相对P45以及X48有14%以上的性能损失,而X48比P45多一倍的接口带宽却仅仅只是提高1FPS,差距并不明显。



Company of Heroes Opposing Fronts (英雄连抵抗前线)测试,游戏设置开启4AA,通过游戏自带的性能测试连续运行5次,取最高平均值做为对比。


  主板提供的显卡接口带宽限制着显卡性能发挥造成在越高要求的游戏中差距开始拉大,P35在测试中较P45/X48达到18%以上的差距,而X48对P45仅只有2%的提高。



World in Conflict (冲突世界),在游戏里开启4AA与16AF,通过游戏自带的性能测试连续运行5次,取平均值最高做为对比。


  在上面我们提到P35第二条显卡槽是通过主板南桥引出的4X接口的,并且之间数据传导还要经过南北桥通讯,而南北桥之间的带宽仅有2G/s,所以当游戏数据量大到超过2G/s时,瓶颈产生,差距就非常明显了,在World in Conflict测试中P35比P45/X48落差超过56%很好说明这一问题,而P45对比X48,平均2FPS的差距。





Crysis测试,通过Benchmarking Tool工具,在软件里设置4AA,连续运行5次测试,取最高的平均值做为对比。


  如果说World in Conflict渲染时数据庞大,那么Crysis则更大,所以在Crysis游戏测试里差距更加明显,P35对比X48竟达到174%的落差,在这超重负载下,P45提供的双8X与X48提供的双16X开始表现出性能差距了,在1920*1080 4AA环境下,X48性能要比P45高11%性能。


下面整理一份表格对比。


测试总结:在对整个测试的过程中,我们发现了在最后重负载的Crysis和WIC的测试才如实反应了我们想要的答案:因为在50fps以下可以很好的体现出显卡系统的真实性能,尤其是Crysis的数据,我们可以看出X48/P45的成绩是P35的两倍以上,这意识着什么?这首先意味着CF mio的数据传输量几乎没有多少,更多是指令的交换;而南北桥可怜的DMI总线不仅仅担任I/O设备的数据传输,最重要的还有双卡之间那高达10G以上的数据交换,而那要命的南北桥之间的延迟周期大大延迟了数据的交换,更要命的是PCIE 1.0 4X的传输量成了最大的瓶颈。我们知道,水桶的盛水量永远取决于最短的木条,双卡的效率取决于最差的显卡。所以,抛开CPU等平台没有变化不谈,单卡对于双卡的性能下降只不过只有100%,而P35的性能下降却是可怕的100%以上,最高达到174%,这就说明了,P35就永远不要组交火了,这意味着你还不如使用单卡更快。
P45的情况比较特殊,按照带宽来算,PCIE 2.0 X8的性能和PCIE 1.0 X16的性能相近,所以很多人猜测应该可以满足CF的要求。但是双CF在数据交流的延迟方面还是不如PCIE 1.0 X16的,再加上带宽的限制,所以性能发挥上还是略逊于PCIE 2.0 X16。在最为严格的Crysis 1920x1080的性能上来算,距离X48还是有11%的性能损失,要知道HD4850和HD4870也不过区区15%到20%的性能差异,当然了,如果无视这11%性能损失的话,P45还是相当不错的CF平台。

X48无疑是除了X2这种双GPU直接做在一张卡上的最好的CF平台了,所以如果真要组CF而挑主板,肯定X38/X48是最佳选择了。

另外,从这个测试我们也看出了4870X2比4870 Crossfire的成绩高不少的因素,除了频率略为提高之外,最重要是PCB内部搭桥的通迅会比任何走PCIE通道更为强大,所以单卡X2才是最佳的CF方式,它的效能也是最佳的。
回复 支持 反对

使用道具 举报

3#
发表于 2008-7-18 08:20 | 只看该作者
期待后续测试,关注关注
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2008-7-18 08:43 | 只看该作者
五,CrossFire实际工作带宽实测


首先是P35芯片组,此次测试我们采用的是GIGABYTE P35-DQ6做为测试主板之一,通过CPU-Z并无法查看显卡接口目前的实际带宽。


   同时运行两个最新版本GPU-Z则可以正确识别目前显卡接口工作的带宽状况,通过下图红圈部分了解到,主卡工作在PCI-E 16X模式,第二张显卡工作在PCI-E 4X模式。


接下来是P45芯片组,采用的是GIGABYTE EP45-DS4。

此时两张显卡均工作在PCI-E 2.0 8X模式下。


最后是X48芯片组,采用GIGABYTE X48-DQ6。

通过GPU-Z了解到此时两张显卡均工作在PCI-E 2.0 16X模式下。



六,测试性能与总结


  以下均为HD4850 CrossFire双卡性能对比。

3DMark Vantage测试,由于此次测试采用的液晶电视没有1680*1050以及1920*1200分辨率,所以只能测试Performance级(1280*1024)性能对比,在驱动控制面板里打开4AA 16AF。


P35提供的PCI-E 1.0带宽并且只是以16X+4X的方式在3DMark Vantage P级测试里性能与P45/X48有所差距,但性能损失并不算太严重,而P45双8X相对X48的双16X差距非常微小。





Unreal Tournament 3 (虚幻竞技场3) 测试,我们采用HOCbench的UT3测试工具,测试场景为负载较重的deimos flyby,驱动控制面板里开启4AA与16AF,运行5次取最高值。


在UT3测试中,P35相对P45以及X48有14%以上的性能损失,而X48比P45多一倍的接口带宽却仅仅只是提高1FPS,差距并不明显。



Company of Heroes Opposing Fronts (英雄连抵抗前线)测试,游戏设置开启4AA,通过游戏自带的性能测试连续运行5次,取最高平均值做为对比。


  主板提供的显卡接口带宽限制着显卡性能发挥造成在越高要求的游戏中差距开始拉大,P35在测试中较P45/X48达到18%以上的差距,而X48对P45仅只有2%的提高。



World in Conflict (冲突世界),在游戏里开启4AA与16AF,通过游戏自带的性能测试连续运行5次,取平均值最高做为对比。


  在上面我们提到P35第二条显卡槽是通过主板南桥引出的4X接口的,并且之间数据传导还要经过南北桥通讯,而南北桥之间的带宽仅有2G/s,所以当游戏数据量大到超过2G/s时,瓶颈产生,差距就非常明显了,在World in Conflict测试中P35比P45/X48落差超过56%很好说明这一问题,而P45对比X48,平均2FPS的差距。





Crysis测试,通过Benchmarking Tool工具,在软件里设置4AA,连续运行5次测试,取最高的平均值做为对比。


  如果说World in Conflict渲染时数据庞大,那么Crysis则更大,所以在Crysis游戏测试里差距更加明显,P35对比X48竟达到174%的落差,在这超重负载下,P45提供的双8X与X48提供的双16X开始表现出性能差距了,在1920*1080 4AA环境下,X48性能要比P45高11%性能。


下面整理一份表格对比。


测试总结:在对整个测试的过程中,我们发现了在最后重负载的Crysis和WIC的测试才如实反应了我们想要的答案:因为在50fps以下可以很好的体现出显卡系统的真实性能,尤其是Crysis的数据,我们可以看出X48/P45的成绩是P35的两倍以上,这意识着什么?这首先意味着CF mio的数据传输量几乎没有多少,更多是指令的交换;而南北桥可怜的DMI总线不仅仅担任I/O设备的数据传输,最重要的还有双卡之间那高达10G以上的数据交换,而那要命的南北桥之间的延迟周期大大延迟了数据的交换,更要命的是PCIE 1.0 4X的传输量成了最大的瓶颈。我们知道,水桶的盛水量永远取决于最短的木条,双卡的效率取决于最差的显卡。所以,抛开CPU等平台没有变化不谈,单卡对于双卡的性能下降只不过只有100%,而P35的性能下降却是可怕的100%以上,最高达到174%,这就说明了,P35就永远不要组交火了,这意味着你还不如使用单卡更快。
P45的情况比较特殊,按照带宽来算,PCIE 2.0 X8的性能和PCIE 1.0 X16的性能相近,所以很多人猜测应该可以满足CF的要求。但是双CF在数据交流的延迟方面还是不如PCIE 1.0 X16的,再加上带宽的限制,所以性能发挥上还是略逊于PCIE 2.0 X16。在最为严格的Crysis 1920x1080的性能上来算,距离X48还是有11%的性能损失,要知道HD4850和HD4870也不过区区15%到20%的性能差异,当然了,如果无视这11%性能损失的话,P45还是相当不错的CF平台。

X48无疑是除了X2这种双GPU直接做在一张卡上的最好的CF平台了,所以如果真要组CF而挑主板,肯定X38/X48是最佳选择了。

另外,从这个测试我们也看出了4870X2比4870 Crossfire的成绩高不少的因素,除了频率略为提高之外,最重要是PCB内部搭桥的通迅会比任何走PCIE通道更为强大,所以单卡X2才是最佳的CF方式,它的效能也是最佳的。
回复 支持 反对

使用道具 举报

头像被屏蔽
5#
发表于 2008-7-18 08:48 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-3-4 19:58

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表