GTX275 各项评测：介绍+高清+游戏+CUDA应用

玉清 · 发表于 2009-9-27 12:29

本帖最后由玉清于 2009-9-30 12:26 编辑

NVIDIA GeForce GTX275采用GT200的GPU，具有896MB的显存，显存位宽448bit，纹理单元80个，ROP数量28个，多流处理器数量30个，除了显存位宽和ROP比GTX285低一些之外，其他都和GTX285持平，而且价格却大幅降低，因此GTX275具有不错的性价比.
来看今天的测试主角：ASL翔升提供的GTX275，感谢翔升的支持.

首先上显卡和显卡拆解图.

下面上显示卡拆解图.

显卡采用8相供电，同时使用了类似AtricCooling的三扇形大型散热器，静音及散热能力都不错.

然后到了显示卡背面的图.

显示卡做工不错，同时也具有变频开关设计.

使用感觉：散热和静音能力不错，默认是1200rpm的转速，此时噪音很少，几乎听不到，温度待机58度，满载86度，但是可以调节转速到最高3800转，此时噪音就比较明显了，满载温度也下降到75度.

显示卡的做工不错，这是看到过做工最好的非公版的GTX275之一，同时显存，MOS等等散热片覆盖也非常广，显示卡散热器也非常不错.

具有的变频开关可以方便的超频，能够调节显示卡BIOS里面的默认的显存和GPU频率，这个功能不错的人性化，综合来看，翔升还是在此款GTX275上面下足了功夫的.

玉清 · 发表于 2009-9-27 12:35

本帖最后由玉清于 2009-9-27 14:29 编辑

下面我们先来认识一个GT200 GPU.

作为一种计算设备，GT200是一种多核芯片，设计重点是能够在处理数据并行问题时获得很高的数据吞吐量（compute throughput）。为了能够提高芯片整体的性能，单个线程的性能和执行时间做出了牺牲。

GT200的结构可以被分为两层：第一层是10个TPC（Thread Processing Cluster，线程处理器群），每个TPC又有三个SM（StreamingMultiprocessors,SM，又称Thread Processor Array， TPA）和一个纹理流水线组成。

纹理流水线为所在TPC内的三个SM提供存储器流水线。每个SM大致相当于一个具有8路SIMD功能的现代处理器，拥有独立的完整前端，包括取指，译码，发射和执行单元等，但存储器流水线是与同一个TPC中的其他SM共享的。

GT200和G80两代产品的主要不同是G80拥有8个TPC，每个TPC中有两个SM；而GT200的TPC数量增加到了10个，每个TPC中的SM数量也增加到了3个。

GPU通过向量机技术增强了计算性能，减少了控制方面的开销。例如，GT200和G80种的每个SM又包含8个线程处理器（Thread Processor，TP）。线程处理器也有其他的名称，比如流处理器（Streaming Processor）或者渲染核（Shader Core）。

SP并不是独立的处理器核，它们有独立的寄存器和指令指针，但没有取指和调度单元来构成完整的前端。因此，SP更加类似于当代的多线程CPU中的一条流水线。

抛开商业上天花乱坠的宣传不说，SM实际上是一种高度线程化的单发射（single-issue） SIMD处理器。

和当代的CPU核一样，SM也拥有独立的取指和调度单元构成的完整前端。大多数情况下，控制开销被8个功能单元分摊，但也有一部分的控制逻辑是直接控制单个线程的，无法共享。

参考文献：NVIDIA's GT200--- Inside a Parallel Processor by DR. David Kanter.

玉清 · 发表于 2009-9-27 12:49

下面回归今天的主题，GTX275在Windows 7下面的测试.

测试平台：

Intel Pentium E5300 @3.47Ghz

4GB RAM

1.5TB HDD

Windows 7 RTM x64

PureCodec 20090826

Windows Media Player 12

首先高清测试.

准备的蓝光碟片有：

HD.Club-Alisan.Trailer-80Mbps.

Band of Brothers2001BDRip.1080p.x264.DTSHD DualAudio(EP01-EP10)-CHD

8.Mile.2002.Bluray.1080p.DTSHD.x264-CHD

I,Robot.2004.Bluray.1080p.DTSHD.2Audio.x264-CHD

Angels.&.Demons.2009.Extended.Cut.BluRay.1080p.x264.DTS-WiKi

The Lives Of Others2006.BDRip.1080p.x264.DTS Audio-CHD

WALL·E 2008 1080p BluRay HKDTS-ES x264-CtrlHD

首先来看完美解码的设置：

HD.Club-Alisan.Trailer-80Mbps.

Band of Brothers2001BDRip.1080p.x264.DTSHD DualAudio(EP01-EP10)-CHD

8.Mile.2002.Bluray.1080p.DTSHD.x264-CHD

玉清 · 发表于 2009-9-27 12:50

本帖最后由玉清于 2009-9-27 12:53 编辑

I,Robot.2004.Bluray.1080p.DTSHD.2Audio.x264-CHD

Angels.&.Demons.2009.Extended.Cut.BluRay.1080p.x264.DTS-WiKi

The Lives Of Others 2006.BDRip.1080p.x264.DTS Audio-CHD

WALL·E 2008 1080p BluRay HK DTS-ES x264-CtrlHD

综合看来，Windows Media Player 12的表现让人赞叹，CPU占用率基本只是在5%以下，Windows 7的Windows Media Player已经支持硬件解码.

玉清 · 发表于 2009-9-27 13:04

下面进入游戏测试环节，以DirectX 10为主.
也包括刚刚上市的Need For Speed:Shift.

Need For Speed:Shift. 极品飞车:变速
Company Of Heroes - Tales Of Valor英雄连：勇气传说
Cryostasis 雪域危机
Darkest Of Days 黑暗之日
Biohazard 5 生化危机5
Call Of Duty 4 使命召唤4
Mirror's Edge 镜之边缘
Call Of Juarez - Bound In Blood 狂野西部：生死联盟
Stalker - Clear Sky 迷失地带：晴空
Bionic Commando 生化尖兵
Far Cry 2 孤岛惊魂2
Crysis Warhead 孤岛危机：弹头
Batman-Arkham Asylum 蝙蝠侠：阿甘疯人院
Warhammer 40,000 - Dawn Of War 战锤40K：战争黎明2
Terminator - Salvation终结者：救世主，
Prototype 虐杀原形

所以游戏的分辨率均是1440X900的分辨率（不好意思我显示器比较小～～～见谅见谅），游戏里面的最高的画质和AA和AF设置，通常都是16XAA+16XAF，少部分游戏因为游戏原因不能打开如此高的AA或者AF.
以Benchmark为主，部分游戏没有BenchMark以FRAPS记录的帧数为主.

玉清 · 发表于 2009-9-27 13:12

首先来看备受关注的Need For Speed:Shift.

终于，让人备受期待之后，EA终于在2009年9月15日发布了Need For Speed:Shift.

在经历了Need For Speed:Undercover糟糕经历之后（糟糕的画质和糟糕的操控），EA决定将Shift打造成全拟真类游戏.

画质和操控设置界面.

放几个GRID截图对比一下：

从截图中可以看出，Shift的画质非常出色，尤其是车内的视角，车体模型非常不错，不过路边的环境则有点点粗糙了.
画质明显要比GRID好很多，尤其是车体细节，周围环境则感觉和GRID类似，锯齿感比GRID略差一些，色彩比GRID明快，综合感受：Shift的画质明显远好于GRID.

说说操控感：

在操控设置成专业以及灵敏度成100%之后，感觉难度提升明显比较大，之前认为操控难度明显低于Live For Speed，经过多天的玩之后，难度感觉和Live For Speed相当.

当然，这并不是说操控感觉是和Live For Speed一样的.

Live For Speed的方向盘是270度，而且轮胎的抓地力普遍比较低，假如换成公路胎更是如此，而Shift则是90度的方向盘，而且轮胎的抓地力普遍较好，类似于GRID，所以打滑想象或者是侧滑过度在Shift和GRID里面控制明显要比Live For Speed容易很多.

由于Live For Speed的方向盘是270度，假如用键盘玩的话而且辅助全关的情况下（比如我），不用车内视角是非常难控制的，你需要随时盯着方向盘的转向角度，来达到方向盘的精确控制，并且方向盘的自动回转比较慢，需要自己不停的在转向之后回打方向盘，而Shift里面则要求并没有那么高.

操控难度，综合来看Shift和Live For Speed在辅助全关的情况下都比GRID高一点，但是三者的操控感觉是截然不同的.

玉清 · 发表于 2009-9-27 13:17

本帖最后由玉清于 2009-9-27 13:21 编辑

Company Of Heroes - Tales Of Valor英雄连：勇气传说

二战非常不错的RTS游戏，值得RTS爱好者一玩，无论是音效，画质还是情节都是非常出色.

游戏设置.

帧数从人多和人少的时候不等，30-60fps之间.

Resident Evil 5 生化危机5.

游戏设置界面.

此结果偏低了，可能是因为CPU性能拖慢显卡发挥的原因.

Cryostasis:Sleep of Reason雪域危机：沉睡之谜是一款支持PhysX技术的作品，首先来看DEMO设置，刚出现Demo的时候因为支持PhysX而备受关注，从水滴，布料等等都能看到PhysX带来的物理效果.

测试结果.

玉清 · 发表于 2009-9-27 13:25

本帖最后由玉清于 2009-9-27 13:30 编辑

Call Of Duty Modern Warfare.
使命召唤4绝对是FPS游戏不可不玩的大作，爽快的射击感，感人的剧情，让人流连忘返的故事，一切都让人记忆犹新.

此外，使命召唤4已经通关过6次，因为实在是爱不释手.

最近还打算第7次通关？

下面我们来看看传说中超高难度的隐藏关，以最高难度进入，救出人质时间只有1min.

其实打隐藏关里面的路线基本都是固定的，而且，记住要使用闪光弹，总共大概需要使用4-5个左右，和不要着急，尽管1min时间比较短，但是还是比较富裕的，不要着急，不要慌，以最高难度过隐藏关基本就问题不大了.

Darkest Of Days 黑暗之日

游戏简单介绍：开发商告诉我们，游戏的主题是在开拓西部时代的1876年，卡斯特将军和第七骑兵队将利特尔的军队全部歼灭，以突然出现的男人把受到重伤的玩家带到未来，由于玩家的时间之旅使历史发生了改变。

测试DEMO成功安装，设置成这样，但是当选择进入游戏的时候卡死，多种解决方法未果，可能是因为和Windows 7 x64兼容性的问题，总之没能做出这款游戏的测试.

GRID
Codemasters公司的大作，具有非常出色的画质，当然现在画质比极品飞车13差点，和极其逼真的物理损坏系统.

帧数在实际游戏的时候从40-60之间，GRID还是偏向于爽快驾驶感的游戏.

玉清 · 发表于 2009-9-27 13:34

本帖最后由玉清于 2009-9-27 13:36 编辑

Mirror's Edge

作为一款跑酷类游戏，因为支持PhysX而备受关注，镜之边缘，还有非常好听的Still Alive音乐.

这也是我最喜欢的游戏之一，带有淡淡的忧伤，通关四次.

这款游戏在高楼之间跳跃的感觉非常刺激，也非常的让人紧张，帧数从50-70之间，可玩性非常高.

与其看碎玻璃，不如体会里面的故事和内涵更有意思.

Crysis Warhead

作为Crysis系列的第二部作品，Crysis Warhead从一宣布就备受期待.

Crysis带来的画质是革命性的，是计算机图形学科技巨大进步的表现，创造出来的画质让人赞叹.

假如说部分Call Of Duty爱好者可能会说Crysis系列射击感觉不够爽快，以此认为这是Crysis的缺点的话，那么论画面质量，Crysis绝对是游戏制作公司超高科技实力的体现.

帧数从20-35之间波动，具有一定的可玩性，降低反锯齿品质可能会带来帧数比较明显的提升.

Batman Arkham Asylum
备受赞誉的Batman Arkham Asylum终于有完整版出现.

并且还获得了金氏世界纪录的被授于“最受好评的超级英雄游戏”.

帧数从45-65之间变化，多数在50之间，游戏的可玩性非常不错，值得推荐.

玉清 · 发表于 2009-9-27 13:39

本帖最后由玉清于 2009-9-27 13:43 编辑

Far Cry 2

Far Cry因为当时极致的画质而著名，所以到了Far Cry 2发布的时候也备受关注，到后面育碧居然发布了Far Cry 2的官方简体中文版，这是实在让人感到吃惊.

当然，刺客信条也发布了简体中文版.

帧数从30-40之间，比开了16XAA的Crysis Warhead略高，客观来说，Far Cry 2的画质显然不如Crysis.

Bionic Commando

生化尖兵是一款主机移植的游戏，因此画质设置界面极其简单.

帧数一直都是110帧以上，无需多虑.

Prototype
虐杀原形

一款动作类的游戏，偏向血腥，科幻剧情.

这款游戏刚刚发布的时候玩了一天之后，觉得这是实在是一款无聊透顶的游戏，主角按住SHIFT跑之后可以直线到达任何地方，敌人就像饼干一样软弱无力.

帧数25-45之间，游戏画质也显得一般，需要释放压力的时候拿出来玩玩或许不错.

玉清 · 发表于 2009-9-27 13:45

本帖最后由玉清于 2009-9-27 13:49 编辑

S.T.A.L.K.E.R.: Clear Sky

潜行者：晴空.

and,最后一个场景测试失败.

Call Of Jaurez Bound In Blood
狂野西部

这款游戏刚刚进入的时候绝对可以用惊艳来形容，好久没有看到过画质如此出色的作品了.
人物和环境细节非常出色，色彩明快，而且对性能的要求并没有达到Crysis之类.

帧数可观，从50-120之间，当然，在马车里面帧数自然高一些，60fps正常值.
在如此出色的画质下面能够达到这样的帧数可谓非常不错，值得推荐，射击感也非常不错.

Terminator Salvation
终结者4.

“游戏版《终结者4》故事背景设定在电影中故事发生的两年前，曾经对人类发动核武攻击的天网自身也受到伤害，历经数年休养生息后，终于拥有足够力量终结人类。玩家扮演所有机器人的头号目标──康纳，率领幸存的人类抵抗机械人大军，在几乎毁灭的洛杉矶展开生存之战。”

先来看游戏画面设置，仍然只有分辨率和长宽比率选项，和生化尖兵类似.

帧数还是非常好的水平，90fps左右.

但是改作总体表现一般无论是画质还是射击感，里面的AI过于简单，让人感到无趣.

Warhammer 40000 Dawn Of War 2
战锤40K：战争黎明2

在游戏里面玩家将控制一小队星际战士，面对整个银河系的危机——一场横扫数个行星的外星人入侵。战役继续沿袭了自黑暗十字军开始的模式，玩家将在以星球为界面的地图上选择任务，之后跳入。剧情仍然采用非线性的解构，玩家可以选择任务的先后完成顺序.

帧数到40-90之间，游戏可玩度一般，尤其是游戏需要依附Steam系统运行，最开始如何让游戏运行可费了一些时间，因为Steam的那个Update包实在有点巨大.

只看该作者 · 发表于 2009-9-27 13:55

提示: 作者被禁止或删除内容自动屏蔽

玉清 · 发表于 2009-9-27 13:56

本帖最后由玉清于 2009-9-27 13:59 编辑

下面我们来看一下CUDA应用软件测试.

首先我们先来认识一下CUDA.

Nvidia的并行编程模型命名为CUDA（Computing Unified Device Architecture，统一计算架构模型）。基本思想是尽量得开发线程级并行(Thread Level Parallel)，这些线程能够在硬件中被动态的调度和执行。CUDA编程模型的重点是将CPU做为终端(Host)，而GPU做为服务器 (Server)或协处理器(Coprocessor)，或者设备（Device），从而让GPU来运行一些能够被高度线程化的程序。所以，GPU只有在计算高度数据并行任务时才能发挥作用。在这类任务中，需要处理大量的数据，数据的储存形式类似于规则的网格，而对这写数据的进行的处理则基本相同。这类数据并行问题的经典例子有：图像处理，物理模型模拟（如计算流体力学），工程和金融模拟与分析，搜索，排序。而需要复杂数据结构的计算如树，相关矩阵，链表，空间细分结构等，则不适用于使用GPU进行计算。找到程序中的计算并行度后，就能将一部分程序移植到GPU上。运行在GPU上的程序被称为 Kernel(核)。核并不是完整的程序，而是整个程序中的若干基本的关键数据并行计算步骤。

虽然CUDA硬件诞生时间比较短，但已经进行了三次重大版本更新，在通用计算能力上有了很大的提高。

版本1.1增加了32bit字在全局存储器中的原子操作(Atomic Operation)功能；
版本1.2增加了32bit字在共享存储器中的原子操作功能，以及64bit字在全局存储器中的原子操作功能，增加了两个新的warp投票功能，并且支持GT200微体系结构(Microarchitecture)。
版本1.3增加了对双精度浮点运算的支持。

目前，支持计算能力版本1.0的只有最古老的G80 GPU.
G8X和G9X全系列GPU都是支持计算能力1.1的.
GT200 GPU支持的是计算能力1.3.
目前还没有支持1.2的产品出现，不过据说最近面世的40nm的支持DirectX 10.1的低端GPU将支持CUDA计算能力1.2.

开发CUDA需要三个要素：
1.
安装支持CUDA的显示卡驱动程序.
2.
安装CUDA Tookit.
3.
安装CUDA SDK.

目前CUDA Tookit和SDK最新版本都为2.3，当然，对于普通用户来说，Tookit和SDK都是不必要的，只需要安装支持CUDA的显示卡驱动程序即可享受CUDA软件带来的性能提升.

目前对于个人用户来说，应用最多的CUDA范畴大体就是视音频的编解码，因此目前面对个人用户的CUDA软件基本都以这些为主，此次测试的五个软件中，也都是视音频软件.

分别是：

LoiLoScope.
MediaCoder.
TotalMedia Theatre 3 with Sim HD.
Badaboom.
vReveal.

测试视频：HD.Club-Alisan.Trailer-80Mbps.mpg

Format : MPEG-PS

File size : 782 MiB

Duration : 1mn 45s

Overall bit rate : 62.4 Mbps

Writing library : Jan 21 2006

Video #224

ID : 224 (0xE0)

Format : MPEG Video

Format version : Version 2

Format profile : High@High

Format settings, Matrix : Default

Duration : 1mn 45s

Bit rate mode : Variable

Bit rate : 58.4 Mbps

Nominal bit rate : 80.0 Mbps

Width : 1 920 pixels

Height : 1 080 pixels

Display aspect ratio : 16:9

Frame rate : 29.970 fps

Colorimetry : 4:2:0

Scan type : Interlaced

Scan order : Top Field First

Bits/(Pixel*Frame) : 0.940

Stream size : 732 MiB (94%)

Writing library : Jan 21 2006

Audio #160

ID : 160 (0xA0)

Format : PCM

Format settings, Endianness : Big

Format settings, Sign : Signed

Muxing mode : DVD-Video

Duration : 1mn 45s

Bit rate mode : Constant

Bit rate : 1 536 Kbps

Channel(s) : 2 channels

Channel positions : Front: L R

Sampling rate : 48.0 KHz

Resolution : 16 bits

Stream size : 19.2 MiB (2%)

此视频为HD Club演示碟，码率达到了世界第一的80Mbps.

玉清 · 发表于 2009-9-27 14:01

Badaboom

官方网站：http://www.badaboomit.com/

这个软件是最早支持CUDA技术的软件之一，知名度也比较高.

测试：将HD.Club-Alisan.Trailer-80Mbps.mpg转换成iPod格式，记录其时间以及CUDA占用率.

默认设置+注重画质.

CPU占用率67%，而且转码的速度非常快.

仅仅只过了31s就转换完毕，但是并没有在这里找到取消CUDA选项，因此没有测试在纯CPU下面的转换效果，但是无论如何，仅仅只用了31s的速度毫无疑问是非常惊人的.

MediaCode

MediaCode是国人开发的一款视音频转换软件，尤其值得注意的是，这款软件是免费的，在CUDA软件基本都为收费软件的现在，MediaCode的免费实属难得.

转码进行中.

125s之后转换完毕，时间比Badaboom长很多.

Super LoiLoScope
Super LoiLoScope是一款支持CUDA编码的视频编辑软件，能够非常方便的编辑视频，界面也非常可爱.

只需要拖拽视频，图片等等元素到里面，就能编辑好视频，非常方便，随后点击共享之后选择相应的格式就能生成对应的视频文件.

有CUDA选择.

使用CUDA编码中，CPU占用率达到72%.

耗费时间1min32s.

下面用CPU编码来测试速度，由于可能是软件的BUG，选择取消CUDA之后就不停的再次跳出设置界面，唯独选择生成DVD的时候才不会这样，而一旦选择输出iPod等格式就会出现以上BUG，因此生成的都是DVD格式.

耗费时间1min29s，使用CPU之后速度反而慢了下来，关于这些，可能是软件BUG，或者说已经选择了不使用CUDA，但是还是使用了CUDA的缘故，或者是软件设计的不够好，导致使用CUDA速度没有太大提升.

TotalMedia Theatre 3 with Sim HD
TotalMedia Theatre 是一个强大的家庭影院级播放器，同时推出的Sim HD插件（需要额外付费）可以把DVD实时输出成1080P或者720P画质.

下面我们来看看设置界面：

Sim HD是一个插件，需要额外购买之后才能安装在TotalMediaTheatre中，当然也有试用版.

值得注意的是，并不是所有影音文件都支持Sim HD，Sim HD目前只支持DVD文件.

此次测试的文件为Avril Lavigne 多伦多演唱会DVD.

没有打开Sim HD.

打开Sim HD.

可以看到，打开Sim HD之后，画质有了少许的提升，而且CPU占用率也比较低，当然，假如选择不使用CUDA而打开Sim HD的话，CPU的占用率是非常高的.

vReveal

MotionDSP vReveal是一款视频修复软件，号称使用了《犯罪现场调查》级别的超分辨率技术(super-resolution)，还支持NVIDIA CUDA技术，可籍此提速最多五倍。

据称，超分辨率技术可提高视频分辨率，并去掉颗粒、色块等视频瑕疵，还能有效增强晃动视频的稳定性。该技术的算法原理其实也很简单，就是通过分析连续多个视频帧来重建单一帧画面的细节，直至完整对整个视频的修复和增强。

测试视频文件松隆子的舞台剧浪人街.

此处为没有使用任何修复效果，也就是原视频的质量.

使用修复之后，画质明显要比之前好很多.

需要注意的是，使用CUDA之后CPU占用率只有不到60%.

关闭CUDA，CPU占用率立即达到了92%.

vReveal带来的视频修复效果还是很明显的，推荐诸位玩家试试.

iverlin · 发表于 2009-9-27 14:07

不错帮顶

pikaqiuuu · 发表于 2009-9-27 14:43

文章不错。。就是发的晚了点。

玉清 · 发表于 2009-9-27 17:56

不错帮顶
iverlin 发表于 2009-9-27 14:07

HOHO,谢谢哦！

玉清 · 发表于 2009-9-27 17:57

文章不错。。就是发的晚了点。
pikaqiuuu 发表于 2009-9-27 14:43

HOHO，谢谢帮顶哦！

玉清 · 发表于 2009-9-28 11:21

DX10已经过时了
Bohr 发表于 2009-9-27 13:55

起碼現在還是主流～～

c0111c · 发表于 2009-9-28 13:24

严重支持技术贴~~~~~~~

帐号		自动登录	找回密码
密码			注册

Bohr 该用户已被删除	12^# 发表于 2009-9-27 13:55 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Bohr 该用户已被删除
	回复支持反对使用道具举报显身卡