本帖最后由 玉清 于 2009-9-27 13:59 编辑
下面我们来看一下CUDA应用软件测试.
首先我们先来认识一下CUDA.
Nvidia的并行编程模型命名为CUDA(Computing Unified Device Architecture,统一计算架构模型)。基本思想是尽量得开发线程级并行(Thread Level Parallel),这些线程能够在硬件中被动态的调度和执行。CUDA编程模型的重点是将CPU做为终端(Host),而GPU做为服务器 (Server)或协处理器(Coprocessor),或者设备(Device),从而让GPU来运行一些能够被高度线程化的程序。所以,GPU只有在计算高度数据并行任务时才能发挥作用。在这类任务中,需要处理大量的数据,数据的储存形式类似于规则的网格,而对这写数据的进行的处理则基本相同。这类数据并行问题的经典例子有:图像处理,物理模型模拟(如计算流体力学),工程和金融模拟与分析,搜索,排序。而需要复杂数据结构的计算如树,相关矩阵,链表,空间细分结构等,则不适用于使用GPU进行计算。找到程序中的计算并行度后,就能将一部分程序移植到GPU上。运行在GPU上的程序被称为 Kernel(核)。核并不是完整的程序,而是整个程序中的若干基本的关键数据并行计算步骤。
虽然CUDA硬件诞生时间比较短,但已经进行了三次重大版本更新,在通用计算能力上有了很大的提高。
版本1.1增加了32bit字在全局存储器中的原子操作(Atomic Operation)功能;
版本1.2增加了32bit字在共享存储器中的原子操作功能,以及64bit字在全局存储器中的原子操作功能,增加了两个新的warp投票功能,并且支持GT200微体系结构(Microarchitecture)。
版本1.3增加了对双精度浮点运算的支持。
目前,支持计算能力版本1.0的只有最古老的G80 GPU.
G8X和G9X全系列GPU都是支持计算能力1.1的.
GT200 GPU支持的是计算能力1.3.
目前还没有支持1.2的产品出现,不过据说最近面世的40nm的支持DirectX 10.1的低端GPU将支持CUDA计算能力1.2.
开发CUDA需要三个要素:
1.
安装支持CUDA的显示卡驱动程序.
2.
安装CUDA Tookit.
3.
安装CUDA SDK.
目前CUDA Tookit和SDK最新版本都为2.3,当然,对于普通用户来说,Tookit和SDK都是不必要的,只需要安装支持CUDA的显示卡驱动程序即可享受CUDA软件带来的性能提升.
目前对于个人用户来说,应用最多的CUDA范畴大体就是视音频的编解码,因此目前面对个人用户的CUDA软件基本都以这些为主,此次测试的五个软件中,也都是视音频软件.
分别是:
LoiLoScope.
MediaCoder.
TotalMedia Theatre 3 with Sim HD.
Badaboom.
vReveal.
测试视频:HD.Club-Alisan.Trailer-80Mbps.mpg
Format : MPEG-PS
File size : 782 MiB
Duration : 1mn 45s
Overall bit rate : 62.4 Mbps
Writing library : Jan 21 2006
Video #224
ID : 224 (0xE0)
Format : MPEG Video
Format version : Version 2
Format profile : High@High
Format settings, Matrix : Default
Duration : 1mn 45s
Bit rate mode : Variable
Bit rate : 58.4 Mbps
Nominal bit rate : 80.0 Mbps
Width : 1 920 pixels
Height : 1 080 pixels
Display aspect ratio : 16:9
Frame rate : 29.970 fps
Colorimetry : 4:2:0
Scan type : Interlaced
Scan order : Top Field First
Bits/(Pixel*Frame) : 0.940
Stream size : 732 MiB (94%)
Writing library : Jan 21 2006
Audio #160
ID : 160 (0xA0)
Format : PCM
Format settings, Endianness : Big
Format settings, Sign : Signed
Muxing mode : DVD-Video
Duration : 1mn 45s
Bit rate mode : Constant
Bit rate : 1 536 Kbps
Channel(s) : 2 channels
Channel positions : Front: L R
Sampling rate : 48.0 KHz
Resolution : 16 bits
Stream size : 19.2 MiB (2%)
此视频为HD Club演示碟,码率达到了世界第一的80Mbps. |