POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 11627|回复: 50

GTX 480 + 197.55 on GPC benchmark 测试 新增下载链接。

  [复制链接]
发表于 2010-4-28 12:22 | 显示全部楼层 |阅读模式




















GPCBenchmark - 支持GPU的通用计算程序

首款国人开发的支持GPU的OpenCL通用计算测试程序

首款国人开发的支持GPU的OpenCL通用计算测试程序OpenCL General Purpose Computing Benchmark (简称GPCBenchMarkOCL)是由国内几名高性能计算从业人员和爱好者合作编写的,目的是为了评估在不同的OpenCL平台上一些基本算法和应用的性能。与目前流行的一些OpenCL、DirectCompute通用计算测试程序的不同在于,目前这些测试程序测试项目过于单一,基本上就是某一两种算法的性能测试,甚至干脆就是理论峰值计算性能的测试。而实际上,OpenCL计算设备包括GPU的计算性能是受非常多因素影响的,除了计算单元的频率和数量之外,还有计算单元架构、Global memory(显存)带宽、Local memory(GPU内的片上存储器,NVIDIA称为Shared memory,AMD称为Local Data Share)带宽和Bank conflict、存储器合并访问情况、存储器同步成本、缓存等各种因素。因此某些纸面计算性能非常高的GPU执行某些计算时性能却不一定好;又或者,某 GPU在执行某种计算时虽然性能落后于另一架构的GPU,但是在执行另一种计算时性能反而超前。GPCBenchMarkOCL集合了高性能计算领域多种常见的基础算法和应用,能比较全面地评估GPU及其它OpenCL计算设备在通用计算应用中的性能。
目前GPCBenchMarkOCL的测试项目包括:

1、Global Memory带宽(读、写、拷贝以及PCI-E总线带宽) - 主要考察不同传输尺寸下各种访存操作的性能 2、Local Memory带宽(带宽和Bank conflict) - 分析Local memory带宽与数据类型、Bank conflict的关系 3、32位整数性能(加法、乘法、乘加和位运算) - 分析处理器32位整数处理性能 4、单精度浮点性能(加法、乘法、乘加和特殊函数如sqrt、sin等) - 分析处理器单精度浮点数处理性能 5、双精度浮点性能(加法、乘法、乘加和特殊函数如sqrt、sin等) - 分析处理器双精度浮点数处理性能 6、常用计算(单精度和双精度浮点的大矩阵乘法、大矩阵转置、归约、DCT8x8) - 分析处理器在进行一些常用矩阵与信号处理运算中的表现 7、图像处理(亮度直方图、2维卷积、降噪、双立方插值缩放) - 分析处理器在进行一些常用图像处理中的表现 8、密码学(目前只有SHA-1 Hash Loop,以后将加入盒型加密和彩虹表) - 分析处理器在密码学应用中的性能

在 GPCBenchMarkOCL中,所有测试都会在CPU和GPU(包括其它OpenCL设备)上运行并给出性能结果,不过CPU上运行的并非 OpenCL代码而是用常规C语言实现的并行算法(会调度全部的CPU核)。而GPU上运行的OpenCL代码经过试验能正确运行在NVIDIA GTX285和AMD HD5870上。各算法的OpenCL实现有部分修改自NVIDIA和AMD的SDK,部分是由相关从业人员和爱好者提供的。由于NVIDIA和AMD的 GPU架构上有很大区别,对于某些算法也许能专门针对NVIDIA或AMD的GPU架构写出非常难看的比较极端优化的OpenCL代码,但考虑编程难度、程序的可读性和普遍意义,GPCBenchMarkOCL只使用了一般的GPU编程优化方法做了简单优化(例如使用Local memory暂存数据、利用合并访问规则等),并且在不同的OpenCL计算设备上也是运行相同的OpenCL代码来进行测试。
GPCBenchMarkOCL 支持AMD RV770及Evergreen系列,以及NVIDIA G8x、G9x、GT200、GT21x、GF100等GPU的OpenCL平台。

运行环境要求:

操作系统: Windows XP 32/64bit Windows Vista 32/64bit Windows 7 32/64bit 驱动程序: AMD GPU:催化剂10.2或以上版本,且需安装AMD Stream SDK 2.01或以上版本(目前AMD GPU的驱动程序还没有正式加入OpenCL支持) NVIDIA GPU:只需安装197.14或以上版本的驱动程序 注意事项: AMD OpenCL平台目前(催化剂10.3 + Stream SDK 2.01)仍不支持双精度浮点数操作,但实际上经过试验,该平台是可以执行部分双精度浮点数操作的(特殊函数及乘加指令等除外)。如果需要在AMD OpenCL平台上测试双精度浮点性能,必须在配置页打开“强制支持双精度浮点(强制cl_khr_fp64)”选项。 AMD OpenCL平台目前(催化剂10.3 + Stream SDK 2.01)尚未添加对Image访问(通过纹理访问数据)的支持,限制了AMD OpenCL平台在图像处理应用方面的性能。


下载地址:

http://www.hpctech.com/down/opencl/index_cn.html

只支持N卡G80以上显卡,A卡HD4000或HD5000系列显卡。

N卡建议装最新驱动(197或以上),A卡建议装 10.3或以上驱动。

A卡只有驱动还跑不了OpenCL,必须安装AMD Stream SDK 2.01或以上版本,下载地址:http://developer.amd.com/gpu/atistreamsdk/Pages/default.aspx

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
发表于 2010-4-28 13:18 | 显示全部楼层
本帖最后由 西把拉古 于 2010-4-28 13:19 编辑

不懂,但是估计是很nb的意思。
opencl对于我来说就是一个技术,变成phyx那样看得到效果的就行了。
回复 支持 反对

使用道具 举报

发表于 2010-4-28 13:18 | 显示全部楼层
带宽没什么用,SHA个人比较关注
回复 支持 反对

使用道具 举报

发表于 2010-4-28 13:42 | 显示全部楼层
E大,你图标里面对比的CPU型号是什么?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2010-4-28 13:44 | 显示全部楼层
i7-920 DDR3-1333 CL7-7-7-7 P6T Deluxe。
回复 支持 反对

使用道具 举报

发表于 2010-4-28 13:48 | 显示全部楼层
又是颜色加深的测试哇!!!LZ幸苦了
回复 支持 反对

使用道具 举报

发表于 2010-4-28 13:53 | 显示全部楼层
现在使用gpu的运算的
真正能替代使用cpu运算的软件,平常小百姓也用得上的到底有哪些啊?比如压缩文件,多媒体压缩等???
回复 支持 反对

使用道具 举报

 楼主| 发表于 2010-4-28 14:04 | 显示全部楼层
zip、rar 这类压缩操作很大程度上瓶颈是在 I/O 上而不是计算性能上,因此目前对这类软件的移植没啥价值可言。

多媒体编码方面,有 CUDA Encoder 等。
回复 支持 反对

使用道具 举报

发表于 2010-4-28 14:31 | 显示全部楼层
支持开发这样的软件的人~~~
回复 支持 反对

使用道具 举报

发表于 2010-4-28 14:48 | 显示全部楼层
回复 1# Edison

支持国人原创;双精度在科学计算里面很重要!
回复 支持 反对

使用道具 举报

发表于 2010-4-28 14:56 | 显示全部楼层
cpu见底了。
回复 支持 反对

使用道具 举报

发表于 2010-4-28 15:00 | 显示全部楼层
顯卡是用來玩 GAME 的 不知道 實際效果如何!!!
回复 支持 反对

使用道具 举报

发表于 2010-4-28 15:14 | 显示全部楼层
国人的软件语言也只有英文吗.....
回复 支持 反对

使用道具 举报

 楼主| 发表于 2010-4-28 15:19 | 显示全部楼层
有中文版的,不过我喜欢跑英文的。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2010-4-28 15:31 | 显示全部楼层
CPU
----------------------------------------
Global Memory:                      14.2
Local Memory:                       30.7
Int32 Ops:                          12.8
Float Ops:                          6.4
Double Ops:                         24.9
Common Mathematics (Float):         30.7
Common Mathematics (Double):        60.3
Image Processing:                   24.6
Cryption:                           13.9
Total:                              218.6


GeForce GTX 480
----------------------------------------
Global Memory:                      169.3
Local Memory:                       131.4
Int32 Ops:                          278.5
Float Ops:                          155.0
Double Ops:                         213.6
Common Mathematics (Float):         547.2
Common Mathematics (Double):        821.9
Image Processing:                   609.4
Cryption:                           205.1
Total:                              3131.3

手头没 5870 了,下面这个是 hpctech 他们跑的将结果:

Cypress
----------------------------------------
全局存储器:                     71.6
局部存储器:                     49.8
32位整型运算:                    270.2
单精度浮点运算:                  182.8
双精度浮点运算:                  109.1
常用数学方法(单精度):          228.2
常用数学方法(双精度):          349.0
图像处理:                        156.4
密码学:                          381.0
所有测试:                        1798.2
回复 支持 反对

使用道具 举报

发表于 2010-4-28 15:34 | 显示全部楼层
5870图像处理怎么比480差这么多?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2010-4-28 15:37 | 显示全部楼层
amd stream 2.01 还不支持 opencl 的 image object(纹理) 协作。
回复 支持 反对

使用道具 举报

发表于 2010-4-28 15:37 | 显示全部楼层
下载看看470在此OCLMark中与480差距多少。
回复 支持 反对

使用道具 举报

发表于 2010-4-28 15:58 | 显示全部楼层
88GT在此测试中平均只有480的1/5左右,惨不忍睹
回复 支持 反对

使用道具 举报

 楼主| 发表于 2010-4-28 16:02 | 显示全部楼层
理论上就是 1/4 吧,加上 cache 等原因,距离就更大了。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-3-28 22:37

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表