POPPUR爱换

标题: GTX 480 + 197.55 on GPC benchmark 测试 新增下载链接。 [打印本页]

作者: Edison    时间: 2010-4-28 12:22
标题: GTX 480 + 197.55 on GPC benchmark 测试 新增下载链接。
[attach]1271680[/attach]

[attach]1271681[/attach]

[attach]1271682[/attach]

[attach]1271683[/attach]

[attach]1271685[/attach]

[attach]1271684[/attach]

[attach]1271686[/attach]

[attach]1271687[/attach]

[attach]1271688[/attach]

[attach]1271689[/attach]

GPCBenchmark - 支持GPU的通用计算程序

首款国人开发的支持GPU的OpenCL通用计算测试程序

首款国人开发的支持GPU的OpenCL通用计算测试程序OpenCL General Purpose Computing Benchmark (简称GPCBenchMarkOCL)是由国内几名高性能计算从业人员和爱好者合作编写的,目的是为了评估在不同的OpenCL平台上一些基本算法和应用的性能。与目前流行的一些OpenCL、DirectCompute通用计算测试程序的不同在于,目前这些测试程序测试项目过于单一,基本上就是某一两种算法的性能测试,甚至干脆就是理论峰值计算性能的测试。而实际上,OpenCL计算设备包括GPU的计算性能是受非常多因素影响的,除了计算单元的频率和数量之外,还有计算单元架构、Global memory(显存)带宽、Local memory(GPU内的片上存储器,NVIDIA称为Shared memory,AMD称为Local Data Share)带宽和Bank conflict、存储器合并访问情况、存储器同步成本、缓存等各种因素。因此某些纸面计算性能非常高的GPU执行某些计算时性能却不一定好;又或者,某 GPU在执行某种计算时虽然性能落后于另一架构的GPU,但是在执行另一种计算时性能反而超前。GPCBenchMarkOCL集合了高性能计算领域多种常见的基础算法和应用,能比较全面地评估GPU及其它OpenCL计算设备在通用计算应用中的性能。
目前GPCBenchMarkOCL的测试项目包括:

1、Global Memory带宽(读、写、拷贝以及PCI-E总线带宽) - 主要考察不同传输尺寸下各种访存操作的性能 2、Local Memory带宽(带宽和Bank conflict) - 分析Local memory带宽与数据类型、Bank conflict的关系 3、32位整数性能(加法、乘法、乘加和位运算) - 分析处理器32位整数处理性能 4、单精度浮点性能(加法、乘法、乘加和特殊函数如sqrt、sin等) - 分析处理器单精度浮点数处理性能 5、双精度浮点性能(加法、乘法、乘加和特殊函数如sqrt、sin等) - 分析处理器双精度浮点数处理性能 6、常用计算(单精度和双精度浮点的大矩阵乘法、大矩阵转置、归约、DCT8x8) - 分析处理器在进行一些常用矩阵与信号处理运算中的表现 7、图像处理(亮度直方图、2维卷积、降噪、双立方插值缩放) - 分析处理器在进行一些常用图像处理中的表现 8、密码学(目前只有SHA-1 Hash Loop,以后将加入盒型加密和彩虹表) - 分析处理器在密码学应用中的性能

在 GPCBenchMarkOCL中,所有测试都会在CPU和GPU(包括其它OpenCL设备)上运行并给出性能结果,不过CPU上运行的并非 OpenCL代码而是用常规C语言实现的并行算法(会调度全部的CPU核)。而GPU上运行的OpenCL代码经过试验能正确运行在NVIDIA GTX285和AMD HD5870上。各算法的OpenCL实现有部分修改自NVIDIA和AMD的SDK,部分是由相关从业人员和爱好者提供的。由于NVIDIA和AMD的 GPU架构上有很大区别,对于某些算法也许能专门针对NVIDIA或AMD的GPU架构写出非常难看的比较极端优化的OpenCL代码,但考虑编程难度、程序的可读性和普遍意义,GPCBenchMarkOCL只使用了一般的GPU编程优化方法做了简单优化(例如使用Local memory暂存数据、利用合并访问规则等),并且在不同的OpenCL计算设备上也是运行相同的OpenCL代码来进行测试。
GPCBenchMarkOCL 支持AMD RV770及Evergreen系列,以及NVIDIA G8x、G9x、GT200、GT21x、GF100等GPU的OpenCL平台。

运行环境要求:

操作系统: Windows XP 32/64bit Windows Vista 32/64bit Windows 7 32/64bit 驱动程序: AMD GPU:催化剂10.2或以上版本,且需安装AMD Stream SDK 2.01或以上版本(目前AMD GPU的驱动程序还没有正式加入OpenCL支持) NVIDIA GPU:只需安装197.14或以上版本的驱动程序 注意事项: AMD OpenCL平台目前(催化剂10.3 + Stream SDK 2.01)仍不支持双精度浮点数操作,但实际上经过试验,该平台是可以执行部分双精度浮点数操作的(特殊函数及乘加指令等除外)。如果需要在AMD OpenCL平台上测试双精度浮点性能,必须在配置页打开“强制支持双精度浮点(强制cl_khr_fp64)”选项。 AMD OpenCL平台目前(催化剂10.3 + Stream SDK 2.01)尚未添加对Image访问(通过纹理访问数据)的支持,限制了AMD OpenCL平台在图像处理应用方面的性能。


下载地址:

http://www.hpctech.com/down/opencl/index_cn.html

只支持N卡G80以上显卡,A卡HD4000或HD5000系列显卡。

N卡建议装最新驱动(197或以上),A卡建议装 10.3或以上驱动。

A卡只有驱动还跑不了OpenCL,必须安装AMD Stream SDK 2.01或以上版本,下载地址:http://developer.amd.com/gpu/atistreamsdk/Pages/default.aspx
作者: 西把拉古    时间: 2010-4-28 13:18
本帖最后由 西把拉古 于 2010-4-28 13:19 编辑

不懂,但是估计是很nb的意思。
opencl对于我来说就是一个技术,变成phyx那样看得到效果的就行了。
作者: Enio    时间: 2010-4-28 13:18
带宽没什么用,SHA个人比较关注
作者: 66666    时间: 2010-4-28 13:42
E大,你图标里面对比的CPU型号是什么?
作者: Edison    时间: 2010-4-28 13:44
i7-920 DDR3-1333 CL7-7-7-7 P6T Deluxe。
作者: emu10kx    时间: 2010-4-28 13:48
又是颜色加深的测试哇!!!LZ幸苦了
作者: heavenboy    时间: 2010-4-28 13:53
现在使用gpu的运算的
真正能替代使用cpu运算的软件,平常小百姓也用得上的到底有哪些啊?比如压缩文件,多媒体压缩等???
作者: Edison    时间: 2010-4-28 14:04
zip、rar 这类压缩操作很大程度上瓶颈是在 I/O 上而不是计算性能上,因此目前对这类软件的移植没啥价值可言。

多媒体编码方面,有 CUDA Encoder 等。
作者: 解放狼    时间: 2010-4-28 14:31
支持开发这样的软件的人~~~
作者: asdfjkl    时间: 2010-4-28 14:48
回复 1# Edison

支持国人原创;双精度在科学计算里面很重要!
作者: 鱼儿水中游    时间: 2010-4-28 14:56
cpu见底了。
作者: GF100    时间: 2010-4-28 15:00
顯卡是用來玩 GAME 的 不知道 實際效果如何!!!
作者: luckissy    时间: 2010-4-28 15:14
国人的软件语言也只有英文吗.....
作者: Edison    时间: 2010-4-28 15:19
有中文版的,不过我喜欢跑英文的。
作者: Edison    时间: 2010-4-28 15:31
CPU
----------------------------------------
Global Memory:                      14.2
Local Memory:                       30.7
Int32 Ops:                          12.8
Float Ops:                          6.4
Double Ops:                         24.9
Common Mathematics (Float):         30.7
Common Mathematics (Double):        60.3
Image Processing:                   24.6
Cryption:                           13.9
Total:                              218.6


GeForce GTX 480
----------------------------------------
Global Memory:                      169.3
Local Memory:                       131.4
Int32 Ops:                          278.5
Float Ops:                          155.0
Double Ops:                         213.6
Common Mathematics (Float):         547.2
Common Mathematics (Double):        821.9
Image Processing:                   609.4
Cryption:                           205.1
Total:                              3131.3

手头没 5870 了,下面这个是 hpctech 他们跑的将结果:

Cypress
----------------------------------------
全局存储器:                     71.6
局部存储器:                     49.8
32位整型运算:                    270.2
单精度浮点运算:                  182.8
双精度浮点运算:                  109.1
常用数学方法(单精度):          228.2
常用数学方法(双精度):          349.0
图像处理:                        156.4
密码学:                          381.0
所有测试:                        1798.2
作者: 66666    时间: 2010-4-28 15:34
5870图像处理怎么比480差这么多?
作者: Edison    时间: 2010-4-28 15:37
amd stream 2.01 还不支持 opencl 的 image object(纹理) 协作。
作者: gz_easy    时间: 2010-4-28 15:37
下载看看470在此OCLMark中与480差距多少。
作者: SpitDragon    时间: 2010-4-28 15:58
88GT在此测试中平均只有480的1/5左右,惨不忍睹
作者: Edison    时间: 2010-4-28 16:02
理论上就是 1/4 吧,加上 cache 等原因,距离就更大了。
作者: 380    时间: 2010-4-28 16:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2010-4-28 17:34
影驰无双 GTX 260+ w/197.55:

[attach]1271947[/attach]

[attach]1271948[/attach]

[attach]1272044[/attach]

[attach]1271951[/attach]

[attach]1271952[/attach]

[attach]1271953[/attach]

[attach]1271954[/attach]

[attach]1271955[/attach]

[attach]1271957[/attach]

[attach]1271958[/attach]

[attach]1271960[/attach]

[attach]1271961[/attach]

[attach]1271962[/attach]

[attach]1271963[/attach]

[attach]1271964[/attach]

[attach]1271964[/attach]
作者: saga1974    时间: 2010-4-28 17:38
260+默认频率看起来和ATI的5系也差不多嘛

GeForce GTX 260
----------------------------------------
全局存储器:                        93.1
局部存储器:                        86.6
32位整型运算:                       86.5
单精度浮点运算:                     85.4
双精度浮点运算:                     83.0
常用数学方法(单精度):             390.6
常用数学方法(双精度):             439.7
图像处理:                           326.7
密码学:                             83.9
所有测试:                           1675.5
作者: westlee    时间: 2010-4-28 18:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2010-4-28 18:30
楼上买了 470 ?
作者: 芯片批发    时间: 2010-4-28 18:31
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2010-4-28 18:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: yawner    时间: 2010-4-28 19:15
CPU
----------------------------------------
全局存储器:                        7.1
局部存储器:                        19.1
32位整型运算:                       7.7
单精度浮点运算:                     4.2
双精度浮点运算:                     13.2
常用数学方法(单精度):             29.1
常用数学方法(双精度):             36.5
图像处理:                           18.5
密码学:                             11.6
所有测试:                           147.0


GeForce GTX 260
----------------------------------------
全局存储器:                        94.1
局部存储器:                        83.7
32位整型运算:                       83.5
单精度浮点运算:                     83.1
双精度浮点运算:                     82.2
常用数学方法(单精度):             391.0
常用数学方法(双精度):             439.7
图像处理:                           244.1
密码学:                             78.1
所有测试:                           1579.4

2008 r2 x64
作者: mooncocoon    时间: 2010-4-28 22:45
这是第一个明言自己在干什么以及进行了何种优化的测试软件,跑出来的已经是最底层的性能了
goodjob~
作者: kaven    时间: 2010-4-28 22:56
这个测试不错,网站做得再好点,可以在线提交和浏览成绩就更好了
作者: luckissy    时间: 2010-4-28 23:02
支持SLI吗?
作者: 肥角色    时间: 2010-4-28 23:13
Intel i7 920 2.66GHz

CPU
----------------------------------------
全局存储器:                        13.9
局部存储器:                        19.5
32位整型运算:                       12.5
单精度浮点运算:                     6.0
双精度浮点运算:                     21.9
常用数学方法(单精度):             31.5
常用数学方法(双精度):             53.5
图像处理:                           26.4
密码学:                             21.9
所有测试:                           207.1


GeForce GTX 470
----------------------------------------
全局存储器:                        149.8
局部存储器:                        107.8
32位整型运算:                       244.6
单精度浮点运算:                     127.7
双精度浮点运算:                     173.6
常用数学方法(单精度):             532.7
常用数学方法(双精度):             788.6
图像处理:                           510.3
密码学:                             168.7
所有测试:                           2803.7
作者: hejunjian    时间: 2010-4-28 23:34
没测过.不清楚情况..
作者: 心头烦    时间: 2010-4-29 00:02
[attach]1272347[/attach]
这是啥意思?
作者: Edison    时间: 2010-4-29 00:03
什么操作系统、显卡、驱动版本?
作者: pharaohs1024    时间: 2010-4-29 00:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: 心头烦    时间: 2010-4-29 00:17
回复 35# Edison
XP32  260+ (197.13)
作者: allair    时间: 2010-4-29 10:47
顶,技术贴!!!
作者: ll91123    时间: 2010-4-29 16:14
支持开发这样的软件的人~~~
作者: fmer    时间: 2010-4-29 19:45
不太明白,为什么CPU的分那么低?
作者: vrPunkEmily    时间: 2010-4-29 20:54
感谢分享了....................
作者: Edison    时间: 2010-4-29 21:12
回复  Edison
XP32  260+ (197.13)
心头烦 发表于 2010-4-29 00:17


    驱动程序:
AMD GPU:催化剂10.2或以上版本,且需安装 AMD Stream SDK 2.01 或以上版本(目前 AMD GPU 的驱动程序还没有正式加入 OpenCL 支持)
NVIDIA GPU:只需安装 197.14 或以上版本的驱动程序

作者: 心头烦    时间: 2010-4-29 22:42
回复 42# Edison
N卡建议装最新驱动(197或以上),A卡建议装 10.3或以上驱动。
没注意看下面的,我去下个197.14试试
作者: goldman948    时间: 2010-4-30 09:24
i5-750 (200x17),看来我的cpu还是很猛的

CPU
----------------------------------------
全局存储器:                        15.3
局部存储器:                        39.5
32位整型运算:                       16.2
单精度浮点运算:                     7.4
双精度浮点运算:                     30.1
常用数学方法(单精度):             45.1
常用数学方法(双精度):             74.5
图像处理:                           28.5
密码学:                             19.1
所有测试:                           275.7


GeForce GTX 470
----------------------------------------
全局存储器:                        150.9
局部存储器:                        107.8
32位整型运算:                       248.7
单精度浮点运算:                     128.0
双精度浮点运算:                     173.7
常用数学方法(单精度):             556.5
常用数学方法(双精度):             814.5
图像处理:                           514.8
密码学:                             168.9
所有测试:                           2863.7
作者: kaven    时间: 2010-4-30 20:03
有8800GTX的兄弟跑个测试看看
作者: doplenis    时间: 2010-4-30 20:56
QX9650 3.33G 8800Ultra

CPU
----------------------------------------
全局存储器:                        6.2
局部存储器:                        35.6
32位整型运算:                       15.4
单精度浮点运算:                     6.9
双精度浮点运算:                     27.3
常用数学方法(单精度):             36.2
常用数学方法(双精度):             39.5
图像处理:                           29.6
密码学:                             21.1
所有测试:                           217.6


GeForce 8800 Ultra
----------------------------------------
全局存储器:                        71.4
局部存储器:                        66.8
32位整型运算:                       69.1
单精度浮点运算:                     65.7
双精度浮点运算:                     0.0
常用数学方法(单精度):             361.0
常用数学方法(双精度):             0.0
图像处理:                           198.3
密码学:                             64.2
所有测试:                           896.5
作者: kaven    时间: 2010-4-30 21:06
回复 46# doplenis
多谢ls。


GeForce 8800 GS
----------------------------------------
全局存储器:                        65.8
局部存储器:                        50.7
32位整型运算:                       53.6
单精度浮点运算:                     51.2
双精度浮点运算:                     0.0
常用数学方法(单精度):             277.0
常用数学方法(双精度):             0.0
图像处理:                           143.6
密码学:                             44.0
所有测试:                           685.9
作者: cfz45    时间: 2010-5-30 19:17
提示: 作者被禁止或删除 内容自动屏蔽
作者: snock    时间: 2010-5-30 19:51
本帖最后由 snock 于 2010-5-30 19:54 编辑

CPU  Q6600
----------------------------------------
全局存储器:                        5.6
局部存储器:                        24.5
32位整型运算:                       11.4
单精度浮点运算:                     5.3
双精度浮点运算:                     19.9
常用数学方法(单精度):             24.9
常用数学方法(双精度):             30.5
图像处理:                           22.1
密码学:                             15.5
所有测试:                           159.8


GeForce GTX 260
----------------------------------------
全局存储器:                        101.3
局部存储器:                        98.1
32位整型运算:                       100.4
单精度浮点运算:                     97.4
双精度浮点运算:                     94.7
常用数学方法(单精度):             493.5
常用数学方法(双精度):             532.0
图像处理:                           376.0
密码学:                             95.0
所有测试:                           1988.3
作者: jiangpeng6    时间: 2010-5-30 20:38
我的5870分数不高啊,
作者: xtongy521    时间: 2010-5-30 21:12
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4