POPPUR爱换

标题: 首个 Windows Directcompute 测试程序(0.15 版) [打印本页]

作者: Edison    时间: 2009-11-5 02:55
标题: 首个 Windows Directcompute 测试程序(0.15 版)
Benchmark v0.15 Readme
-----------------------

First of all:
1) You NEED DirectX 11 installed so for now, it will work only on win7.
2) You DON'T need DX11 hardware, DirectCompute is supported on DX10 class devices if only drivers support it (forceware >= 190.62, Catalyst currently doesn't support DirectCompute on DX10/10.1 GPUs)

Sample results:

GeForce 9800GT ECO OC (740/1800/1010) : M15670/S3600
GeForce 9800GT ECO OC (600/1500/900)  : M13195/S3220
ATI Radeon HD5850 (900/1200)          : M11799/S11841
ATI Radeon HD5870 (850/1200)          :      -/S10961

S-single threaded result
M-default dx11 device settings

Pat.
作者: 鑫随盼动    时间: 2009-11-5 07:39
这个感兴趣!留名
作者: boris_lee    时间: 2009-11-5 07:53
2) You DON'T need DX11 hardware, DirectCompute is supported on DX10 class devices if only drivers support it (forceware >= 190.62, Catalyst currently doesn't support DirectCompute on DX10/10.1 GPUs)

某些 directcompute 灭n卡论者又被打脸了
作者: jocover    时间: 2009-11-5 09:00
怎么R870 S和M的成绩一样啊
作者: gz_easy    时间: 2009-11-5 09:52
5870 没有M得分?
作者: westlee    时间: 2009-11-5 10:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: yamhill    时间: 2009-11-5 10:13
程序大小不能说明问题

很奇怪的是,居然拿9800GT来测……
作者: gz_easy    时间: 2009-11-5 10:15
从来没有directcompute灭n卡这种荒谬的言论,除了你这么说。
directcompute要灭也只会灭CUDA,怎么可能灭n卡?windows会灭I U?根本是2个概念的东西
左脚选手 发表于 2009-11-5 09:56

NV推CUDA根本目的在于推广其GPU,如果CUDA推广不利那么对于其GPU销售的负面影响不言而喻。
作者: zdcps    时间: 2009-11-5 10:16
支持帮顶。。
作者: jocover    时间: 2009-11-5 10:16
groupshared 也没用到
作者: zdcps    时间: 2009-11-5 10:26
为什么测不了,显卡是5850
[attach]1154399[/attach]
作者: gz_easy    时间: 2009-11-5 10:40
对,Directcompute 灭CUDA会影响GPU的销售,但是不能说Directcompute会灭N卡或N的GPU,因为N的GPU也能跑Directcompute

“影响”和“灭”是程度差别极大的2个词
左脚选手 发表于 2009-11-5 10:24

CUDA贯穿其整个产品线,NV对于CUDA的投入和执着是有目共睹的,甚至可以形容为孤注一掷,但假设CUDA最终夭折,是否可以说NV只剩半条命或更惨。
当然如果说某某大腕要招安它那就另当别论。
作者: boris_lee    时间: 2009-11-5 10:40
原帖由 左脚选手 于 2009-11-5 09:56 发



从来没有directcompute灭n卡这种荒谬的言论,除了你这么说。

directcompute要灭也只会灭CUDA,怎么可能灭n卡?windows会灭I U?根本是2个概念的东西

b
哦?前几天那些现在nv没有d11卡所以被dc灭的都是幻觉了
作者: tx97    时间: 2009-11-5 10:46
说明很大的问题,就像程序很小的superPI,严谨的CPU测试绝对不会仅以这个作为参考,Directcompute的整体性能和应用也绝对不可能仅仅用600多K的程序包括和测试。
左脚选手 发表于 2009-11-5 10:21

这也不一定,主要看编程水平,这个程序又不是堆材质包。
看到过一个例子:北航一帮研究生用汇编编写傅立叶变换,最后程序大小20多k,可以在64k的工控机运行;然后上网搜索,IBM几十年前的例程,600多个字节,可以在1K的机器上运行,周期比他们编得快N倍。
作者: ccx0289    时间: 2009-11-5 10:51
E文版的??有没有中文的啊~~~~
作者: gz_easy    时间: 2009-11-5 11:00
难道在其他领域CUDA就顺风顺水? 某某大腕们会坐视不理? 如果说目前CUDA取得一些成就,那么放眼未来数年,NV的CUDA前途如何? 而NV又为何如此倚重CUDA ,难道不是在为未来命运担忧吗?
作者: tx97    时间: 2009-11-5 11:02
我们说的是测试硬件的软件不是软件编程水平,测试软件要能测试一个硬件的整体水平,就必须包括这个硬件的大部分应用,只测小部分应用结论就会偏颇。而我绝对不相信600K的小软件就能测出Directcompute的整体应用性能 ...
左脚选手 发表于 2009-11-5 10:54

测试硬件的软件不是看编程水平是什么?高手多的是,未必不可能。要软件变大?容易,找张5M的图片当启动封面,程序就膨胀到5600k了。而且这个软件只是提供一个参考,没说完整测试Directcompute。
作者: garou    时间: 2009-11-5 11:03
老机随便跑跑
作者: jocover    时间: 2009-11-5 11:11
void Benchmark_CS1(uint3 thread_id : SV_DispatchThreadID)
{
        if(thread_id.x >= thread_count)
                return;

        uint i;
        float2 D[8];
        uint iaddr = thread_id << 3;

        for (i = 0; i < 32; i++) {

                D[0] = g_SrcData[iaddr + 0];
                D[1] = g_SrcData[iaddr + 1];
                D[2] = g_SrcData[iaddr + 2];
                D[3] = g_SrcData[iaddr + 3];
                D[4] = g_SrcData[iaddr + 4];
                D[5] = g_SrcData[iaddr + 5];
                D[6] = g_SrcData[iaddr + 6];
                D[7] = g_SrcData[iaddr + 7];

                FFT_forward_8(D);
                TWIDDLE_8(D, COS_PI_4_16);
                FFT_forward_8(D);
                TWIDDLE_8(D, COS_PI_4_16);
                FFT_forward_8(D);
                TWIDDLE_8(D, COS_PI_4_16);
                FFT_forward_8(D);
                TWIDDLE_8(D, COS_PI_4_16);

                uint omod = thread_id & (ostride - 1);
                uint oaddr = ((thread_id - omod) << 3) + omod;
                g_DstData[oaddr + 0 * ostride] = D[0];
                g_DstData[oaddr + 1 * ostride] = D[4];
                g_DstData[oaddr + 2 * ostride] = D[2];
                g_DstData[oaddr + 3 * ostride] = D[6];
                g_DstData[oaddr + 4 * ostride] = D[1];
                g_DstData[oaddr + 5 * ostride] = D[5];
                g_DstData[oaddr + 6 * ostride] = D[3];
                g_DstData[oaddr + 7 * ostride] = D[7];

        }
}

蛮奇怪的代码
作者: xeon-pan    时间: 2009-11-5 11:15
我们说的是测试硬件的软件不是软件编程水平,测试软件要能测试一个硬件的整体水平,就必须包括这个硬件的大部分应用,只测小部分应用结论就会偏颇。而我绝对不相信600K的小软件就能测出Directcompute的整体应用性能 ...
左脚选手 发表于 2009-11-5 10:54


why not 600K 可以是很大很大的程序了。。。
作者: Edison    时间: 2009-11-5 11:23
又看到 Directcompute 灭 AMD Stream、NVIDIA CUDA 论。
作者: jocover    时间: 2009-11-5 12:29
今后在windows上所有的GPGPU都将基于Directcompute编程(或许有部分openCL),windows程序员不会去碰stream和CUDA代码,stream和CUDA将会像显卡驱动程序一样,解释执行DX(CS)过来的指令,虽然stream和CUDA还会存在 ...
左脚选手 发表于 2009-11-5 12:06

不是说笑话吧?
作者: 魔法记录    时间: 2009-11-5 12:33
很奇怪的分嘛。左边驱动之家的
作者: insolo    时间: 2009-11-5 12:55
下来试试看
作者: defia    时间: 2009-11-5 13:06
本帖最后由 defia 于 2009-11-5 13:07 编辑

e84@4g
gtx260全默认

gpu m 14085 cpu m 3820
191.07 win7x64
作者: gz_easy    时间: 2009-11-5 13:37
今后在windows上所有的GPGPU都将基于Directcompute编程(或许有部分openCL),windows程序员不会去碰stream和CUDA代码,stream和CUDA将会像显卡驱动程序一样,解释执行DX(CS)过来的指令,虽然stream和CUDA还会存在 ...
左脚选手 发表于 2009-11-5 12:06

驱动程序不解释执行DX shader指令,而是编译,然后交由硬件执行,这个过程在执行DX app时发生,几乎是一对一。
作者: VGASOS    时间: 2009-11-5 13:41
一個CUDA無用論又來了 NV不是光CUDA才能跑吧
就算是軟體 也是寫個插件就能跑了呀 最終看的是效率吧
NV為什麼說他是軟體公司呢 他要推廣硬件就要把軟體搞定
因為他沒有像INTEL的市佔率 不能硬逼消費者接受
所以他才會推廣CUDA 藉由CUDA來提供GPU更多的功能
而不是封閉自己 AMD不也有STREAM嗎

讓自己的產品功能性變多 這是因為NV沒有CPU
面對目前的市場 如果只提供遊戲功能的話
將來一定會受限於無法將市場擴大 而獲利萎縮虧損
出現倒閉的情形

再說一次CUDA是並行而不是獨占 只是當初出來時沒有其他軟體
AMD那個除外 現在也有了 MS的Directcompute
NV兩者皆能跑吧 ATI就跑他的STREAM 沒看過NV卡跑STREAM吧
那怎麼沒人說STREAM獨占呢 對於消費者而言 功能是多多益善 效能是越強越好 售價是越便宜越好
買GPU附加這麼多(雖說羊毛出在羊身上) 不好嗎
作者: punkeer    时间: 2009-11-5 15:20
本帖最后由 punkeer 于 2009-11-5 15:38 编辑

file:///D:/1.png
作者: jocover    时间: 2009-11-5 15:35
用CS或OPENCL编写GPGPU程序,可以在I A N卡上跑,用CUDA或stream编写程序只能在N或A卡上跑,请问N或A的市场占有率会比I+N+A大吗?一个软件开发商,如果没有来自N的贴补,会用CS还是CUDA编写软件?用CS编写的软件市 ...
左脚选手 发表于 2009-11-5 13:15

既然Directcompute那么好,为什么连char类型都不支持?
作者: Edison    时间: 2009-11-5 15:38
用CS或OPENCL编写GPGPU程序,可以在I A N卡上跑,用CUDA或stream编写程序只能在N或A卡上跑,请问N或A的市场占有率会比I+N+A大吗?一个软件开发商,如果没有来自N的贴补,会用CS还是CUDA编写软件?用CS编写的软件市 ...
左脚选手 发表于 2009-11-5 13:15


你对 CUDA 的认识不正确,仅仅是把 CUDA 狭隘地理解为 C for CUDA,事实上没有 C for CUDA 或者 C for CUDA 没有人使用,CUDA 也依然存在。

http://www.nvidia.com/content/GTC/documents/1408_GTC09.pdf
作者: jhj9    时间: 2009-11-5 16:06
本帖最后由 jhj9 于 2009-11-5 16:12 编辑
今后在windows上所有的GPGPU都将基于Directcompute编程(或许有部分openCL),windows程序员不会去碰stream和CUDA代码,stream和CUDA将会像显卡驱动程序一样,解释执行DX(CS)过来的指令,虽然stream和CUDA还会存在 ...
左脚选手 发表于 2009-11-5 12:06


DC有Windows版本和平台限制,OpenCL起码在XP上也能跑,而CUDA则根本就跨平台了
你说程序员会选择哪个呢?
尤其是要开发出来给那些操作系统是Unix/Linux的大型服务器用的程序
作者: jhj9    时间: 2009-11-5 16:07
源代码600K是很大的程序了,但是如果是个可以独立运行的windows程序,赫赫,全部600K?很大很大的程序?不是说笑话吧?
左脚选手 发表于 2009-11-5 12:13


64K 3D Demo你难道没见识过吗?可以跑十分钟的3D演示加音乐都可以做到64K,拜托
作者: jhj9    时间: 2009-11-5 16:09
用CS或OPENCL编写GPGPU程序,可以在I A N卡上跑,用CUDA或stream编写程序只能在N或A卡上跑,请问N或A的市场占有率会比I+N+A大吗?一个软件开发商,如果没有来自N的贴补,会用CS还是CUDA编写软件?用CS编写的软件市 ...
左脚选手 发表于 2009-11-5 13:15


“所有的Windows平台”??WinXP甚至Win98怎么跑DirectCompute?
作者: darkangel308    时间: 2009-11-5 16:17
DC有Windows版本和平台限制,OpenCL起码在XP上也能跑,而CUDA则根本就跨平台了
你说程序员会选择哪个呢?
尤其是要开发出来给那些操作系统是Unix/Linux的大型服务器用的程序
jhj9 发表于 2009-11-5 16:06

opencl哇
作者: jhj9    时间: 2009-11-5 16:24
好吧,广义的CUDA不会死,CUDA硬件架构会存在, C for CUDA也会存在,但是在windows平台,最后将没人用CUDA编程,都会使用Directcompute ,对用户来说,CUDA只是NV内部的一个概念或功能。
左脚选手 发表于 2009-11-5 16:20


毫无依据的臆断
你是软件开发人员吗?你是微软吗?不是的话,请不要冒充他们的身份来说话
XP下不能用DirectCompute这一点就已经足够让很多软件公司否掉DirectCompute这个目前还不实用的东西了
作者: xeon-pan    时间: 2009-11-5 16:30
目前软件公司来说,还是要以xp用户为主做兼容性,然后额外提供vista和win7的兼容而已。。。
win7要普及,那是将来的事。。。
作者: xeon-pan    时间: 2009-11-5 16:35
GPGPU的大量应用,也是将来的事,可以说是win7级DX11和Directcompute 大量应用后的将来。
左脚选手 发表于 2009-11-5 16:33


有HPC这个大水池,看不到CUDA会死掉的机会。。。毕竟M$还是不允许之家东西运行在别的平台的。。。
作者: gz_easy    时间: 2009-11-5 16:39
只要MS愿意,WINDOWS XP可以使用DX11,只是MS要让用户升级到win 7,今后也是win 7就是windows。
左脚选手 发表于 2009-11-5 16:23

DX11要装到XP,必须有MS的一部分软件,要想支持DX11,必须在XP上安装Win7的显示驱动+DX11 runtime,另外XP的驱动架构也不对,XP的驱动架构和Win7差别太大,基本不能。
作者: chaos0714    时间: 2009-11-5 17:01
NV现在真的不好过了,被ATI和Intel两面夹击。
Intel出显卡之后,不管拉拉比性能咋样,NV在Intel平台上的市场份额肯定要缩水。
先不谈拉拉比还有GPGPU这个大杀器,Intel的推广手段真的不可小视,I740的成功可是摆在眼前的。
作者: slice    时间: 2009-11-5 17:01
“所有的Windows平台”??WinXP甚至Win98怎么跑DirectCompute?
jhj9 发表于 2009-11-5 16:09

XP还可以说说,98就别搬出来了,98平台有能跑CS的GPU么?
作者: laimi80    时间: 2009-11-5 17:45
被举了,只有xp...
作者: westlee    时间: 2009-11-5 18:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: tx97    时间: 2009-11-5 21:03
我的系统:Win7X64,E2140@2.8G,9800GTX+512M
显卡频率:
左图:300/100/740
右图:745/1100/1847
[attach]1155151[/attach]
作者: lijgame    时间: 2009-11-5 22:03
260+的分数和98gt差不多
[attach]1155197[/attach]
作者: silver.maple    时间: 2009-11-5 22:04
学习一下。留个大名
作者: ifu    时间: 2009-11-5 22:59
靠,这种没啥公信力的个人小程序也值得这么吵?260+能跑得和98gtx差不多 足见这程序之垃圾
作者: 飞鸟真    时间: 2009-11-5 23:16
你当OPEN CL不存在?
当拉拉比不存在?
stcshy_2 发表于 2009-11-5 16:42


就当拉拉比不存在你奈我们何?欢迎骑驴唱本,不信走着瞧。
作者: aibo    时间: 2009-11-5 23:35
貌似成绩的离散性很大
作者: westlee    时间: 2009-11-6 21:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: sagecao    时间: 2009-11-6 22:12
学习学习,以后升级GPU行了,CPU留着看
作者: china17    时间: 2009-11-6 22:57
在日前召开的CUDA大会上,当被问到NVIDIA如何看待OpenCL、DirectCompute和CUDA这几种GPU通用计算的编程标准时,黄仁勋表示:“DirectCompute和OpenCL技术都是在CUDA的启发下诞生的,NVIDIA非常喜欢它们,因为我们喜欢 ...
westlee 发表于 2009-11-6 21:14

CUDA最为开放??????
作者: HuaErZ    时间: 2009-11-6 23:01
CUDA最为开放??????
china17 发表于 2009-11-6 22:57

对程序开发人员和系统平台来说算最开放,但对硬件平台就算封闭.




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4