POPPUR爱换

标题: 8800GS CUDA Raytracing [单精度] vs C2D E6700 [打印本页]

作者: Edison    时间: 2008-6-24 10:57
标题: 8800GS CUDA Raytracing [单精度] vs C2D E6700
源代码:http://forums.nvidia.com/index.php?act=ST&f=71&t=66791

我采用CUDA Toolkit 2.0 beta2,VS 2005下进行编译,测试环境为Vista x86,驱动为177.35,显卡为8800GS 96SP。

执行时间:
8800GS:263ms
E6700:937ms

这个ray tracing的原作者还提供了其它版本的ray tracing(2000版),CPU在新版本的执行速度比上面这个快很多。

上图为C2D E6700,下图为8800GS CUDA 单精度 [未采用Kahan summation算法]:
:p
作者: aibo    时间: 2008-6-24 11:00
白球上的那两道是什么?
作者: GZboy    时间: 2008-6-24 11:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2008-6-24 11:08
更新了100%的了
作者: GZboy    时间: 2008-6-24 11:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2008-6-24 11:11
对于g8x、g9x,精度问题可以用Kahan summation算法来获得改善。
作者: GZboy    时间: 2008-6-24 11:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: GZboy    时间: 2008-6-24 11:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2008-6-24 11:16
应该是精度问题,不过如果游戏采用光栅化+ray tracing的混合渲染,这些问题其实都不能解决,速度又可以获得较高的保证,不过目前来看,ray tracing的游戏引入可能还需要三年时间 :loveliness:
作者: Edison    时间: 2008-6-24 11:20
我把程序传上来吧。

cpu版本:
http://cgi.www5e.biglobe.ne.jp/~ ... king2.cgi?name=code

cuda版本:
作者: jack1123    时间: 2008-6-24 11:36
怎么不试,双精度浮点能力
马上下降90%:loveliness: :loveliness:,流处理器效率特差
引用:
正常情况下用的都是双精度浮点

单精度浮点应用场合非常有限, 几乎就局限在GAME和多媒体编码方面.

科学计算, 电影级3D渲染会用到128bit(4倍精度)浮点

[ 本帖最后由 jack1123 于 2008-6-24 11:42 编辑 ]
作者: rtyou    时间: 2008-6-24 11:41
Nv应该务实一些,现在搞得像一年前的AMD,吹个大泡泡。
作者: Edison    时间: 2008-6-24 11:41
原帖由 rtyou 于 2008-6-24 11:41 发表
Nv应该务实一些,现在搞得像一年前的AMD,吹个大泡泡。

你觉得NVIDIA不去推动CUDA才是务实?
作者: GZboy    时间: 2008-6-24 11:43
提示: 作者被禁止或删除 内容自动屏蔽
作者: hjwl    时间: 2008-6-24 11:44
普通玩家只关心 游戏跑得如何,这个对普通玩家没有啥意义。
作者: Edison    时间: 2008-6-24 11:46
原帖由 GZboy 于 2008-6-24 11:43 发表
WIN2K3 X64  + CUDA2.0+174.55+GF8600  图像输出不正常:funk: :mad:
886534

你试试看177.35 for winxp 64。
作者: Edison    时间: 2008-6-24 11:46
原帖由 hjwl 于 2008-6-24 11:44 发表
普通玩家只关心 游戏跑得如何,这个对普通玩家没有啥意义。

PCINLIFE的图形技术讨论区不是only for gamer的。
作者: rtyou    时间: 2008-6-24 11:47
原帖由 Edison 于 2008-6-24 11:41 发表

你觉得NVIDIA不去推动CUDA才是务实?


推动不是吹棉花糖,是脚踏实地。

CUDA?一个漂亮的海市蜃楼~
作者: Edison    时间: 2008-6-24 11:49
原帖由 rtyou 于 2008-6-24 11:47 发表
推动不是吹棉花糖,是脚踏实地。
CUDA?一个漂亮的海市蜃楼~


开发包和工具在一年多之前就推出了,与大学的合作也很早就展开了,你以为今天看到的各种CUDA程序都是paper only吗?你现在就能马上切实享受的CUDA应就有UT3 Physx mod。
作者: jackpeng33    时间: 2008-6-24 11:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: GZboy    时间: 2008-6-24 11:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: GZboy    时间: 2008-6-24 11:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: avin550    时间: 2008-6-24 12:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2008-6-24 12:16
原帖由 mousefire 于 2008-6-24 12:14 发表
对,CUDA应用范围不大,把它作为一个附属功能确实可以,想拿它当卖点?对象人群是啥?有多少人用得着?


CUDA可以应用于人工智能、物理运算以及其它一大堆的非图形计算。
作者: rtyou    时间: 2008-6-24 12:27
原帖由 jackpeng33 于 2008-6-24 11:57 发表
我只看到很酸,海市蜃楼?不會的就不要亂吹,那,照你說的intel和MS全部東西都是海市蜃楼了,你沒的用或不會用的東西就說別人沒用,你也太自我中心化了吧?什麼新東西都是推廣的.就是有些人在說三道四推廣才這麼難,你當然想 ...


你感觉到酸了?

呵,我只知道NV没有把MS忽悠到,没有把Intel和AMD忽悠到,只是把一些N饭忽悠地像嗑了药一样。
作者: solara2000    时间: 2008-6-24 12:31
Edison你的签名档很有意思阿,David Kirk说这话什么意思阿?表示对Intel不思进取的不满,类似CUDA的技术其实Intel应该早就该推出了。
作者: solara2000    时间: 2008-6-24 12:35
原帖由 rtyou 于 2008-6-24 12:27 发表


你感觉到酸了?

呵,我只知道NV没有把MS忽悠到,没有把Intel和AMD忽悠到,只是把一些N饭忽悠地像嗑了药一样。

你对CUDA的技术有了解么。要是不以为然,可不可以发表的你的高论,让我们听听到底CUDA忽悠在哪些地方。
作者: acqwer    时间: 2008-6-24 12:38
这样看起来,跑RT最强的还是Larrabee啊,如果intel没吹牛的话。
作者: Edison    时间: 2008-6-24 13:18
原帖由 acqwer 于 2008-6-24 12:38 发表
这样看起来,跑RT最强的还是Larrabee啊,如果intel没吹牛的话。

根据什么看?
作者: acqwer    时间: 2008-6-24 13:25
原帖由 Edison 于 2008-6-24 13:18 发表

根据什么看?

就这个成绩看,双精度下GT280最多和QX9650平手,想来Intel总不会出个300W的专用芯片跑主业只能和一年前的通用芯片差不多的废物吧。
作者: Edison    时间: 2008-6-24 13:27
原帖由 acqwer 于 2008-6-24 13:25 发表
就这个成绩看,双精度下GT280最多和QX9650平手,想来Intel总不会出个300W的专用芯片跑主业只能和一年前的通用芯片差不多的废物吧。

那些小瑕疵并不一定需要完全的双精度来改善,用混合精度已经足够解决。

我上面给出的连接中同样有SSE单精度的优化版本,效果和双精度的差不多,没有那些可见的瑕疵。
作者: acqwer    时间: 2008-6-24 13:36
原帖由 Edison 于 2008-6-24 13:27 发表

那些小瑕疵并不一定需要完全的双精度来改善,用混合精度已经足够解决。

我上面给出的连接中同样有SSE单精度的优化版本,效果和双精度的差不多,没有那些可见的瑕疵。

那么也就是3.X倍吧,明年的新产品理论性能再翻一翻大概能到6倍,CHO认为这种充分并行化的程序Larrabee能跑到QX9650的几倍?估计也不会比这个少吧。再加上双精度的考虑,在intel没吹牛的前提下,Larrabee跑RT最强应该没什么问题。

[ 本帖最后由 acqwer 于 2008-6-24 13:38 编辑 ]
作者: GZboy    时间: 2008-6-24 13:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: daniel_k    时间: 2008-6-24 13:49
回头我也试试o(∩_∩)o
作者: jiliaoke    时间: 2008-6-24 14:03
源码下不到了,这个是CPU版的,我的成绩是:

name=Unknown
system=Unknown
cpuid=6FD
clock=3197MHz
time=906ms
time/pixel=1.1520(micro second)




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4