POPPUR爱换

标题: 小问一句,9800GTX+支持CUDA2.0吗? [打印本页]

作者: leonloreal    时间: 2009-1-13 17:21
标题: 小问一句,9800GTX+支持CUDA2.0吗?
9800GTX+支持CUDA2.0吗?
想入9800GTX+,其实我对游戏不是很热衷,只是想用CUDA技术才换的N卡,本人经常使用视频编辑软件TMPGEnc,这个软件貌似支持之CUDA2.0,所以想问问各位拥有9800GTX+的大侠,最好弄个CUDA-Z的截图看看。
作者: nukualofa    时间: 2009-1-13 17:53
我想知道CUDA对什么比较敏感?频率还是流处理器数量?
作者: garou    时间: 2009-1-13 19:03
就算是8600都支持......
作者: leonloreal    时间: 2009-1-13 19:33
8600不是CUDA 1.1吗?
作者: linktoice    时间: 2009-1-13 21:41
确实有区别,自己下个Badaboom自动监测下就知道支持什么版本
作者: leonloreal    时间: 2009-1-13 22:30
哎,关键是手里没有这卡嘛,还是希望有卡的人给一些建议!
作者: jocover    时间: 2009-1-13 23:11
CUDA2.0支持9800GTX+
作者: leonloreal    时间: 2009-1-14 08:48
CUDA2.0支持9800GTX+
jocover 发表于 2009-1-13 23:11


当真?
那我就不买GTX260了,
作者: HuaErZ    时间: 2009-1-14 08:53
还是260吧,也不知道看谁发的信息,260的双精度浮点运算能力是单浮点的1/3,G92的是1/10。
作者: koppie    时间: 2009-1-14 09:05
1/3不大可能
24位有效数字的单精度, 53位有效数字的双精度, 位数上就将近3倍
加法还好说, 乘除法性能做到1/5就非常牛了

我听说的性能GT200双精度大概是1/7性能

目前纯理论双精度性能最好还是RV770的1/5, 当然我不是说RV770的通用机算能力最好

还是260吧,也不知道看谁发的信息,260的双精度浮点运算能力是单浮点的1/3,G92的是1/10。
HuaErZ 发表于 2009-1-14 08:53

作者: leonloreal    时间: 2009-1-14 09:14
哎,什么时候AMD也把通用计算能力炒作一下,如果有那么几款大众化软件支持的话,我直接上个4850就好了,800个流处理单元,能力可想而知!
作者: fevaoctwh    时间: 2009-1-14 09:19
提示: 作者被禁止或删除 内容自动屏蔽
作者: leonloreal    时间: 2009-1-14 09:27
:funk:
那还是GTX260吧,呵呵。
不过现在好像价格不太好。大概什么时候能跌点儿呢。1000以内可以接受。
作者: jhj9    时间: 2009-1-14 09:31
1/3不大可能
24位有效数字的单精度, 53位有效数字的双精度, 位数上就将近3倍
加法还好说, 乘除法性能做到1/5就非常牛了

我听说的性能GT200双精度大概是1/7性能

目前纯理论双精度性能最好还是RV770的1/5, 当然 ...
koppie 发表于 2009-1-14 09:05


Tesla针对双精度作过优化,双精度性能据说就能达到理论上的1/3,远比RV770好。
RV770还是滚一边去吧
作者: jhj9    时间: 2009-1-14 09:34
本帖最后由 jhj9 于 2009-1-14 09:36 编辑
哎,什么时候AMD也把通用计算能力炒作一下,如果有那么几款大众化软件支持的话,我直接上个4850就好了,800个流处理单元,能力可想而知!
leonloreal 发表于 2009-1-14 09:14


看看现在GPGPU应用吧,在使用纯粹作弊用分数加权之前,F@H之类的GPGPU应用9600GT都可以让4850难堪。
A卡的GPGPU能力真实状况就是四肢肥大头脑简单,完全不灵活,所以效率上不去。
作者: 乌鸦2000    时间: 2009-1-14 09:43
提示: 作者被禁止或删除 内容自动屏蔽
作者: leonloreal    时间: 2009-1-14 09:46
呵呵,看来楼上两位都是N饭。
作者: leonloreal    时间: 2009-1-14 10:27
哎,难道坛子里用CUDA的人就这么少~~~~~
作者: terminator24    时间: 2009-1-14 11:39
TMPGEnc 4目前支持的CUDA加速貌似只有MPEG2
我还没成功开启H.264的加速过,MPEG2在CUDA加速下大约可分担50% CPU loading
作者: leonloreal    时间: 2009-1-14 11:46
汗,这样啊?那看来CUDA对于TMPGENC4没什么意义了,我一般都是用X264编码的。哎。
作者: terminator24    时间: 2009-1-14 11:48
忘了说我测的平台是板载GF8300,没查过是支持CUDA几版
也许9800GTX+支持的版本和特性更高也不一定
作者: leonloreal    时间: 2009-1-14 12:13
呵呵,那看来还值得拼一下!!!
作者: BugEye    时间: 2009-1-14 12:17
TMPGEnc目前只是个别特效支持CUDA。楼主一定要查清楚了再买。
作者: qinwei111    时间: 2009-1-14 12:39
TMPGEnc目前只是个别特效支持CUDA。楼主一定要查清楚了再买。
作者: koppie    时间: 2009-1-14 12:43
我没听错吧
GT200理论双精度性能是单精度的1/8
实际才达到理论的1/3, 就是单精度性能的1/24


R ukiddin

如果你说双精度性能达到单精度性能的1/3
这样的GT200我就一起买十块...


Single Precision floating point performance (peak)3.73 to 4.14 TFlops
Double Precision floating point performance (peak)311 to 345 GFlops
Tesla S1070 1U的官方性能, 自己除法(最好用双精度算,省得误差太大出现catastrophy error)
Tesla针对双精度作过优化,双精度性能据说就能达到理论上的1/3,远比RV770好。
RV770还是滚一边去吧
jhj9 发表于 2009-1-14 09:31

作者: koppie    时间: 2009-1-14 12:45
C1060的性能(GT200单核心)
Form Factor10.5" x 4.376", Dual Slot
# of Tesla GPUs1
# of Streaming Processor Cores240
Frequency of processor cores1.3GHz
Single Precision floating point performance (peak)933
Double Precision floating point performance (peak)78
Floating Point PrecisionIEEE 754 single & double
Total Dedicated Memory4GB GDDR3
Memory Speed800MHz
Memory Interface512-bit
Memory Bandwidth102GB/sec
Max Power Consumption200 W peak, 160 W typical
System InterfacePCIe x16
Auxiliary Power Connectors6-pin & 8-pin
Thermal SolutionActive fan sink
Programming environmentCUDA


25# koppie
作者: koppie    时间: 2009-1-14 12:49
想起了Unleash 1 T的那面旗帜
神的记性不是太好

Tesla针对双精度作过优化,双精度性能据说就能达到理论上的1/3,远比RV770好。
RV770还是滚一边去吧
jhj9 发表于 2009-1-14 09:31

作者: jhj9    时间: 2009-1-14 17:22
我没听错吧
GT200理论双精度性能是单精度的1/8
实际才达到理论的1/3, 就是单精度性能的1/24


R ukiddin

如果你说双精度性能达到单精度性能的1/3
这样的GT200我就一起买十块...


Single Precision floa ...
koppie 发表于 2009-1-14 12:43


http://www.pcpop.com/doc/0/353/353743_6.shtml
不过,新一代Tesla产品的双精度浮点运算能力将会提高至原来的4倍之多,新一代核心不仅仅是工艺改进频率提升而已,事实上我们对内核架构作了进一步优化,每个SM内部FP64运算单元达4个,这样NVIDIA下一代GPU的双精度浮点运算能力可以达到单精度的1/2,性能提升非常可观!


我还给记成了1/3,看来应该是1/2才对。
好像我在这里没说是GT200吧?不要臆断成GT200哦,不知道出来以后型号不是GT200你买几块呢?:w00t):
作者: jhj9    时间: 2009-1-14 17:24
想起了Unleash 1 T的那面旗帜
神的记性不是太好


koppie 发表于 2009-1-14 12:49


真实世界的GPGPU中连9600GSO都无法面对的东西,恐怕说它是缺陷卡都太客气了点。哈哈
你来列举一下你所谓的1T在科学计算、GPGPU应用中的能力到底如何?和N卡对比一下?{titter:]
作者: jocover    时间: 2009-1-14 19:46
本帖最后由 jocover 于 2009-1-14 19:47 编辑

支持CUDA软件还是蛮多的
可以去这里看看 http://www.nvidia.com/object/cuda_home.html
据说coreavc月底会推出CUDA版本的解码器
作者: koppie    时间: 2009-1-14 22:09
我kao, 直接GT300去了, 未发布的东西就不要拿来说事了好不好

我可以说NV的双精度与单精度一样快,
因为五年后的NV GPU直接全都双精度, 连图形运算也是...
有意义么


http://www.pcpop.com/doc/0/353/353743_6.shtml
不过,新一代Tesla产品的双精度浮点运算能力将会提高至原来的4倍之多,新一代核心不仅仅是工艺改进频率提升而已,事实上我们对内核架构作了进一步优化,每个SM内 ...
jhj9 发表于 2009-1-14 17:22

作者: leonloreal    时间: 2009-1-14 22:11
呵呵,可算来几位高手了,看来9800GTX+还是不行,不过TMPGEnc好像对于MPEG2的压缩在表现CUDA时比较理想,看来我的判断是错误的,TMPGENC对于CUDA的支持并不理想,哎,瞬间打消了我对GTX200系列的期盼!
作者: koppie    时间: 2009-1-14 22:38
什么时候发布了再yy吧. 拿现在没有的东西说事, 有意思么?
我还说中国是世界第一大国, 100年以后...

未发布的产品随便yy不太合适, 比如当年R600和GT200...


http://www.pcpop.com/doc/0/353/353743_6.shtml
不过,新一代Tesla产品的双精度浮点运算能力将会提高至原来的4倍之多,新一代核心不仅仅是工艺改进频率提升而已,事实上我们对内核架构作了进一步优化,每个SM内 ...
jhj9 发表于 2009-1-14 17:22

作者: jhj9    时间: 2009-1-14 22:41
什么时候发布了再yy吧. 拿现在没有的东西说事, 有意思么?
我还说中国是世界第一大国, 100年以后...

未发布的产品随便yy不太合适, 比如当年R600和GT200...


koppie 发表于 2009-1-14 22:38


这是NV内部人员给出的消息,算是准官方吧,这可跟fans的捕风捉影还是不同的。
另外,A卡那个1TFlops哪里体现出价值了?哪里体现出威力了呢?倒是4870在GPGPU领域都不见得打得过9600GSO,这就是所谓的1TFlops的威力?
作者: koppie    时间: 2009-1-14 22:55
我讨论目前的Tesla的双精度性能, 不是未来的
别扯单精度性能...我没有说A卡通用计算强, 我前面也特意提到
跟你说话, 动不动就岔开话题, 攻击A卡赞扬NV, 没意思

下一代核心还很远, 基于它的Tesla更远,

34# jhj9




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4