POPPUR爱换

标题: 小问一句，9800GTX+支持CUDA2.0吗？ [打印本页]

作者: leonloreal 时间: 2009-1-13 17:21
标题: 小问一句，9800GTX+支持CUDA2.0吗？
9800GTX+支持CUDA2.0吗？
想入9800GTX+，其实我对游戏不是很热衷，只是想用CUDA技术才换的N卡，本人经常使用视频编辑软件TMPGEnc，这个软件貌似支持之CUDA2.0，所以想问问各位拥有9800GTX+的大侠，最好弄个CUDA-Z的截图看看。

作者: nukualofa 时间: 2009-1-13 17:53
我想知道CUDA对什么比较敏感？频率还是流处理器数量？

作者: garou 时间: 2009-1-13 19:03
就算是8600都支持......

作者: leonloreal 时间: 2009-1-13 19:33
8600不是CUDA 1.1吗？

作者: linktoice 时间: 2009-1-13 21:41
确实有区别，自己下个Badaboom自动监测下就知道支持什么版本

作者: leonloreal 时间: 2009-1-13 22:30
哎，关键是手里没有这卡嘛，还是希望有卡的人给一些建议！

作者: jocover 时间: 2009-1-13 23:11
CUDA2.0支持9800GTX+

作者: leonloreal 时间: 2009-1-14 08:48

CUDA2.0支持9800GTX+
jocover 发表于 2009-1-13 23:11

当真？
那我就不买GTX260了，

作者: HuaErZ 时间: 2009-1-14 08:53
还是260吧，也不知道看谁发的信息，260的双精度浮点运算能力是单浮点的1/3，G92的是1/10。

作者: koppie 时间: 2009-1-14 09:05
1/3不大可能
24位有效数字的单精度, 53位有效数字的双精度, 位数上就将近3倍
加法还好说, 乘除法性能做到1/5就非常牛了

我听说的性能GT200双精度大概是1/7性能

目前纯理论双精度性能最好还是RV770的1/5, 当然我不是说RV770的通用机算能力最好

还是260吧，也不知道看谁发的信息，260的双精度浮点运算能力是单浮点的1/3，G92的是1/10。
HuaErZ 发表于 2009-1-14 08:53

作者: leonloreal 时间: 2009-1-14 09:14
哎，什么时候AMD也把通用计算能力炒作一下，如果有那么几款大众化软件支持的话，我直接上个4850就好了，800个流处理单元，能力可想而知！

作者: fevaoctwh 时间: 2009-1-14 09:19
提示: 作者被禁止或删除内容自动屏蔽

作者: leonloreal 时间: 2009-1-14 09:27
:funk:
那还是GTX260吧，呵呵。
不过现在好像价格不太好。大概什么时候能跌点儿呢。1000以内可以接受。

作者: jhj9 时间: 2009-1-14 09:31

1/3不大可能
24位有效数字的单精度, 53位有效数字的双精度, 位数上就将近3倍
加法还好说, 乘除法性能做到1/5就非常牛了

我听说的性能GT200双精度大概是1/7性能

目前纯理论双精度性能最好还是RV770的1/5, 当然 ...
koppie 发表于 2009-1-14 09:05

Tesla针对双精度作过优化，双精度性能据说就能达到理论上的1/3，远比RV770好。
RV770还是滚一边去吧

作者: jhj9 时间: 2009-1-14 09:34
本帖最后由 jhj9 于 2009-1-14 09:36 编辑

哎，什么时候AMD也把通用计算能力炒作一下，如果有那么几款大众化软件支持的话，我直接上个4850就好了，800个流处理单元，能力可想而知！
leonloreal 发表于 2009-1-14 09:14

看看现在GPGPU应用吧，在使用纯粹作弊用分数加权之前，F@H之类的GPGPU应用9600GT都可以让4850难堪。
A卡的GPGPU能力真实状况就是四肢肥大头脑简单，完全不灵活，所以效率上不去。

作者: 乌鸦2000 时间: 2009-1-14 09:43
提示: 作者被禁止或删除内容自动屏蔽

作者: leonloreal 时间: 2009-1-14 09:46
呵呵，看来楼上两位都是N饭。

作者: leonloreal 时间: 2009-1-14 10:27
哎，难道坛子里用CUDA的人就这么少~~~~~

作者: terminator24 时间: 2009-1-14 11:39
TMPGEnc 4目前支持的CUDA加速貌似只有MPEG2
我还没成功开启H.264的加速过，MPEG2在CUDA加速下大约可分担50% CPU loading

作者: leonloreal 时间: 2009-1-14 11:46
汗，这样啊？那看来CUDA对于TMPGENC4没什么意义了，我一般都是用X264编码的。哎。

作者: terminator24 时间: 2009-1-14 11:48
忘了说我测的平台是板载GF8300，没查过是支持CUDA几版
也许9800GTX+支持的版本和特性更高也不一定

作者: leonloreal 时间: 2009-1-14 12:13
呵呵，那看来还值得拼一下！！！

作者: BugEye 时间: 2009-1-14 12:17
TMPGEnc目前只是个别特效支持CUDA。楼主一定要查清楚了再买。

作者: qinwei111 时间: 2009-1-14 12:39
TMPGEnc目前只是个别特效支持CUDA。楼主一定要查清楚了再买。

作者: koppie 时间: 2009-1-14 12:43
我没听错吧
GT200理论双精度性能是单精度的1/8
实际才达到理论的1/3, 就是单精度性能的1/24

R ukiddin

如果你说双精度性能达到单精度性能的1/3
这样的GT200我就一起买十块...

Single Precision floating point performance (peak)	3.73 to 4.14 TFlops
Double Precision floating point performance (peak)	311 to 345 GFlops

Tesla S1070 1U的官方性能, 自己除法(最好用双精度算,省得误差太大出现catastrophy error)

Tesla针对双精度作过优化，双精度性能据说就能达到理论上的1/3，远比RV770好。
RV770还是滚一边去吧
jhj9 发表于 2009-1-14 09:31

作者: koppie 时间: 2009-1-14 12:45
C1060的性能(GT200单核心)

Form Factor	10.5" x 4.376", Dual Slot
# of Tesla GPUs	1
# of Streaming Processor Cores	240
Frequency of processor cores	1.3GHz
Single Precision floating point performance (peak)	933
Double Precision floating point performance (peak)	78
Floating Point Precision	IEEE 754 single & double
Total Dedicated Memory	4GB GDDR3
Memory Speed	800MHz
Memory Interface	512-bit
Memory Bandwidth	102GB/sec
Max Power Consumption	200 W peak, 160 W typical
System Interface	PCIe x16
Auxiliary Power Connectors	6-pin & 8-pin
Thermal Solution	Active fan sink
Programming environment	CUDA

25# koppie

作者: koppie 时间: 2009-1-14 12:49
想起了Unleash 1 T的那面旗帜
神的记性不是太好

Tesla针对双精度作过优化，双精度性能据说就能达到理论上的1/3，远比RV770好。
RV770还是滚一边去吧
jhj9 发表于 2009-1-14 09:31

作者: jhj9 时间: 2009-1-14 17:22

我没听错吧
GT200理论双精度性能是单精度的1/8
实际才达到理论的1/3, 就是单精度性能的1/24

R ukiddin

如果你说双精度性能达到单精度性能的1/3
这样的GT200我就一起买十块...

Single Precision floa ...
koppie 发表于 2009-1-14 12:43

http://www.pcpop.com/doc/0/353/353743_6.shtml
不过，新一代Tesla产品的双精度浮点运算能力将会提高至原来的4倍之多，新一代核心不仅仅是工艺改进频率提升而已，事实上我们对内核架构作了进一步优化，每个SM内部FP64运算单元达4个，这样NVIDIA下一代GPU的双精度浮点运算能力可以达到单精度的1/2，性能提升非常可观！

我还给记成了1/3，看来应该是1/2才对。
好像我在这里没说是GT200吧？不要臆断成GT200哦，不知道出来以后型号不是GT200你买几块呢？:w00t):

作者: jhj9 时间: 2009-1-14 17:24

想起了Unleash 1 T的那面旗帜
神的记性不是太好

koppie 发表于 2009-1-14 12:49

真实世界的GPGPU中连9600GSO都无法面对的东西，恐怕说它是缺陷卡都太客气了点。哈哈
你来列举一下你所谓的1T在科学计算、GPGPU应用中的能力到底如何？和N卡对比一下？{titter:]

作者: jocover 时间: 2009-1-14 19:46
本帖最后由 jocover 于 2009-1-14 19:47 编辑

支持CUDA软件还是蛮多的
可以去这里看看 http://www.nvidia.com/object/cuda_home.html
据说coreavc月底会推出CUDA版本的解码器

作者: koppie 时间: 2009-1-14 22:09
我kao, 直接GT300去了, 未发布的东西就不要拿来说事了好不好

我可以说NV的双精度与单精度一样快,
因为五年后的NV GPU直接全都双精度, 连图形运算也是...
有意义么

http://www.pcpop.com/doc/0/353/353743_6.shtml
不过，新一代Tesla产品的双精度浮点运算能力将会提高至原来的4倍之多，新一代核心不仅仅是工艺改进频率提升而已，事实上我们对内核架构作了进一步优化，每个SM内 ...
jhj9 发表于 2009-1-14 17:22

作者: leonloreal 时间: 2009-1-14 22:11
呵呵，可算来几位高手了，看来9800GTX+还是不行，不过TMPGEnc好像对于MPEG2的压缩在表现CUDA时比较理想，看来我的判断是错误的，TMPGENC对于CUDA的支持并不理想，哎，瞬间打消了我对GTX200系列的期盼！

作者: koppie 时间: 2009-1-14 22:38
什么时候发布了再yy吧. 拿现在没有的东西说事, 有意思么?
我还说中国是世界第一大国, 100年以后...

未发布的产品随便yy不太合适, 比如当年R600和GT200...

http://www.pcpop.com/doc/0/353/353743_6.shtml
不过，新一代Tesla产品的双精度浮点运算能力将会提高至原来的4倍之多，新一代核心不仅仅是工艺改进频率提升而已，事实上我们对内核架构作了进一步优化，每个SM内 ...
jhj9 发表于 2009-1-14 17:22

作者: jhj9 时间: 2009-1-14 22:41

什么时候发布了再yy吧. 拿现在没有的东西说事, 有意思么?
我还说中国是世界第一大国, 100年以后...

未发布的产品随便yy不太合适, 比如当年R600和GT200...

koppie 发表于 2009-1-14 22:38

这是NV内部人员给出的消息，算是准官方吧，这可跟fans的捕风捉影还是不同的。
另外，A卡那个1TFlops哪里体现出价值了？哪里体现出威力了呢？倒是4870在GPGPU领域都不见得打得过9600GSO，这就是所谓的1TFlops的威力？

作者: koppie 时间: 2009-1-14 22:55
我讨论目前的Tesla的双精度性能, 不是未来的
别扯单精度性能...我没有说A卡通用计算强, 我前面也特意提到
跟你说话, 动不动就岔开话题, 攻击A卡赞扬NV, 没意思

下一代核心还很远, 基于它的Tesla更远,

34# jhj9

欢迎光临 POPPUR爱换 (https://we.poppur.com/)