您认为CUDA技术最终能让我们电脑发展走向GPGPU计算时代吗？[NVIDIA达人挑选赛]

tomsmith123 · 发表于 2009-7-6 22:25

95# 玉清
GPGPU 编程，CT 之前，最容易上手的是BROOK，不过由于AMD 收购，ATI 已经基本放弃了在HPC 领域投入，声音小了很多。
CUDA 相对于BROOK+ CAL/CTM，效能相对可以做得好一些，而比单独使用CAL/CTM 又可以容易一些，更重要的是nVidia 在GPGPU 领域投入了太多的资金。

tomsmith123 · 发表于 2009-7-7 19:59

CUDA GPGPU 本身就是编程领域的话题，脱离了编程领域，CUDA 更没法讨论了。

tomsmith123 · 发表于 2009-7-7 20:20

CUDA GPGPU 本身就是编程领域的话题，脱离了编程领域，CUDA 更没法讨论了。

tomsmith123 · 发表于 2009-7-7 23:37

117# arnew
我们不能直接使用Larrabee，不过可以把我们的程序给Intel ，由他们在Larrabee 上运行，并返回我们结果，还在用第一批流片的成果，最近一个月，应该用第二批流片的成果了，Intel 原计划9月向测试用户提供测试板，推迟到11月或者年底了，和CT beta 一起交付。

tomsmith123 · 发表于 2009-7-9 19:49

154# 玉清
GPGPU 大致是从00年有人提，03年有初步的设想和原型，最初是Stanford 的Brook 和ATI 的CTM 配合，形成完整的产品，目前nVidia 的首席科学家，Bill Dally 曾经就是Brook 的支持者，当然现在他会说Brook 如何如何不如CUDA。
CUDA 暂时是领先的，不过CUDA 是没有能力让GPGPU 成为重要的计算力量的，保持现有代码的兼容性，将给未来的CUDA 有越来越多的负担，这是为什么nVidia 投入了这么多钱给开发商，成功还非常有限的主要原因。

tomsmith123 · 发表于 2009-7-9 21:54

CUDA 做双精度计算已经是1/8 了，如果再做软件解决，微指令集软计算大致1/7，最后可能比CPU 还要慢很多。
其实目前CUDA 的理论峰值性能很大程度是虚的，一个MA 计算是两个OP，通用计算很难用MA 的，这就打了对折了，再考虑到SPMD MIMD 这样的模式，打折就更多了。
举个简单的例子，TSUBAME 增加了170台Tesla 1070，但是双精度Linpack 仅仅不到是10TFlops，折合一台1070 的贡献是58GFlops，相当于什么呢？要低于一个两路4核Xeon 的水平。

tomsmith123 · 发表于 2009-7-16 18:06

203# 贵甲 就CUDA 环境而言，包括几部分，lib，include，CUDA tools其中包括编译器等内容，支持CUDA 的显卡驱动。基本四部分，缺一不可。
至于VC 或者一些项目模板，都没有什么意义。

tomsmith123 · 发表于 2009-7-17 14:33

229# 天魔
GT200 系列是8个SP 配合1个DP模块，2个SFU，基本上，DP 的性能是单精度的不到1/8，ATI 的显卡好一点，双精度目前还不是GPU 能够显示力量的地方，包括未来的Larrabee。

tomsmith123 · 发表于 2009-7-17 18:57

233# 天魔
CUDA 的限制还是很多的。峰值的性能，一个MAD 是算两次计算的，一旦出现分支，性能会雪崩下降，而数据从PCIE 传送也是很重要的瓶颈。
双精度计算来说，很容易出现S1070 不如双路X5530的情况。

帐号		自动登录	找回密码
密码			注册