您认为CUDA技术最终能让我们电脑发展走向GPGPU计算时代吗？[NVIDIA达人挑选赛]

weihua8206 · 发表于 2009-7-16 19:14

不是的，我不太喜欢你说话的语气，我没有说这些语言只能运行在CUDA构架上，而是CUDA架构上支持这些语言“CUDA C，或者CUDA Fortran，CUDA C++，以及今后的CUDA JAVA等等”，也就是说CUDA专门为这些语言提供了开发支 ...
Mehus 发表于 2009-7-16 18:01

呵呵，请这位朋友注意，语言是软件层面的！只要投入精力去开发，任何架构的东西都可以用C++、JAVA之类的语言来封装并提供支持！而CUDA已经包含了软件层面的接口！用这个接口去二次开发做CUDA C，相当于一栋100层的高层建筑，从1到80楼只有楼梯，你修了个只能从80楼到100楼的电梯，这能改变从一楼上到100楼会累死人的现状么？

“豪华高层公寓，内有电梯”：看了这句广告词，估计业主都只有哭的份了

weihua8206 · 发表于 2009-7-16 19:29

CUDA C 编写的时候根本不存在所谓的调用抽象的硬件指令才能实现，它就是一个高级语言的扩展而已，使用 CUDA 完全不需要接触底层，只需要了解一些 CUDA 并行要素的层次即可，GPU 更新的时候，根本不需要重新编写代码也 ...
天魔发表于 2009-7-16 19:05

请这位朋友不要用空洞的言语攻击说明问题，请举出实例证明：如何用CUDA计算下列传递函数的离散曲线？G(s)=exp^(-0.005s)*400/(s^2+50s)；给出你的“完全不需要接触底层”的代码来让大家看看最有说服力。

不使用CUDA时只需要一行代码就实现，那么请您演示一下高超的编程技巧，体现CUDA的优越性吧

weihua8206 · 发表于 2009-7-16 19:37

G80和G200 在一些资料的介绍中他们的硬件层次结构比较相似，由8个SP组成一个SM（好像叫流式多核处理机），而G80/G9X的TPC纹理处理簇由2组SM组成，G200则是3组SM组成一个TPC。其中在编程中的一个BLOCK里面的线程是实际 ...
tyro 发表于 2009-7-16 19:29

G80和G200是存在严重缺陷的架构（对于GPGPU来说），其最多只能提供32位浮点数的支持，单这一点缺陷，就足以使其在图形以外的应用场合无人问津。

tomsmith123 · 发表于 2009-7-17 14:33

229# 天魔
GT200 系列是8个SP 配合1个DP模块，2个SFU，基本上，DP 的性能是单精度的不到1/8，ATI 的显卡好一点，双精度目前还不是GPU 能够显示力量的地方，包括未来的Larrabee。

weihua8206 · 发表于 2009-7-17 14:36

你还是再看看 CUDA 的文档再说吧：

http://developer.download.nvidia.com/compute/cuda/2_0/docs/NVIDIA_CUDA_Programming_Guide_2.0.pdf

A.1.4 Specifications for Compute Capability 1.3
Support fo ...
天魔发表于 2009-7-17 13:36

对方辩友还是好好做足功课再来引用吧：目前的G200芯片中只有一个流处理器能进行双精度运算，其运算效率很低，速度也远比不上CPU。GPGPU的卖点就是运算速度和效率，既没效率又没速度，空谈支持，恐怕英伟达的设计人员自己都不好意思提“Support for double-precision floating-point numbers”这句话。

对方辩友引用CUDA的缺点来论证己方论点，这不是自己往枪口上撞么？功课做得不到家哈

tomsmith123 · 发表于 2009-7-17 18:57

233# 天魔
CUDA 的限制还是很多的。峰值的性能，一个MAD 是算两次计算的，一旦出现分支，性能会雪崩下降，而数据从PCIE 传送也是很重要的瓶颈。
双精度计算来说，很容易出现S1070 不如双路X5530的情况。

weihua8206 · 发表于 2009-7-17 22:19

本帖最后由 weihua8206 于 2009-7-17 22:47 编辑

这里整个讨论主题中没有做好功课或者说根本没做功课的恰恰是你。

首先你提出了GT200没有双精度运算，这点已经被我批驳掉了，而后tomsmith123说的"8个SP 配合1个DP模块"又被你歪曲成GT200只有一个流处理器能进 ...
天魔发表于 2009-7-17 15:46

这位朋友说的不错，我不是底层架构的程序员，对CPU和GPU的底层架构并不很关心，也不想花很大的时间精力去研究英伟达的芯片组里面的SP单元和DP模块是怎样协同运作的。

但请你注意一个事实：世界上绝大多数的应用软件编写者都是不熟悉底层架构的，程序员们并不会面向底层去进行开发，因为那样太繁琐，太缺乏效率！这世界变化很快，你要求程序员们每次看到新一代显卡出现，都去从架构开始去熟悉硬件，这是不可能的。

作为一个芯片设计人员，如果他认为程序员们连芯片内部的模拟门开关，三极管通断都应该了然于胸的时候，只能说明他太狂妄，太自我中心，最终结果只能是被芯片的使用者所抛弃。

所以，当面对CUDA的繁琐的API时，我第一个反映是：想骂人！

也许您会说我笨，好吧，我笨，我只会用MATLAB，VS.net开发一些简单的应用程序（反正不会比WORD简单多少= =|||），英伟达看不上、并且也不愿意尊重我这样的程序员是吧？如果我告诉你一些著名杀毒软件、媒体播放器、甚至USB板卡及其配套驱动也是我们这些程序员做出来的时候，你会怎样想呢？

“我们英伟达是老大，我们才看不上你，你爱用不用？我的东西计算快，就算只提供汇编接口，那些高级程序员也不得不用。我说的可不包括你们这些没文化的烂程序员哈。”你是不是想这样回答我？告诉你，一个脱离大众的人是注定要孤立的，一项被广大应用者诟病的技术是注定要消亡的！别陶醉在那些炫目的技术参数里了，你自己用过么？（用赵本山的话说：“你跺你也麻！——让你用CUDA做个大的项目，你也一样会骂设计者不是东西”）

以现在英伟达提供的CUDA来说，易用性远远不够，如果英伟达也像这位朋友一样的态度：“我们的东西用着就是难，用不明白一边呆着去！

”。那我们只能说：您自己好好玩CUDA去好了，我们就当你CUDA不存在了

。

weihua8206 · 发表于 2009-7-17 22:36

本帖最后由 weihua8206 于 2009-7-18 16:43 编辑

绝对支持NVIDIA 的CUDA技术（4）

4.通过期望最大化算法的高斯混合模型具体个案体现出CUDA技术的易用性，高效性，快速性。

他是一个CUDA技术实施期望最大化算法的高斯混合模型。在我的机器，它提供了性能提升与170x的CPU的参考版本。见该报告可在http://andrewharp.com/gmmcuda以获取更多信息

这是一个并行执行的期望最大化算法的高斯混合模型，旨在运行于NVIDIA显卡支持CUDA技术。 *在我的机器，它提供了性能提升与170x的CPU的参考版本。
见该报告的更多信息。
有趣的代码是在gpugaumixmod.h和gpugaumixmod_kernel.h 。提到CPU的执行情况列入cpugaumixmod.h 。
它可以被集成到任何C程序的CUDA技术使系统。此外， Matlab的一体化提供gmm.cu.
期望最大化是一个功能强大的方法收敛到一个地方的最高。 K -均值聚类是一种特殊情况，期望最大化高斯集群。
RoME仔发表于 2009-7-17 22:21

提醒下这位反方辩友：抄袭文章的时候不要用机器自动翻译好么？要么你直接抄英文，要么认真手动翻译一下，这种火星文相信大家看了都很想打你一顿！

另外：摘录文章请注明出处，而且不能100%的抄录。一点自己的东西都没有怎么能行？

weihua8206 · 发表于 2009-7-18 12:37

本帖最后由 weihua8206 于 2009-7-18 16:48 编辑

插句嘴，觉得你有点放赖了。
NV绝对不会不努力让CUDA编程变得简单，绝对不会对你说你认为NV会说的话。
但是，目前来看，你并不如你的辩友了解CUDA编程则是事实，请正视。
长风发表于 2009-7-18 02:12

我的反方辩友们有几个比我更了解CUDA，并且实际应用过，他们得出的结论都是CUDA不能代表GPGPU的未来，也列举了非常多的实例来证明，想了解的话，请你爬楼到前页好好看吧。
我没用过CUDA不假，因为我草草看了一遍就放弃使用它了，因为我不喜欢它的繁琐。
而正方的辩友们除了列举一大堆硬件规范出来，没有举出任何应用中的实例，他们自己都没有用CUDA做过项目，就大谈CUDA如何如何优秀：如果他们真的觉得CUDA好，你认为他们会不用么？

241# weihua8206

另外，NV芯片的设计人员，他们会认为程序员应该了解门电路的开关通断吗？

你说话有点谱好不？
长风发表于 2009-7-18 02:12

首先，这是夸张的修辞方法，本人辅修中文系的，不靠谱吧？（其实上，西方的科幻作家几乎都是理科辅修文学的，所以他们写的东西才能靠谱。）

其次，这位朋友既然连发了这么多贴批评我不专业，为什么对于前面那位用金山快译照抄枪文上来的正方辩友熟视无睹呢？如果说我不爱钻研技术，应该扣分的话，那位朋友是不是应该算作弊直接开除了？

weihua8206 · 发表于 2009-7-18 16:24

本帖最后由 weihua8206 于 2009-7-18 16:33 编辑

目前的CUDA编程环境，是NV在目前的硬件环境下在能力之内做出的最友好的，这一点难以否认吧。

CUDA编程的友好性缺陷，不是NV不想修正，是目前力所不能及。觉得还是不要把这个缺陷引申成为NV仇视程序员的结果吧。
长风发表于 2009-7-18 02:16

非也，我并非针对英伟达，针对的是233楼的观点：按他的说法，我对英伟达架构不精通，论述中有概念不清的问题，说CUDA不易用就是完全没根据的，反对CUDA是因为我水平不够不会用了。

其实，就算把英伟达的芯片设计人员叫来，让他编个暗黑破坏神出来，他做得到么？做芯片做的再牛，应用方面一样得程序员帮忙，人家不用，你照样傻眼。

举个例子：我下围棋比刘翔好多了，是不是我就要看不起刘翔？我跑步比霍金快，是不是在我眼里霍金就是个废人？人各有所长，即使某方面比别人懂得多，其他方面也一样会不如别人，要尊重人，自大不得。

假如英伟达也自认为架构肯定是自己有理，别人不支持都是因为水平太差（当然，此假设基本是不成立的），那CUDA以后就是程序员们的公敌了：芯片设计人员牛是吧？那好，程序员都不用他们的东西。CUDA程序都让设计芯片的编去，看他们能编出什么东西来？

另外借用你的说法：“CUDA编程的友好性缺陷，不是NV不想修正，是目前力所不能及。”既然他们目前还没有能力解决这个瓶颈，而这个瓶颈又是由于CUDA本身的复杂性决定的，那么CUDA又何以引领GPGPU的未来呢？

就像奔腾四的NET BURST架构一样，英特尔发现这个架构已经没有前途，就转而开发了酷睿架构，这是很明智的策略。如果他们还要死抱着去对抗AMD的话，现在英特尔早就死了！同样的，发现了CUDA的缺陷之后，英伟达还会死撑着去拿它“引领GPGPU的未来么”？相信英伟达不会那么不明智，未来他们肯定会祭出更优秀的GPGPU体系，而没有未来的CUDA将会逐渐被人遗忘。

arnew · 发表于 2009-7-18 21:23

界面的友好程度也不一定影响到CUDA的高效性和功能的强大，例如现在C/C++语言的友好程度虽然比不上C#/JAVA等等，但是它的高效和功能强大是无可否认的，据说强大的cryengineII也是由C++开发的。
tyro 发表于 2009-7-18 20:19

你还是没有理解大家说的cuda复杂的原因。cuda复杂主要并不是说他语法复杂，所以说写一个cuda程序很简单。
复杂是指优化复杂。优化之所以会复杂是因为需要开发者深刻了解和理解NV显卡的硬件构架。
c和c++只是一种语言，并不需要开发者考虑太多与硬件相关的问题。

arnew · 发表于 2009-7-18 21:31

本帖最后由 arnew 于 2009-7-18 21:32 编辑

非也，我并非针对英伟达，针对的是233楼的观点：按他的说法，我对英伟达架构不精通，论述中有概念不清的问题，说CUDA不易用就是完全没根据的，反对CUDA是因为我水平不够不会用了。

其实，就算把英伟达的芯片设 ...
weihua8206 发表于 2009-7-18 16:24

Intel并不是看P4的构架不行改core构架。Intel财大气粗，通常有好几个团队同时进行cpu构架的研发。

P4研发团队和酷睿是两个完全不同的团队。不过这不是其他公司，比方NV能做到的吧。

例如NV发现GT200的构架实际上已经存在问题了，但是短时间内根本无法拿出新的解决方案。

weihua8206 · 发表于 2009-7-18 22:21

本帖最后由 weihua8206 于 2009-7-18 22:28 编辑

Intel并不是看P4的构架不行改core构架。Intel财大气粗，通常有好几个团队同时进行cpu构架的研发。

P4研发团队和酷睿是两个完全不同的团队。不过这不是其他公司，比方NV能做到的吧。

例如NV发现GT200的构架实 ...
arnew 发表于 2009-7-18 21:31

英伟达是一家扩张型的企业，他们的科研实力也非常强大，他们的芯片开发肯定也是分好几个梯队的。

举个简单的例子：当年FX5XXX系列显卡在与ATI的竞争中一败涂地，但英伟达很快开发出了新一代的GF6系列，重新掌握了主动。

像英伟达这样的企业，不可能总让研发人员像蚂蚁一样不停地忙着干活：当这一代的技术正在开发中的时候，他们会组织另外一批人进行新技术的起草和筹备工作，等这一代产品面试之时，他们马上就能投入下一代产品的研制，正因为如此，他们才有能力像英特尔一样长期保持强势。

因此，我们有理由相信，英伟达不会把错误继续下去，用新的体系来代替CUDA体系是可以预见的。

题外话，如果没有AMD的K8来竞争，我们现在肯定用着数千元一片的P4 4.5G，资本家都是贪婪的，没有竞争压力，他们不会把好产片早早拿出来的。拿出来也是天文数字的价格。

wopti · 发表于 2009-7-18 23:40

在一个已经非常成熟的领域中另起炉灶，闭门造车，除非技术上有着无与伦比的优势，否则是不可能成功的。

帐号		自动登录	找回密码
密码			注册