POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Elvis

您认为CUDA技术最终能让我们电脑发展走向GPGPU计算时代吗?[NVIDIA达人挑选赛]

[复制链接]
发表于 2009-7-6 14:42 | 显示全部楼层
80# iverlin
Larrabee 如果不面向桌面和个人计算,就不会做GPU了,直接就是个many core 产品,现在就可以上市了。作为主流显卡定位的GPU产品,你感觉它离普通消费者还有多少距离?
CUDA 进入大学已经是很早之前的事情了,UIUC 今年已经第三年开GPGPU 的课程,有些学校开了CUDA 已经停开了,国内来说,都是跟着走,现在用还没用起来,推广就更不必说了。
我强调的始终是实用性,脱离实用性,盲目做CUDA 的移植,问题会非常多。
07年开始,华尔街就有不少公司巨资研究CUDA 的实用性,期望通过CUDA 来提高风险模拟的效率,有一家投行和nVidia 合作,投入1000万美金,在08年一无所获,最终尴尬收场,当时的结论是CUDA 在这个方向的效能优势不明显,而开发周期太长,不实用。
忽视开发的复杂度,忽视CUDA 算法适应性的问题,忽视CUDA 计算精度的缺陷,盲目投入CUDA 的开发,最终只能买个教训。年轻学生头脑发热问题不大,决策者头脑发热,就只能自食其果了。
回复

使用道具 举报

发表于 2009-7-6 15:21 | 显示全部楼层
cuda至少让我在视频应用方面体会到了速度,不过现阶段应用软件还是太少,希望nv再接再厉,联合软件厂商推出实用的日常工作办公娱乐能用的支持cuda加速的软件来,让gpu的强大性能不单单在游戏上体现,看好cuda的未来
回复

使用道具 举报

发表于 2009-7-6 15:42 | 显示全部楼层
80# iverlin  
Larrabee 如果不面向桌面和个人计算,就不会做GPU了,直接就是个many core 产品,现在就可以上市了。作为主流显卡定位的GPU产品,你感觉它离普通消费者还有多少距离?
CUDA 进入大学已经是很早之前 ...
tomsmith123 发表于 2009-7-6 14:42

目前LARRABEE正是针对服务器和工作站的,这个市场的高利润INTEL垂涎已久。或者多年后可以从科学研究及商用转化为民用,但是当时CUDA的发展和成熟度已经不可同日而语了,INTEL要重返GPU市场却注定总是慢人一步。
回复

使用道具 举报

发表于 2009-7-6 16:02 | 显示全部楼层
83# iverlin
给你复制一点WIKI,你看看Larrabee 到底是什么。主流一块显卡的价格,昂贵吗?
LarrabeeIntel正在研发中的显卡,预计会在2008年第三季推出样本,而会在2009年正式发布。与现时的显卡不同,它是建基于x86架构,内有多个称为IA的核心,数量亦可以随意增加或减少(12-32个),官方报称浮点性能可达到TeraFLOPS级别。此外,还有矢量处理单元,用作支持SIMD。它与中央处理器相似,有一个缓存架构。核心亦支援一套新的矢量指令集,用作矢量内存、整数和浮点计算。[1]Larrabee可以同时支援DirectXOpenGL。由于是通用核心,亦可以支援物理加速。[2]2008年8月,Intel称核心数量是8的倍数,总数最少是8个,最多32个。图形API方面,它支援主流的DirectXOpenGL,Intel亦会推出自家的标准。目的是充分发挥多X86核心的性能。浮点运算方面,支援IEEE标准的单双精度。显示内存接口与ATIRadeon R600相似,探用环形总线,每个方向是512-bit。[3]各X86核心亦使用此总线互相通讯。针对影像方面,Larrabee核心内有专门的VPU元件。[4]

Larrabee 从设计最初,就明确了作为GPU 产品摊薄成本的战略,这注定了它不是奢侈品,如果这个形势都认不清,谈CUDA 或者GPGPU,是不是有点不合适?
回复

使用道具 举报

发表于 2009-7-6 16:31 | 显示全部楼层
对方辩友请注意,入门不难与实际应用是完全不同的概念:汇编语言入门比VB还简单呢,你怎么不用汇编直接写程序呢??数学入门也很容易(2岁小孩都知道1+1=2),可没见数学家遍地都是吧?

代码冗余很大、程序难 ...
weihua8206 发表于 2009-7-6 12:34


“代码冗余很大、程序难以移植及维护”
不知道这位先生如何得出 这个结论的?
"汇编语言入门比VB还简单呢"同样请问 这个结论如何得出来的?
顺便说一些常识性问题的:CUDA里面同样具有PTX汇编.
Windows程式设计里面同样也有汇编.

当然,我们讨论的是““代码冗余很大、程序难以移植及维护”,这个请问您是如何得出来的结论?

无论是CPU的多核还是CUDA,并不是所有程式都能适合多核的环境,串行是一定存在的,这个是目前无法避免的问题.

关于编写高性能的程式要不要直接使用汇编的问题,这个要结合具体情况讨论,而不是 编写高性能程式就如同您所说的那样
”认为编写WINDOWS也是理所当然的应该用汇编了“.
回复

使用道具 举报

发表于 2009-7-6 16:35 | 显示全部楼层
看看LARRABEE的研发投入成本,集成的核心数量以及晶体管的数量级,一块主流显卡的价格?INTEL告诉你的吗?
回复

使用道具 举报

发表于 2009-7-6 18:04 | 显示全部楼层
看看LARRABEE的研发投入成本,集成的核心数量以及晶体管的数量级,一块主流显卡的价格?INTEL告诉你的吗?
iverlin 发表于 2009-7-6 16:35


难道Intel告诉你,lrb只是应用在服务器和集群的高端产品?
回复

使用道具 举报

发表于 2009-7-6 18:28 | 显示全部楼层
从我们要讨论的问题看,是cuda技术能否让我们的电脑走向GPGPU计算时代。
那么这里很重要的一点是,我们的电脑怎么界定?我们的电脑日常做的最多的事情是什么?
我们的电脑是否需要这么庞大,上若干T的计算量?
事实上,世界上绝大部分的电脑做的事情是处理文档和上网,很难说需要这么庞大的计算量。
如果厂家不能找到一个新的增长点,让用户需要庞大的计算量,那么很难推动cuda在普通用户的应用。起码在可以看到的若干年内不会有,与其讨论cuda能否让电脑走向GPGPU,不如讨论如何让一个普通人需要那么庞大的,若干T的计算量,现在个人PC需要最庞大计算量的,恐怕就是3D游戏了,而这些人在整个世界的PC市场,恐怕占得比例不大,而且这也不关cuda的事情了。Intel显卡做的差,但是占有率却是最高的,不是因为它性能好,而是因为很多用户够用了。
异构计算是发展的大方向,但是需要大计算量的不会是个人用户,正常来说,是ZF,大公司,科研机构等的服务器市场。在这个环境,NV由于自己没有完整的解决方案,cpu,主板芯片等,要切入这个市场相当不容易。
我认为,cuda目前来说,开发确实难,从入门角度说,写一个能跑起来的程序并不难,难得是对程序合理的优化,难的是你把显卡的计算能力发挥出来。而这对一个商业公司来说,是需要代价的。需要提到的是,上面有人提到加速比,在我这里,如果cpu的代码也进行优化,要达到60X的加速是很困难的,如果差这么多,应该考虑一下cpu代码效率是不是太低了。
而且,大家都说cuda发展快,升级快,这是好事吗?不,从开发者的角度说,这是很糟糕的事情,因为这意味着你前面做的代码,有可能需要推翻重来才能达到好的效果……试想一下,你和客户说:你需要买新的显卡才能运行新的程序,而这显卡是半年前才买的……这些东西,对一个想推商业产品的公司都是一个必须要认真考虑的事情。X86构架这么多年来,还是比较稳定的,对一个商业公司而言,就可以带来比较低的开发成本。
手上也在做cuda的东西,但是迟迟没有投入真正的使用,原因确实是多方面的。
NV在通用计算上要走的路还很长,而且并不好走。如果因为通用计算而影响了显卡市场的发展,得失之间很难说好还是不好…………
回复

使用道具 举报

发表于 2009-7-6 18:36 | 显示全部楼层
86# iverlin
Larrabee 的显卡产品,特别是游戏显卡的价格,就是一块主流显卡的价格。
对于Intel 来说,Larrabee 就是第一个many core 的产品,通过显卡市场实现摊薄规模化,是否可以回收投资,并不是大的问题。
Larrabee 的主要研究基础就是80核,80核这样的项目又有什么回报呢?
回复

使用道具 举报

发表于 2009-7-6 19:01 | 显示全部楼层
CUDA对于PS的效用在于大图片的图像缩放、移动、翻转、滤镜处理、图层样式等等实际操作,能获得比单纯CPU软加速快得多的效率。CPU处理A2大小的无损图片就已经力不从心了。请不要拿打开图片说事,300G内存 300G图片 ...
iverlin 发表于 2009-7-6 14:11


对方辩友一而再、再而三的举PHOTOSHOP的例子,拿LIGHTSCAPE的渲染来说事!

试问对方辩友,这些是通用软件么??这些图形应用本来就是应该用专业显卡,CUDA在这些软件上的应用丝毫不能说明其在科学运算方面是可用的!!只能说明作为专业显卡搭载CUDA是有所助益的!!

对方辩友作为图形设计人员的局限使其看不到在通用领域的程序员对CUDA的普遍不认同!!请对方辩友咨询下身边使用MATLAB、MAX-PLUS等通用软件的程序员,虚心听听大家对CUDA的看法,对方就会发现:在图形应用领域之外,至少目前,CUDA是远远落后于CT的,几乎没有程序员愿意使用它。
回复

使用道具 举报

发表于 2009-7-6 19:34 | 显示全部楼层
“代码冗余很大、程序难以移植及维护”
不知道这位先生如何得出 这个结论的?
"汇编语言入门比VB还简单呢"同样请问 这个结论如何得出来的?
顺便说一些常识性问题的:CUDA里面同样具有PTX汇编.
Windows程式设 ...
玉清 发表于 2009-7-6 16:31


对方辩友显然没有过作为汇编程序员实际开发的经验。

扫盲:汇编语言是低级语言,一切高级语言都是基于低级语言的,在编译的时候都会按一定的规则转换成汇编语言。再由底层编译器译为机器码来执行。汇编语言可以直接对应机器码,由它转换为机器语言几乎是没有效能损耗的,但高级语言为了有利于结构化设计,其编译的代码必然会有冗余!

在简单指令集中,汇编语言代码种类很少,所以极易入门,但用其编写程序时却需要绞尽脑汁、一万行代码才能实现C语言中几百条代码的功能(当然了,这几百条代码用编译器编译出的代码可能两万行都不止,所以说汇编语言直接编程是执行效率最高的),而且移植难度极高,如果把一段X86的汇编代码移植到POWERMAC,几乎全部代码都需要重写,这是令人抓狂的!!

而CUDA提供给用户的界面,就像汇编语言一样晦涩:用户需要编写海量的代码来实现其它界面少量代码就能实现的功能。诚然、这些代码运行起来或许是高效的、快速的。但你是否考虑到程序员繁重的劳动了呢?这样即使一种盲目的自信,也是对程序员劳动的不尊重。

举几个例子说明:
1、一个MM中暑晕倒了,你是马上给她喝自来水,还是去给她泡功夫茶呢?功夫茶很好,一杯茶顶20杯自来水解渴,还提神、醒脑、养身。。。。但是等你泡完,中暑的MM已经渴死了!你极力推崇功夫茶,自己应该天天泡功夫茶喝,从来不喝水才对,为什么你不这样呢?“因为泡茶太费时间了,我还要工作、生活节奏很快……”

2、马上要上班了,你还没吃早点,给你两个选择:吃汉堡或者吃螃蟹,你怎么办?“螃蟹比汉堡好多了,但我只能吃汉堡。因为吃螃蟹太费时间了,等我吃完,上班时间早过了,老板会骂死我的。我生活节奏很快,不能这么耽误时间……”

对了,程序员们生活节奏也很快,能用几十行代码,一上午昨完的工作,你偏要推荐CUDA,让他工作一星期才能完成,他能支持你吗?能不反对CUDA么?
回复

使用道具 举报

发表于 2009-7-6 20:29 | 显示全部楼层
对方辩友一而再、再而三的举PHOTOSHOP的例子,拿LIGHTSCAPE的渲染来说事!

试问对方辩友,这些是通用软件么??这些图形应用本来就是应该用专业显卡,CUDA在这些软件上的应用丝毫不能说明其在科学运算方面是可 ...
weihua8206 发表于 2009-7-6 19:01


看来您完全理解错误了,这些制图软件处理图像本来就是CPU做的事,显卡只是负责显示,比如专业显卡只能提高显示效果,在3D类软件上实现实时抗锯齿和物效等效果,
而不负责处理、渲染成像。但CUDA的介入让显卡能够帮助甚至代替CPU进行处理及渲染图像,这不正是GPGPU的范畴么?而且这些是我的举例而不是局限于这个领域,请不要偷换概念。
回复

使用道具 举报

发表于 2009-7-6 21:12 | 显示全部楼层
越扯越远 全世界有几台电脑天天搞PHOTOSHOP 如果有没有游戏产业支撑 显卡市场早就完蛋了

CUDA GPGPU 吹得再好 什么时候我不用装CPU 就可以了
回复

使用道具 举报

发表于 2009-7-6 22:06 | 显示全部楼层
越扯越远 全世界有几台电脑天天搞PHOTOSHOP 如果有没有游戏产业支撑 显卡市场早就完蛋了

CUDA GPGPU 吹得再好 什么时候我不用装CPU 就可以了
僵尸情人 发表于 2009-7-6 21:12

LS的朋友真爱钻牛角尖,关于游戏方面我已经回应你了,其他作图软件都是举例,都是回应你和别人的疑问,请回看我的帖子
那你不问下反方的朋友全世界有几台电脑天天搞编程啊?哈
回复

使用道具 举报

发表于 2009-7-6 22:18 | 显示全部楼层
而CUDA提供给用户的界面,就像汇编语言一样晦涩:用户需要编写海量的代码来实现其它界面少量代码就能实现的功能。诚然、这些代码运行起来或许是高效的、快速的。但你是否考虑到程序员繁重的劳动了呢?这样即使一种盲目的自信,也是对程序员劳动的不尊重。
weihua8206 发表于 2009-7-6 19:34


请问这句话该如何理解呢?
CUDA相对于以前的GPGPU开发环境来说,已经容易了非常多,GPU精粹2 这本书中有部分讲述了GeForce 6时代的GPGPU开发.
试想,假如没有CUDA,而仍然停留在 那远比CUDA开发复杂的GPGPU开发的早期阶段,是不是 程式员的工作量更大呢?

而且CUDA也提供了两种开发模式可以选择,Runtime和Driver.
Runtime开发比较容易上手,但是Driver API却能够带来更好的控制.
回复

使用道具 举报

发表于 2009-7-6 22:20 | 显示全部楼层
很好的活动
回复

使用道具 举报

发表于 2009-7-6 22:25 | 显示全部楼层
95# 玉清
GPGPU 编程,CT 之前,最容易上手的是BROOK,不过由于AMD 收购,ATI 已经基本放弃了在HPC 领域投入,声音小了很多。
CUDA 相对于BROOK+ CAL/CTM,效能相对可以做得好一些,而比单独使用CAL/CTM 又可以容易一些,更重要的是nVidia 在GPGPU 领域投入了太多的资金。
回复

使用道具 举报

发表于 2009-7-6 23:31 | 显示全部楼层
本帖最后由 weihua8206 于 2009-7-7 00:29 编辑
看来您完全理解错误了,这些制图软件处理图像本来就是CPU做的事,显卡只是负责显示,比如专业显卡只能提高显示效果,在3D类软件上实现实时抗锯齿和物效等效果,
而不负责处理、渲染成像。但CUDA的介入让显卡能够 ...
iverlin 发表于 2009-7-6 20:29


请对方辩友不要为了辩论的结果而辩论,以一个专业图形设计人员的素质,你会不知道专业显卡在渲染上的加速作用么?“专业显卡只能提高显示效果”这种说辞实在太外行了。您说的是ISA时代的显卡么?那时的显卡确实只能提高显示效果(当然,那样的芯片也不能称作GPU)。

专业显卡之所以“专业”,并非显示效果有多好!实际上专业显卡就是为了特定软件设计了特定的指令集,供特定软件的程序员调用GPU进行3D及光影渲染运算。3DMAX之类的软件都是用CPU运算的么?对方辩友这样说实在有点误导观众的嫌疑了。

我再次强调,CUDA在图形设计软件上的应用丝毫不能说明GPGPU运算时代将要到来!相反的,类似的专业应用(注意,是专业应用,而非GPGPU所谓的“通用”运算)早就出现了,阁下难道没用过野猫7110么?那时候专业显卡就已经用来对3DMAX、lightscape、MAYA等软件进行渲染、成像以及光影动态运算的加速了!!

另外,请对方辩友正面回应我的观点,而不要用误导观众的方式来诡辩。我提出的事实是:在使用MATLAB等权威软件进行科学运算的程序员中,已经形成了一种共识,即:使用CUDA会使程序员工作量成倍增加,且难于移植和维护。如果CUDA真的如对方辩友所说的那样前途广阔、为何大家却不愿使用,而宁愿选择其它不使用GPGPU的方案呢?

在这里,我说MATLAB是通用科学计算的标志性软件,对方没有异议吧?在高等数学、有机化学、量子物理、气象分析等领域,MATLAB都是算法嵌入的主要编程工具。而对方辩友反复提到的PHOTOSHOP,能算得上通用运算软件么?一个图形处理工具而已,作为GPU的对外界面,如果CUDA对图形软件都起不到优化作用,那英伟达可以直接倒闭了!如果对方辩友认为PHOTOSHOP也是“通用计算软件”,那你用PHOTOSHOP算个平方根给我看看,或者用PHOTOSHOP给我求解个拉格朗日方程出来看看!
回复

使用道具 举报

发表于 2009-7-6 23:43 | 显示全部楼层
专业显卡够了,不明白拿PHOTOSHOP说事有什么意义,使用G卡的准专业级工作站也能很好地打开大图片,平面设计工作主要在于色彩还原,而不是打开一张图片要多少时间,如果没有300G的内存,打开一张300G的图片,不知 ...
ff0759 发表于 2009-7-6 13:22


ps的加速并不是通过cuda实现的 amd的显卡一样的可以使用

目前cuda的应用并不充分 比较好的应用仅在physx硬件加速 而大多游戏开发 仅是面对的physx的接口,而不用直接面对cuda

在其他很多方面 cuda也是失败者 如ElcomSoft开发的系列密码和wifi 破解工具,使用cuda的性能也都不如AMD的产品

MediaCoder视频转码软件 新版支持cuda 但也仅仅是编码 而不能处理视频源 也不支持two pass 适用性有很大的限制 并且质量也存在很严重的问题

cuda仅是一个企业封闭的标准,缺乏业界的广泛支持 特别是MS的支持 前途是不容乐观 最后也只会跟divx、XDR、Glide这些封闭的标准一样 一起完蛋

另外我八卦下 我的内部消息 nv中国的cuda和physx部门 在6月底基本被砍光了
回复

使用道具 举报

发表于 2009-7-6 23:46 | 显示全部楼层
请对方辩友不要为了辩论的结果而辩论,以一个专业图形设计人员的素质,你会不知道专业显卡在渲染上的加速作用么?“专业显卡只能提高显示效果”这种滑天下之大稽的说辞实在太外行了(是为了辩论刻意这么说么?这 ...
weihua8206 发表于 2009-7-6 23:31


算平方根 或者什么公式不是什么问题 关键是效能 计算并行性是否需求很大 gpu同cpu相比有多大优势
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-3-29 10:22

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表