POPPUR爱换

标题: CUDA有多大前途? [打印本页]

作者: shu0202    时间: 2009-10-12 09:42
标题: CUDA有多大前途?
      GPU通用计算对硬件架构的需要和单纯的游戏还是有很大不同,管线部分的灵活性、指令和数据读取的限制、数据分配、缓存需求以及后端面对数据输出的要求等都是目前通用计算的障碍。方方面面的兼顾会师的芯片架构臃肿不堪并且导致游戏过程单位效能降低。如果既要保证游戏效能还要为诸多不同性质的运算提供强大的执行能力,设计任务会变得非常复杂。这就是目前G300的处境。

      从NV40开始,NV每一款可编程芯片的设计都相当精彩,有时会被人们看作是神来之笔。NV不缺乏领先的创意,CUDA正是他向自身挑战的结果。

      反观AMD,似乎在通用计算的新领域里徘徊不前,并且更专注于“游戏卡”。这其实是由AMD的处境决定的。AMD有CPU,因而在通用计算这一块采取了保守的进度,也没有自己搞一套标准的想法。现在就让GPU去抢CPU的饭碗肯定有些费力不讨好,因为应用前景还不明朗。AMD更想走CPU+GPU的道路,而且标准有微软和苹果去折腾,自己只需要跟着出标准硬件就可以了。这样的态度使得AMD能侧重于精简类型的游戏渲染核心来抢占技术和市场先机。

      实际的结果在于HPC等高性能通用运算是不是存在CPU和GPU之间无可弥补的巨大差距?从工艺上看NV目前处于劣势,那么未来Intel或者AMD采用CPU+通用计算流处理器在工艺领先的情况下是不是能抗衡NV的CUDA模型?


作者: superbigsea    时间: 2009-10-12 10:02
转换视频很有用
作者: Michal    时间: 2009-10-12 10:48
怪兽军团:只要打败了奥特曼,地球就是我们的啦(我到底在说啥呀
作者: 66666    时间: 2009-10-12 10:57
自所谓有得必有失,NV和AMD不同的处境决定了双方在GPU之路上越走越远,相对于AMD做的越来越烂的CPU业务,NV选择从HPC入手进入通用计算市场是个很明智的选择,因为这个市场要的就是强大且容易开发的性能
作者: Asuka    时间: 2009-10-12 11:04
CUDA硬件一共才出了一代半,第二代刚公布信息,说它现在就有多强,都是骗人的

不过HPC未来的趋势么,看看10P-100P这个阶段中,TOP500的变化就知道了
作者: earcandy    时间: 2009-10-12 12:03
关键NV自己没有工厂,设计得出来,台积电未必做得出来
作者: boris_lee    时间: 2009-10-12 12:14
异构计算在HPC领域还是大有可为的
作者: xreal    时间: 2009-10-12 12:42

模拟核试验市场不错
作者: 鑫随盼动    时间: 2009-10-12 12:45
关键是MS的CS也出来了,这个和CUDA有的一拼啊,MS可是老大级的,而且CS相比CUDA也开放,我觉得CUDA危险啊
作者: eviano    时间: 2009-10-12 13:10
关键是MS的CS也出来了,这个和CUDA有的一拼啊,MS可是老大级的,而且CS相比CUDA也开放,我觉得CUDA危险啊
鑫随盼动 发表于 2009-10-12 12:45
说的极是,NV拉拢软件商的能力和MS没法比。CUDA一定会被MS淹没的。但既然MS开发这东西的话,通用计算应该有作为
作者: shu0202    时间: 2009-10-12 13:11
      NV的想法是CUDA兼容OpenCL和DriectCompute,也就是说NV的硬件在CUDA下的应用范围、性能和易用性比对手的硬件在开放标准下效果要好很多才有吸引力,目前看来NV这方面还不错,领先对手很多。但是一旦开放标准推广开NV是否还能有如此明显的优势?除非NV能坚持让CUDA远远走在OpenCL和DriectCompute前面。可是,对强劲的通用计算的需求有那么紧迫和强劲吗?
作者: shu0202    时间: 2009-10-12 13:15
关键是MS的CS也出来了,这个和CUDA有的一拼啊,MS可是老大级的,而且CS相比CUDA也开放,我觉得CUDA危险啊
鑫随盼动 发表于 2009-10-12 12:45

CUDA是跨平台的,微软的图形计算接口是面向自家操作系统的,两者的工作领域目前看来有很大差异。
作者: shu0202    时间: 2009-10-12 13:20
通用计算对我们普通消费者有毛用
xuki 发表于 2009-10-12 12:51

PhysX没用吗?将来的GPU性能级别的安全防护、网络运行、AI解析、3D视觉体验等等都是今天只靠CPU无法实现的。
作者: Prescott    时间: 2009-10-12 13:21
写几个程序就知道CUDA有多麻烦了,现在的程序员,连个多线程程序都写不好,还指望他们写出高性能的CUDA程序来?
作者: han_lijia    时间: 2009-10-12 13:23
很有钱途和前途,应该无量不会无亮
作者: yamhill    时间: 2009-10-12 13:25
GPU版Folding@home计算中

CUDA架构贡献的计算能力还是很恐怖的
作者: 红发IXFXI    时间: 2009-10-12 13:41
本帖最后由 红发IXFXI 于 2009-10-12 14:47 编辑

这个东西有点类似当年的cpu协处理器~~~~
cpu协处理器还不需要写软件。。。。这个还要写软件。。。。有点麻烦
作者: yamhill    时间: 2009-10-12 13:51
CPU协处理器嘛……

80386和80387的关系~

如果没80387,就别写浮点运算进去~
作者: 红发IXFXI    时间: 2009-10-12 14:04
写几个程序就知道CUDA有多麻烦了,现在的程序员,连个多线程程序都写不好,还指望他们写出高性能的CUDA程序来?
Prescott 发表于 2009-10-12 14:21


你的意思说拉拉比写软件很容易?
作者: Buffer    时间: 2009-10-12 14:21
这个和80386和80387的关系不一样的,要独立很多,更像当年硬件压缩卡,硬件解压卡之类的东西,但通用性还更强。

或许有一天某些场合,CPU不负责主要计算,而只是做分配,控制,协调之类的事。
作者: sagecao    时间: 2009-10-12 14:28
工业化的目的就是要大量生产,不一统何来“大量”,CUDA这些砖有东西,最终还是要走向极端环境应用的............
作者: Asuka    时间: 2009-10-12 14:49
关键是MS的CS也出来了,这个和CUDA有的一拼啊,MS可是老大级的,而且CS相比CUDA也开放,我觉得CUDA危险啊
鑫随盼动 发表于 2009-10-12 12:45


连CUDA和CS是什么东西都没搞清楚
作者: inabyss    时间: 2009-10-12 15:37
学习一下
作者: Prescott    时间: 2009-10-12 15:51
这是NV要做的事情,X86的汇编语言很容易吗?关键intel能提供很强大C和C++的编译器,即能保证效率,又能降低编程难度。如果NV也能提供强大的CUDA编译器,降低CUDA的编程难度,那也是不错的。
左脚选手 发表于 2009-10-12 15:06

你以为现在写CUDA程序是用PTX吗?不是什么事情都是编译器可以解决的,这是根本的体系结构造成的编程模型的问题。
作者: Prescott    时间: 2009-10-12 15:57
你的意思说拉拉比写软件很容易?
红发IXFXI 发表于 2009-10-12 14:04


对比双路Nehalem,LRB,CUDA三者,想要充分发挥三者的性能,如果Nehalem难度是1,CUDA难度可能会是10,LRB应该在3-5之间。
作者: jocover    时间: 2009-10-12 18:58
本帖最后由 jocover 于 2009-10-12 19:07 编辑

fermi出来后估计264可以2pass了
作者: yuanico    时间: 2009-10-12 19:19
个人只用过一个cuda程序 就是coreavc 1.9.5 感觉可以部分取代传统高清硬解模式了 不论是兼容性 cpu占有率 画质都非常完美 amd一向占优的硬解在cuda+coreavc面前基本洗洗睡 如果一定要说缺点 coreavc貌似只能解h.264和x.264 如果解码器大量应用cuda 那硬解模块真的可以舍弃了
作者: tangboyun    时间: 2009-10-12 19:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: aylwyn    时间: 2009-10-12 19:30
个人只用过一个cuda程序 就是coreavc 1.9.5 感觉可以部分取代传统高清硬解模式了 不论是兼容性 cpu占有率 画质都非常完美 amd一向占优的硬解在cuda+coreavc面前基本洗洗睡 如果一定要说缺点 coreavc貌似只能解h.264和 ...
yuanico 发表于 2009-10-12 19:19


同用CUDA看高清的~~不错的说
作者: AlanLW    时间: 2009-10-12 20:18
问题是现在cpu往着多核发展,放着cpu的核心不用,去用显卡这个大火炉+电老虎做cpu该做的事,是不是有点舍本逐末了
作者: misty    时间: 2009-10-12 20:44
这个和80386和80387的关系不一样的,要独立很多,更像当年硬件压缩卡,硬件解压卡之类的东西,但通用性还更强。

或许有一天某些场合,CPU不负责主要计算,而只是做分配,控制,协调之类的事。
Buffer 发表于 2009-10-12 14:21
问题是Intel同意吗
作者: sagecao    时间: 2009-10-12 20:52
个人只用过一个cuda程序 就是coreavc 1.9.5 感觉可以部分取代传统高清硬解模式了 不论是兼容性 cpu占有率 画质都非常完美 amd一向占优的硬解在cuda+coreavc面前基本洗洗睡 如果一定要说缺点 coreavc貌似只能解h.264和 ...
yuanico 发表于 2009-10-12 19:19


你没用过WIN7吧.............无论N/A WIN7下都不用去设置就能硬解所有MPEG/H.264格式的影片,不会出现破碎/黑斑等问题........CUDA?根本用不上.......
作者: the_god_of_pig    时间: 2009-10-12 21:00
CUDA只能是默些特别合适的应用上使用,其他的不合算
突然感觉LRB+Netburst的异构不错(YY下,哈)
作者: sagecao    时间: 2009-10-12 21:18
真的发展到GPGPU有一定规模这一步,显卡的架构仍然会改变,但是新架构绝对能兼容为以前GPU编写的CUDA程序,CUDA体系,就像X86体系一样,实现方法和内部硬件完全变化,但是编程接口绝对会兼容。其实就算是显卡,780 ...
左脚选手 发表于 2009-10-12 21:11


显卡不是CPU...........显卡芯片不断变革的,多余的电路只会导致芯片的良品下降,最终还是要淘汰的............CPU为了兼容,牺牲了多少性能?如果把CUDA绑定在GPU架构上,将来的GPU就不是GPU了........而且GPU的架构要适合MS的规范.........
作者: sagecao    时间: 2009-10-12 21:51
放P,手边一大把DXVA硬解会画面破碎的H264片子,CUDA解码就正常播放。
xxxyyyzzz0 发表于 2009-10-12 21:40

放P,用系统就能解决的问题,还要CUDA解决干嘛?多余
作者: sagecao    时间: 2009-10-12 21:53
你只要回答一个问题,DX10 架构的GT200能不能运行DX6、DX7、DX8、DX9的游戏程序?谁说GPU没有兼容性?
左脚选手 发表于 2009-10-12 21:27

完全兼容,你确认,我手上就有不少不兼容的
作者: wayne_chang    时间: 2009-10-12 22:02
GPU版Folding@home计算中

CUDA架构贡献的计算能力还是很恐怖的
yamhill 发表于 2009-10-12 13:25

从A卡换到N卡就是为了让显卡算那[email=SETI@home]SETI@home[/email]和GPUGRID......
作者: xreal    时间: 2009-10-12 22:31

CUDA可以硬解ReFrames =15 的1080p h264片子, 微软那个dxva只能达到4
作者: shu0202    时间: 2009-10-12 22:46
你只要回答一个问题,DX10 架构的GT200能不能运行DX6、DX7、DX8、DX9的游戏程序?谁说GPU没有兼容性?
左脚选手 发表于 2009-10-12 21:27

这不是一回事,现今游戏不管怎么变他的渲染方式是统一的,API本身就有兼容性。但是通用计算面对的计算模式要复杂的多,不同计算内容和目的的差异也要大得多,目前GPU架构还达不到那样的灵活性,也没法为了灵活性而牺牲性能设计,所以只好搞的规模很大。未来的CUDA应用的拓展也很难兼顾旧的架构,而CPU体系则基本不存在这样的问题。
其实你应该这样看:DX7硬件能不能运行DX8、DX9、DX10游戏模式……
作者: 66666    时间: 2009-10-12 22:59

CUDA可以硬解ReFrames =15 的1080p h264片子, 微软那个dxva只能达到4
xreal 发表于 2009-10-12 22:31



干嘛要说出来嘛,让某些人继续表演就是了,dxva兼容性无敌论又不是第一次看到了
作者: 66666    时间: 2009-10-12 23:06
这不是一回事,现今游戏不管怎么变他的渲染方式是统一的,API本身就有兼容性。但是通用计算面对的计算模式要复杂的多,不同计算内容和目的的差异也要大得多,目前GPU架构还达不到那样的灵活性,也没法为了灵活性而 ...
shu0202 发表于 2009-10-12 22:46



CPU不也有这种问题么?现在不支持MMX和SSE2的CPU,很多程序还不是跑的慢不慢的问题,根本压根都没法运行
作者: shu0202    时间: 2009-10-12 23:14
CPU不也有这种问题么?现在不支持MMX和SSE2的CPU,很多程序还不是跑的慢不慢的问题,根本压根都没法运行
66666 发表于 2009-10-12 23:06

但是改变的时间呢?除了64位和32位的问题,01年的CPU不会对今天的程序有什么兼容性问题吧?GPU可是2-3年在新的应用上基本就废了。
作者: shu0202    时间: 2009-10-12 23:22
为了向后兼容,CUDA的硬件部分就需要保持基本架构的一致性,但是从目前架构通用性上来看,GPU还根本达不到要求。除非全面支持射线追踪类型的高密度运算型架构来临,那应该是2-3年以后的事情。也许那时候通用计算的硬件和软件标准才能明朗化。
作者: yuanico    时间: 2009-10-12 23:47
你没用过WIN7吧.............无论N/A WIN7下都不用去设置就能硬解所有MPEG/H.264格式的影片,不会出现破碎/黑斑等问题........CUDA?根本用不上.......
sagecao 发表于 2009-10-12 20:52

实话实说 真没用过7 连vista都没怎么碰过 而且放视频只会用kmplayer 所以对我来说 coreavc里面打个勾就能把cpu占有率从70%降到5%是非常实用的 恨不得让它解所有视频外加pps
作者: Fredviv    时间: 2009-10-12 23:59
AMD的Stream力度太小
作者: boris_lee    时间: 2009-10-13 09:09
但是改变的时间呢?除了64位和32位的问题,01年的CPU不会对今天的程序有什么兼容性问题吧?GPU可是2-3年在新的应用上基本就废了。
shu0202 发表于 2009-10-12 23:14

01年大部分CPU没SSE2
现在很多SSE2程序了。
作者: customize    时间: 2009-10-13 11:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: elisha    时间: 2009-10-13 13:46
兼容很难吗?PS3就能完全兼容PS2,以前是加快PS2芯片,今后随着性能提升,直接软件模拟器就搞定了。DX7的T&L,到了DX9的GPU中,已经没有专门的T&L电路,直接就shader跑T&L应用了。什么东西都要等到完全成熟再推出, ...
左脚选手 发表于 2009-10-12 23:35

PS3兼容PS2,索尼都要笑了
作者: elisha    时间: 2009-10-13 16:15
恩,很久以前的MAC,里面插了快PC卡,兼容PC了,哦,是不是啊
作者: 红发IXFXI    时间: 2009-10-13 17:06
现在讨论多大前途太早了,变数太多。看上去是蛮不错的东西。
作者: shu0202    时间: 2009-10-14 13:28
AMD的Stream力度太小
Fredviv 发表于 2009-10-12 23:59

AMD有CPU,所以没必要象NV那样激进。不过话说未来20年视觉计算会渗透到PC应用的各个角落,解决兼容性问题之后,通用计算硬件将比CPU更加重要。
作者: xreal    时间: 2009-10-14 14:07
有钱有前途,没钱没前途
作者: 大草原赶羚羊    时间: 2009-10-14 14:20
这个话题...一年多以前就谈过了......路是自己走出来的...不是别人给出来的...MS也不是一天就成MS..
作者: sanbinc.gworc    时间: 2009-10-14 15:37
这不是一回事,现今游戏不管怎么变他的渲染方式是统一的,API本身就有兼容性。但是通用计算面对的计算模式要复杂的多,不同计算内容和目的的差异也要大得多,目前GPU架构还达不到那样的灵活性,也没法为了灵活性而 ...
shu0202 发表于 2009-10-12 22:46


最后一句说的不错,老旧P3运行win7估计都没问题,显卡更新换代实在是太快了
作者: elisha    时间: 2009-10-14 21:22
那这种很久以前的MAC,不是为了兼容PC,干嘛要插快PC卡?吃饱了撑的?
现在的MAC,用的是intel CPU,可以直接装windows。
左脚选手 发表于 2009-10-14 14:33

如果那也叫兼容的话,那地球上就没有不兼容的了
作者: yamhill    时间: 2009-10-14 22:44
这个和80386和80387的关系不一样的,要独立很多,更像当年硬件压缩卡,硬件解压卡之类的东西,但通用性还更强。

或许有一天某些场合,CPU不负责主要计算,而只是做分配,控制,协调之类的事。
Buffer 发表于 2009-10-12 14:21

按照NV自己的说法,只要在CUDA程序里使用了CUDA类,那么编译出来的程序会自动调用显卡

感觉跟386+387差不多
作者: yamhill    时间: 2009-10-14 22:45
至于微软的接口嘛

只要它不搞得像DX那样底层,那么就必须兼容市场上绝大部分硬件所采用的自家标准

但由于微软手里捏的用户太多了,所以这个形势也不好说




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4