POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 15867|回复: 51
打印 上一主题 下一主题

对CUDA 的一点期望

[复制链接]
跳转到指定楼层
#
发表于 2009-7-27 22:00 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
CUDA 目前已经成为最大规模应用的GPU HPC 计算系统,国内包括联想,浪潮在内的服务器厂商,已经在其HPC 产品线中配置了Tesla 系统,但就目前我们在联想的系统测试的情况看,开发遇到的困难还是比较多的,主要问题如下:
1. 绝大多数密集计算算法需要从写,而改写的难度相对比较大;
2. 开发平台,测试平台,运行平台的硬件差异,在调优上是不一致的,如果GPU 核心不同,那么调优的困难更大一点;
3. 缺乏目标码级的调试,甚至没有PTX 的调试工具,模拟器的结果和GPU 有差异;
4. 部分库有BUG。
在nVidia 推出新产品和新的CUDA 软件中,希望能够改善相同PTX 在不同硬件的运行差异,也就是说,可以让程序员在任何一代支持CUDA 的开发环境中开发,而调优不会遇到太多的问题。
BUG 可以慢慢改,维持一个相对抽象稳定的描述语言,还是必要的。
改善了CUDA 的可编程性,降低了CUDA 的开发门槛,会推动CUDA 的进一步大规模应用,目前开发行业库,推广行业应用,都有后期维护代码成本大的隐患,解决了这个问题,CUDA 才能落地开花。
51#
发表于 2010-9-24 17:40 | 只看该作者
opencl还不够成熟  总体和CUDA差不多的  不过没有仔细研究过 CUDA那些bank conlict之类的东西最麻烦
A卡的主要问题是分支跳转不支持。。 所以性能下降很多
回复 支持 反对

使用道具 举报

50#
发表于 2010-9-24 17:36 | 只看该作者
另外就是kernel的debug 开发中是个很严重的问题
回复 支持 反对

使用道具 举报

49#
发表于 2010-9-24 17:35 | 只看该作者
不同代确实不太一样 比如Fermi的不同kernel函数就是并行的  GT200是串行的
串行想并行容易  Stream就好了
改成并行了 想串行就不方便了。。。

还有不同显卡的调优参数往往很不一样  开发起来很不方便
回复 支持 反对

使用道具 举报

48#
发表于 2010-9-24 17:01 | 只看该作者
....看看到底CPU干掉GPU 还是反之~~~
回复 支持 反对

使用道具 举报

47#
发表于 2010-9-19 22:19 | 只看该作者
金钱实在有限,先买张240试试效果。
回复 支持 反对

使用道具 举报

46#
发表于 2010-9-19 22:19 | 只看该作者
感觉很激动,可是N的现状比较艰难,I和A那个也很牛,苹果微软也是牛XX,激动很久怕就像CDMA一样,高通不也悲剧了么,你CDMA再强技术再好人家可就不用。
回复 支持 反对

使用道具 举报

45#
发表于 2010-9-19 18:22 | 只看该作者
先在我的信号处理中试试。
回复 支持 反对

使用道具 举报

44#
发表于 2010-8-30 10:51 | 只看该作者
计算机 软件 感觉还需要跟上
回复 支持 反对

使用道具 举报

43#
发表于 2010-8-29 21:48 | 只看该作者
数字信号处理中很有用
回复 支持 反对

使用道具 举报

42#
发表于 2010-7-13 21:06 | 只看该作者
我就知道coreavc的cuda应用真是太好了,国内嘛............吹牛的多。
KeyGen 发表于 2010-4-24 15:37



Coreavc里支持CUDA使我看到通用运算的未来

PS:最近才第一次用N卡 好感动
回复 支持 反对

使用道具 举报

41#
发表于 2010-5-13 00:53 | 只看该作者
CUDA 是体系架构的名称,"公开“ 这样的说法根本无法套用在上面,这就好像说让 Intel 公开 NetBurst 架构一 ...
Edison 发表于 2010-5-12 15:58


PTX只是虚拟的ISA,最底层的ISA还没有任何正式文档,希望NV能透露一下
回复 支持 反对

使用道具 举报

40#
发表于 2010-5-12 15:58 | 只看该作者
CUDA 是体系架构的名称,"公开“ 这样的说法根本无法套用在上面,这就好像说让 Intel 公开 NetBurst 架构一样,根本就是牛头不对马嘴。

CUDA C 的编译器也是公开的,PTX 也是公开的,所有的这些公开根本不会换来任何的同类型产品竞争公司的结盟。
回复 支持 反对

使用道具 举报

39#
发表于 2010-5-9 11:15 | 只看该作者
CUDA应该更公开,这样才能有更多的支持,NV太单打独斗了。
回复 支持 反对

使用道具 举报

38#
发表于 2010-5-6 08:50 | 只看该作者
现场保留怎么会难受。
Edison 发表于 2010-5-6 00:44


针对虚拟机编程不是更友好?java? 当然目前的虚拟机效率是个问题,当然nv的兴趣也未必与在跨平台或者过分的友好,除非野心远超显卡 。。。。
回复 支持 反对

使用道具 举报

37#
发表于 2010-5-6 00:44 | 只看该作者
debug靠硬件支持 会很难受的
lvhan 发表于 2010-5-5 13:16


现场保留怎么会难受。
回复 支持 反对

使用道具 举报

36#
发表于 2010-5-5 13:16 | 只看该作者
debug靠硬件支持 会很难受的
回复 支持 反对

使用道具 举报

35#
发表于 2010-4-24 15:37 | 只看该作者
我就知道coreavc的cuda应用真是太好了,国内嘛............吹牛的多。
回复 支持 反对

使用道具 举报

34#
发表于 2010-4-23 21:57 | 只看该作者
matlab 下的jacket  有质的飞跃,尤其是最致命的for循环。。。。
回复 支持 反对

使用道具 举报

33#
发表于 2010-4-13 04:53 | 只看该作者
CIDA的引用规模已经达到这么大了么,怪不得NVDA最近走势这么好,而且G100在设计上更多的倾向Tesla产品线
回复 支持 反对

使用道具 举报

32#
发表于 2010-4-12 14:42 | 只看该作者
哎 一般人玩不转cuda
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-13 22:06

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表