|
CUDA 目前已经成为最大规模应用的GPU HPC 计算系统,国内包括联想,浪潮在内的服务器厂商,已经在其HPC 产品线中配置了Tesla 系统,但就目前我们在联想的系统测试的情况看,开发遇到的困难还是比较多的,主要问题如下:
1. 绝大多数密集计算算法需要从写,而改写的难度相对比较大;
2. 开发平台,测试平台,运行平台的硬件差异,在调优上是不一致的,如果GPU 核心不同,那么调优的困难更大一点;
3. 缺乏目标码级的调试,甚至没有PTX 的调试工具,模拟器的结果和GPU 有差异;
4. 部分库有BUG。
在nVidia 推出新产品和新的CUDA 软件中,希望能够改善相同PTX 在不同硬件的运行差异,也就是说,可以让程序员在任何一代支持CUDA 的开发环境中开发,而调优不会遇到太多的问题。
BUG 可以慢慢改,维持一个相对抽象稳定的描述语言,还是必要的。
改善了CUDA 的可编程性,降低了CUDA 的开发门槛,会推动CUDA 的进一步大规模应用,目前开发行业库,推广行业应用,都有后期维护代码成本大的隐患,解决了这个问题,CUDA 才能落地开花。 |
|