POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Elvis
打印 上一主题 下一主题

您认为CUDA技术最终能让我们电脑发展走向GPGPU计算时代吗?[NVIDIA达人挑选赛]

[复制链接]
61#
发表于 2009-7-16 16:38 | 只看该作者
这是NV发布支持OpenCL时的资料图片,连带的两段话是复制过来的,不是我写的


VC是语言还是IDE,就有点钻牛角尖了,对于标题内容不重要
Mehus 发表于 2009-7-16 15:55


恕我眼拙,我没有看到这段文字的任何一个地方写着DX11 CS和OpenCL是运行在CUDA架构之上.
那幅图片显示着:第一层是CUDA,第二层是C,C++,DX11,OpenCL,Fortan..................第三层 显示的是应用程式.
难也能理解为C,C++ 和Fortan Runtime也是 运行 在CUDA架构之上么.......
70年代C语言面世的时候NVIDIA公司都还没有成立内......
回复

使用道具 举报

62#
发表于 2009-7-16 17:28 | 只看该作者
不要转换概念 用了gpgpu也不等于用了cuda

cuda其实就是一c的.h 头文件而已 
贵甲 发表于 2009-7-16 17:04


泪流满面...
回复

使用道具 举报

63#
发表于 2009-7-16 19:48 | 只看该作者
CUDA  目前优化工作还是蛮难做的.
比如一个CUDA程式,即使在低端的8400 GS和在高端的Tesla C1060上面都能正确运行,但是优化效果却是不一样的.
在C1060中,可能程式要预先设置称非常多的BLOCK数量,这样才能获得较好的优化效果,但是相同程式和相同数量的BLOCK放到8400GS显卡上面,却不是最好的优化,因为8400GS的SM数量实在太少.
对于8400GS,或许BLOCK数量不应该太多(这意味着Thread宽度可能会增大)才能获得比较好的优化效果,但是对于C1060则是另外的情况.

这让程式有点不知所措.
回复

使用道具 举报

4DCGDEMO 该用户已被删除
64#
发表于 2009-7-16 21:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

65#
发表于 2009-7-17 13:33 | 只看该作者
CUDA是可能取代CPU的计算功能的
CUDA已经超越了通用的CPU 不论IU 或是AU
CUDA如此强大的芯片如果只是作为显卡GPU就太TM浪费了
NV推出的运算平台CUDA 虽然还是雏形  希望能够在GPU的强大图形计算能力
能着力开发起一种效率更高的密集数据计算解决方案。
回复

使用道具 举报

66#
发表于 2009-7-17 14:57 | 只看该作者
CUDA是可能取代CPU的计算功能的
CUDA已经超越了通用的CPU 不论IU 或是AU
CUDA如此强大的芯片如果只是作为显卡GPU就太TM浪费了
NV推出的运算平台CUDA 虽然还是雏形  希望能够在GPU的强大图形计算能力
能着力开 ...
loveboa11 发表于 2009-7-17 13:33


CUDA是不可能取代CPU计算功能的.
原因在之前已经说过很多~~~

也谈不上超越CPU之说..
回复

使用道具 举报

67#
发表于 2009-7-17 21:21 | 只看该作者
绝对支持NVIDIA 的CUDA技术(1)

CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。 将来还会支持其它语言,包括FORTRAN以及C++。

目前,支持CUDA的GPU销量已逾1亿,数以千计的软件开发人员正在使用免费的CUDA软件开发工具来解决各种专业以及家用应用程序中的问题。这些应用程序从视频与音频处理和物理效果模拟到石油天然气勘探、产品设计、医学成像以及科学研究,涵盖了各个领域。 目前市面上已经部署了超过一亿颗支持CUDA的GPU,数以千计的软件开发人员正在使用免费的CUDA软件工具来为各种应用程序加速。

CUDA技术特点
用于GPU并行应用开发的标准C语言 快速傅里叶转换(FFT)以及基本线性代数子程序(BLAS)的标准数字库 专用CUDA驱动器,用于GPU和CPU之间快速数据传输计算 CUDA驱动程序与OpenGL和DirectX图形驱动程序可以实现互操作 支持Linux 32/64位,Windows XP 32/64位以及Mac 操作系统
1.NVIDIA CUDA技术的发展,是GPU彻底的解放。以前GPU往往限制在处理单一图形图像的信息。但是CUDE的出现,使GPU有翻天覆地的变化,至今CUDE技术不仅运用在家用机器上面,而在运用在领域。

例子:
1.高光谱图像压缩的NVIDIA GPU

高光谱成像仪器能够收集数百个图像,相应的不同波长的渠道,对同一地区的地球表面。例如,美国航天局正在不断收集图像数据与文书,如喷气推进实验室的机载可见光,红外成像光谱仪( AVIRIS ) ,能够记录的可见光和近红外光谱(波长区域从0.4到2.5微米)的反射光一个地区2日至12公里宽和几公里长,使用224谱带。由此产生的多层面的数据量通常包括若干金紫荆星章,每飞行。我们已经开发出一种高效率的计算方法,有损压缩的高光谱遥感图像,保留了有关资料分析,高光谱数据与亚像素精度。拟议的方法已得到执行,使用统一计算设备架构( CUDA技术) ,对NVIDIA的GeForce 8800 GTX图形处理器,实现speedups的顺序26x相比,一个优化的执行相同的代码在一个双核CPU 。


2.稀疏矩阵向量GPU的产品
稀疏矩阵向量的产品( SpMV )是至高无上的行动中的工程和科学计算,因此,一直是话题的长期研究。不规则计算参与SpMV使其优化有挑战性。因此,巨大的努力一直致力于制定数据格式来存储稀疏矩阵的最终目的是最大限度地发挥效能。在图形处理单元( GPU )最近成为优秀的平台,产量加速因素。目前, SpMV实现对NVIDIA - GPU的已经出现在现场。这方面的工作建议和评价一个新的执行SpMV对GPU的基础上一个新的矩阵存储格式,所谓ELLPACK - R的,并比较它反对各种形式提出的其他地方。最重要的素质,这种新格式是: ( 1 )没有预处理的稀疏矩阵的需要,和( 2 )所产生的SpMV算法是非常正常。比较评价这一新的SpMV方法进行了基于一批有代表性的测试矩阵。结果表明, SpMV做法的基础上ELLPACK - R的结果要优于以往战略迄今所使用。此外,与标准的国家,最先进的超标量处理器表明,显着加速的因素所取得的GPU 。
回复

使用道具 举报

68#
发表于 2009-7-17 21:25 | 只看该作者
cuda或者类似架构在遇到分支 或者其他并行度不高的情况 必然效能会不高 此类技术也只能在特定场所成为传统手段的补充 如在向量处理较多的时候

Larrabee x86单纯在通用计算领域很可能比tesla还好,但在一般应用按照目前的情况肯定还是不如nvidia的同代的产品,也会只会活跃在某些专业领域
回复

使用道具 举报

69#
发表于 2009-7-17 21:26 | 只看该作者
本帖最后由 RoME仔 于 2009-7-17 22:14 编辑

绝对支持NVIDIA 的CUDA技术(2)

2.被彻底解放的GPU比起现在中央处理器还要有强大的运算能力。强大的运算能力使使用NV显卡的用户坐享强大的3D技术。

例子:
1.GPUTop是topology Optimizer的CUDA技术启用图形卡。它是基于简单的方法标准,更新与优化的三个层面。线弹性是利用有限元离散的笛卡儿网格。该材料密度在不断假定每个元素。由此产生的系统解决了一个矩阵的共轭梯度法的GPU内部完全。





2.运行非结构网格的CFD的解决现代图形硬件

我们执行一项非结构网格的有限体积求解三维Euler方程的可压缩流动。我们描述优化策略,尽量减少采取uncoalesced内存访问,并实现高性能。我们认为,两个案件的空气动力学性能的基准。
回复

使用道具 举报

70#
发表于 2009-7-17 22:03 | 只看该作者
本帖最后由 RoME仔 于 2009-7-17 22:15 编辑

绝对支持NVIDIA 的CUDA技术(3)

3.性能强大CUDA GPU运行能力使用户设计,操作,管理更加的得心应手,也体现CUDA的受欢迎程度。

例子:
GPU加速Monte Carlo模拟的Ising模型

计算统一设备架构( CUDA技术)是一种编程的方式履行科学计算图形处理单元( GPU )作为一个数据并行计算的设备。首先,我们应用此新技术, Monte Carlo模拟的二维铁磁平方米晶格Ising模型。通过实施的一个变种的棋盘算法,结果得到了高达60倍的速度在GPU上,而不是目前的CPU核心。一个实施三维铁磁立方晶格Ising模型的GPU是能够产生结果高达35倍的速度比目前的CPU核心。由于概念证明我们计算的临界温度的二维和三维Ising模型采用有限大小缩放技术。理论成果的二维Ising模型和以往的模拟结果的三维Ising模型可以再现。


回复

使用道具 举报

71#
发表于 2009-7-17 22:21 | 只看该作者
绝对支持NVIDIA 的CUDA技术(4)

4.通过期望最大化算法的高斯混合模型具体个案体现出CUDA技术的易用性,高效性,快速性。


他是一个CUDA技术实施期望最大化算法的高斯混合模型。在我的机器,它提供了性能提升与170x的CPU的参考版本。见该报告可在http://andrewharp.com/gmmcuda以获取更多信息

这是一个并行执行的期望最大化算法的高斯混合模型,旨在运行于NVIDIA显卡支持CUDA技术。 *在我的机器,它提供了性能提升与170x的CPU的参考版本。
见该报告的更多信息。
有趣的代码是在gpugaumixmod.h和gpugaumixmod_kernel.h 。提到CPU的执行情况列入cpugaumixmod.h 。
它可以被集成到任何C程序的CUDA技术使系统。此外, Matlab的一体化提供gmm.cu.
期望最大化是一个功能强大的方法收敛到一个地方的最高。 K -均值聚类是一种特殊情况,期望最大化高斯集群。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-4-29 15:26

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表