POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3282|回复: 38
打印 上一主题 下一主题

nVidia 通用运算CUDA架构:这编译器真阳春

[复制链接]
跳转到指定楼层
1#
发表于 2007-2-18 09:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
很不成熟呀,连OpenMP都没实现呢,用的是自己的一套线程函数
更不用说Auto-Vectorization/multithread了

想到ICC上手之容易,适用面之广,直令我根本不想再把CUDA Programing guide看下去,
我也没有8x00系列显卡

看来nVidia的编译器开发水平比起Intel差得还远.继续努力啊!


NV发布CUDA架构 G80万亿次科学运算
作者:Skyangeles 编辑:Skyangeles 2007-2-17 17:55:00

  

2月16号,NVIDIA公司正式发布了他们的CUDA架构(Compute Unified Device Architecture统一计算设备架构),这就是NV口中的通用GPU(GPGPU)的正式名称。本次,NV面向专业开发者们发布了CUDA软件开发包(SDK)以及C语言编译器的0.8版本。

实际上,早在去年发布G80系列显卡时,NV就已经预告了CUDA的到来。CUDA是世界上第一个针对GPU的C语言开发环境,可以充分应用GeForce 8800 GPU 128(GTX版)或96(GTS版)个流处理单元强大的浮点运算能力,解决复杂的科学运算问题。该环境目前仅支持8800系列显卡,未来还将对NV后续发布的Quadro专业显卡提供支持。根据NVIDIA的测试,8800显卡在CUDA架构中的峰值运算能力可达520GFlops,因此如果构建SLI双卡系统,可以达到1TFlops(即每秒运算1万亿次)的强大运算能力。

NV专业产品总经理Andy Keane介绍说:“目前GPU已经是足够强大的可编程处理器,非常适合大运算量的科学应用,诸如地质勘探,生物学,流体力学,金融建模等等。通过CUDA技术,所有开发人员都能够使用标准的C语言,挖掘NVIDIA GPU中多个处理单元强大的并行计算能力。”

虽然NVIDIA本次发布的CUDA开发环境已经提供了开放下载,但NV官方认为目前只有专业的程序员才是CUDA真正的用户。由于G80内部包含的128或96个流处理单元,在进行科学运算时相当于一个100颗左右CPU的大规模并行处理系统,普通的编程爱好者肯定无法驾驭其协同合作,完全发挥其性能。

CUDA开发环境目前支持Windows XP和Linux(Red Hat Enterprise Linux 4 Update 3)。遗憾的是,目前CUDA仅支持32位系统,因此在进行运算时只能够兼容单精度数据。NV透露今年晚些时候推出的新款显卡将支持64位系统,兼容双精度数据。


CUDA Toolkit Version 0.8/CUDA SDK Version 0.8以及说明文档(Windows XP/Linux)下载页面

http://developer.nvidia.com/object/cuda.html
2#
发表于 2007-2-18 19:56 | 只看该作者
有没有评测阿?谁有G80,把下面NVIDIA给的几个例子跑跑看看结果如何?:lol:
# Parallel bitonic sort
# Matrix multiplication
# Matrix transpose
# Performance profiling using timers
# Parallel prefix sum (scan) of large arrays
# Image convolution
# 1D DWT using Haar wavelet
# OpenGL and Direct3D graphics interoperation examples
# CUDA BLAS and FFT library usage examples
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
3#
发表于 2007-2-18 22:29 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

4#
发表于 2007-2-18 22:35 | 只看该作者
貌似P大很在意G80通用的performance哇w00t)
回复 支持 反对

使用道具 举报

5#
发表于 2007-2-19 09:20 | 只看该作者
双精度能超过cell吗?如果gpu成功了,cell这种混合cpu就不用混了
回复 支持 反对

使用道具 举报

6#
发表于 2007-2-19 11:56 | 只看该作者
原帖由 the_god_of_pig 于 2007-2-18 22:35 发表
貌似P大很在意G80通用的performance哇w00t)

不是老有人在说很厉害嘛,好奇一下。
回复 支持 反对

使用道具 举报

7#
发表于 2007-2-19 11:57 | 只看该作者
原帖由 maomaobear 于 2007-2-19 09:20 发表
双精度能超过cell吗?如果gpu成功了,cell这种混合cpu就不用混了

现在怎么可能超过,好歹Cell还能跑跑双精度,这个现在根本不支持双精度。

不过据说也快了。
回复 支持 反对

使用道具 举报

8#
发表于 2007-2-19 12:51 | 只看该作者
残念……偶一点都看不懂……

飘过飘过~~~:a)
回复 支持 反对

使用道具 举报

9#
发表于 2007-2-19 13:07 | 只看该作者
我也很想知道到底性能怎么样:lol:

cell的模拟地球忽悠了我们一把,

PPU的效果革命忽悠了我们一把,

某社的GPU物理运算又忽悠了我们一把,:wacko: :wacko: :wacko:


现在对暴力没什么信心了~:(
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
10#
发表于 2007-2-19 13:10 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

11#
发表于 2007-2-19 13:20 | 只看该作者
现在IBM智慧不通,只好上暴力:lol:

I还有EPIC,可以顶一会儿:wub:
回复 支持 反对

使用道具 举报

12#
发表于 2007-2-19 14:07 | 只看该作者
这么长,楼主辛苦了
回复 支持 反对

使用道具 举报

13#
发表于 2007-2-19 17:25 | 只看该作者
原帖由 Prescott 于 2007-2-19 11:57 发表

现在怎么可能超过,好歹Cell还能跑跑双精度,这个现在根本不支持双精度。

不过据说也快了。


G80是支持FP32的,怎么可能不支持双精度呢?
回复 支持 反对

使用道具 举报

14#
发表于 2007-2-19 21:41 | 只看该作者
原帖由 jhj9 于 2007-2-19 17:25 发表


G80是支持FP32的,怎么可能不支持双精度呢?

:wacko:
因为双精度是64bit的。:lol:

[ 本帖最后由 Prescott 于 2007-2-19 21:52 编辑 ]
回复 支持 反对

使用道具 举报

15#
发表于 2007-2-19 23:13 | 只看该作者
:p 我觉得很奇怪,ICC是不是3个月前才出来的东西?
或者,ICC出来3个月的时候,是不是非常完美?
别忘了ICC针对的是CPU,CUDA针对的是GPU。
至于双精度,late 2007。
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
16#
发表于 2007-2-19 23:24 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

17#
发表于 2007-2-19 23:51 | 只看该作者
原帖由 potomac 于 2007-2-19 23:24 发表
最大问题不是性能,是只能跑在自己的平台上,以致于没法推广。

所以intel的计划是最好的。:thumbsup:

w00t) 万一哪天Intel被AMD给ri翻在地怎么办
回复 支持 反对

使用道具 举报

18#
发表于 2007-2-20 00:04 | 只看该作者
原帖由 fineday 于 2007-2-19 23:13 发表
:p 我觉得很奇怪,ICC是不是3个月前才出来的东西?
或者,ICC出来3个月的时候,是不是非常完美?
别忘了ICC针对的是CPU,CUDA针对的是GPU。
至于双精度,late 2007。

:funk: :funk:
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
19#
发表于 2007-2-20 00:30 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

20#
发表于 2007-2-20 01:42 | 只看该作者
1、编写dx、ogl程序的时候,大家根本没有使用OpenMP。
2、G80的ALU是MIMD+scalar+GIGA Thread的。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-11 07:41

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表