POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
12
返回列表 发新帖
楼主: Tanknet
打印 上一主题 下一主题

nVidia 通用运算CUDA架构:这编译器真阳春

[复制链接]
21#
发表于 2007-2-20 12:07 | 只看该作者
原帖由 fineday 于 2007-2-19 23:51 发表

w00t) 万一哪天Intel被AMD给ri翻在地怎么办

如果哪天AMD真的ri翻了Intel,NV早就不存在了。
回复 支持 反对

使用道具 举报

22#
发表于 2007-2-20 12:19 | 只看该作者
原帖由 Edison 于 2007-2-20 01:42 发表
1、编写dx、ogl程序的时候,大家根本没有使用OpenMP。
2、G80的ALU是MIMD+scalar+GIGA Thread的。

1. OGL和DX的数据结构以及计算方式和通用处理中的数据结构及计算方式没有可比性。
2. ALU就是ALU,没有什么MIMD+scalar+GIGA Thread之说。

[ 本帖最后由 Prescott 于 2007-2-20 12:21 编辑 ]
回复 支持 反对

使用道具 举报

23#
发表于 2007-2-20 12:51 | 只看该作者
原帖由 fineday 于 2007-2-19 23:13 发表
:p 我觉得很奇怪,ICC是不是3个月前才出来的东西?
或者,ICC出来3个月的时候,是不是非常完美?
别忘了ICC针对的是CPU,CUDA针对的是GPU。
至于双精度,late 2007。

ICC有n年的历史了……
回复 支持 反对

使用道具 举报

24#
发表于 2007-2-20 13:09 | 只看该作者
原帖由 Prescott 于 2007-2-20 12:19 发表
1. OGL和DX的数据结构以及计算方式和通用处理中的数据结构及计算方式没有可比性。
2. ALU就是ALU,没有什么MIMD+scalar+GIGA Thread之说。


GPGPU最适合的计算就是Array类的计算,这和图形处理是一样的,和GFX-GPU处理不同的是,GPGPU的API不需要理会纹理格式等DX、OGL API必须由开发人员应付的东西。

我说的G80的ALU是标量化issue设计是针对"更不用说Auto-Vectorization/multithread了"这样根本不了解G80、GPGPU的话语。
回复 支持 反对

使用道具 举报

25#
发表于 2007-2-20 23:25 | 只看该作者
原帖由 archerzz 于 2007-2-20 12:51 发表

ICC有n年的历史了……

:p 用一个n年历史的东西的成熟度来和新出现不到3个月的玩意儿比,很公平么?
回复 支持 反对

使用道具 举报

26#
 楼主| 发表于 2007-2-21 15:13 | 只看该作者
GPGPU最适合的计算就是Array类的计算,这和图形处理是一样的,和GFX-GPU处理不同的是,GPGPU的API不需要理会纹理格式等DX、OGL API必须由开发人员应付的东西。

我说的G80的ALU是标量化issue设计是针对"更不用说Auto-Vectorization/multithread了"这样根本不了解G80、GPGPU的话语。


我知道的啦,标量化issue是不错,可是CUDA说到底还是在要求程序员给GPU提供Array来运算,而不是它自己去发现并行性

此外GPU本身不处理Thread并行问题,因此也没有Multithread之说

ICC这个东西,我是从ICC9.0+VC6用起的,不了解过去的历史,有人介绍一下? 或者提供一下早期版本?
回复 支持 反对

使用道具 举报

27#
发表于 2007-2-21 18:12 | 只看该作者
原帖由 Tanknet 于 2007-2-21 15:13 发表


我知道的啦,标量化issue是不错,可是CUDA说到底还是在要求程序员给GPU提供Array来运算,而不是它自己去发现并行性
此外GPU本身不处理Thread并行问题,因此也没有Multithread之说

ICC这个东西,我是从 ...



:funk: :funk: :funk: :funk:

4-issue以上的乱序已经要了厂商们的命~
您老人家来了个GPU自己发现并行性,要是实现的话岂不是die size要有几个平方米~w00t)

[ 本帖最后由 the_god_of_pig 于 2007-2-21 18:27 编辑 ]
回复 支持 反对

使用道具 举报

28#
发表于 2007-2-21 18:50 | 只看该作者
原帖由 不老牛奶 于 2007-2-21 18:48 发表
现在还没有哪个CPU厂商强到能够设计出一款自动将进程分解为适当数目线程的CPU/编译器,都是靠程序员“人工”多线程,完成一个程序的彻底两线程化就已经可以折磨死人了......

当然有这样的编译器。
回复 支持 反对

使用道具 举报

29#
发表于 2007-2-21 21:37 | 只看该作者
原帖由 不老牛奶 于 2007-2-21 18:53 发表

:rolleyes: 又来扯ICC无敌论?P大,心知肚明的事,就不要装傻了——

IBM的编译器也有啊。Sun的也有啊。我又没说ICC.
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
30#
发表于 2007-2-21 23:11 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
31#
发表于 2007-2-22 02:52 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
32#
发表于 2007-2-22 11:02 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

33#
发表于 2007-2-22 12:20 | 只看该作者
原帖由 不老牛奶 于 2007-2-22 10:18 发表

那种程度的多线程,顶多算是替程序员优化而已,大家都清楚真正意义上的多线程程序开发是什么概念吧?

当然概念不完全一样。但是对于某些计算密集型的程序这样效果也还不错。
回复 支持 反对

使用道具 举报

34#
发表于 2007-2-22 12:21 | 只看该作者
原帖由 RacingPHT 于 2007-2-22 11:02 发表
现在有人信"自动发现并行"么?

还是有效果的啦。如果你不信,那就请您解释一下这个specfp的成绩?

http://www.spec.org/osg/cpu2000/ ... 20060724-06684.html

[ 本帖最后由 Prescott 于 2007-2-22 12:26 编辑 ]
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
35#
发表于 2007-2-22 14:40 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-11 15:12

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表