nVidia 通用运算CUDA架构:这编译器真阳春

acqwer · 发表于 2007-2-20 12:07

原帖由 fineday 于 2007-2-19 23:51 发表

w00t) 万一哪天Intel被AMD给ri翻在地怎么办

如果哪天AMD真的ri翻了Intel，NV早就不存在了。

Prescott · 发表于 2007-2-20 12:19

原帖由 Edison 于 2007-2-20 01:42 发表
1、编写dx、ogl程序的时候，大家根本没有使用OpenMP。
2、G80的ALU是MIMD+scalar+GIGA Thread的。

1. OGL和DX的数据结构以及计算方式和通用处理中的数据结构及计算方式没有可比性。
2. ALU就是ALU，没有什么MIMD+scalar+GIGA Thread之说。

[ 本帖最后由 Prescott 于 2007-2-20 12:21 编辑 ]

archerzz · 发表于 2007-2-20 12:51

原帖由 fineday 于 2007-2-19 23:13 发表
:p 我觉得很奇怪，ICC是不是3个月前才出来的东西？
或者，ICC出来3个月的时候，是不是非常完美？
别忘了ICC针对的是CPU，CUDA针对的是GPU。
至于双精度，late 2007。

ICC有n年的历史了……

Edison · 发表于 2007-2-20 13:09

原帖由 Prescott 于 2007-2-20 12:19 发表
1. OGL和DX的数据结构以及计算方式和通用处理中的数据结构及计算方式没有可比性。
2. ALU就是ALU，没有什么MIMD+scalar+GIGA Thread之说。

GPGPU最适合的计算就是Array类的计算，这和图形处理是一样的，和GFX-GPU处理不同的是，GPGPU的API不需要理会纹理格式等DX、OGL API必须由开发人员应付的东西。

我说的G80的ALU是标量化issue设计是针对"更不用说Auto-Vectorization/multithread了"这样根本不了解G80、GPGPU的话语。

fineday · 发表于 2007-2-20 23:25

原帖由 archerzz 于 2007-2-20 12:51 发表

ICC有n年的历史了……

:p 用一个n年历史的东西的成熟度来和新出现不到3个月的玩意儿比，很公平么?

Tanknet · 发表于 2007-2-21 15:13

GPGPU最适合的计算就是Array类的计算，这和图形处理是一样的，和GFX-GPU处理不同的是，GPGPU的API不需要理会纹理格式等DX、OGL API必须由开发人员应付的东西。

我说的G80的ALU是标量化issue设计是针对"更不用说Auto-Vectorization/multithread了"这样根本不了解G80、GPGPU的话语。

我知道的啦，标量化issue是不错，可是CUDA说到底还是在要求程序员给GPU提供Array来运算，而不是它自己去发现并行性

此外GPU本身不处理Thread并行问题,因此也没有Multithread之说

ICC这个东西，我是从ICC9.0+VC6用起的，不了解过去的历史，有人介绍一下？或者提供一下早期版本？

the_god_of_pig · 发表于 2007-2-21 18:12

原帖由 Tanknet 于 2007-2-21 15:13 发表

我知道的啦，标量化issue是不错，可是CUDA说到底还是在要求程序员给GPU提供Array来运算，而不是它自己去发现并行性
此外GPU本身不处理Thread并行问题,因此也没有Multithread之说

ICC这个东西，我是从 ...

:funk: :funk: :funk: :funk:

4-issue以上的乱序已经要了厂商们的命~
您老人家来了个GPU自己发现并行性，要是实现的话岂不是die size要有几个平方米~w00t)

[ 本帖最后由 the_god_of_pig 于 2007-2-21 18:27 编辑 ]

Prescott · 发表于 2007-2-21 18:50

原帖由 不老牛奶 于 2007-2-21 18:48 发表
现在还没有哪个CPU厂商强到能够设计出一款自动将进程分解为适当数目线程的CPU/编译器，都是靠程序员“人工”多线程，完成一个程序的彻底两线程化就已经可以折磨死人了......

当然有这样的编译器。

Prescott · 发表于 2007-2-21 21:37

原帖由 不老牛奶 于 2007-2-21 18:53 发表

:rolleyes: 又来扯ICC无敌论？P大，心知肚明的事，就不要装傻了——

IBM的编译器也有啊。Sun的也有啊。我又没说ICC.

只看该作者 · 发表于 2007-2-21 23:11

提示: 作者被禁止或删除内容自动屏蔽

只看该作者 · 发表于 2007-2-22 02:52

提示: 作者被禁止或删除内容自动屏蔽

只看该作者 · 发表于 2007-2-22 11:02

提示: 作者被禁止或删除内容自动屏蔽

Prescott · 发表于 2007-2-22 12:20

原帖由 不老牛奶 于 2007-2-22 10:18 发表

那种程度的多线程，顶多算是替程序员优化而已，大家都清楚真正意义上的多线程程序开发是什么概念吧？

当然概念不完全一样。但是对于某些计算密集型的程序这样效果也还不错。

Prescott · 发表于 2007-2-22 12:21

原帖由 RacingPHT 于 2007-2-22 11:02 发表
现在有人信"自动发现并行"么？

还是有效果的啦。如果你不信，那就请您解释一下这个specfp的成绩？

http://www.spec.org/osg/cpu2000/ ... 20060724-06684.html

[ 本帖最后由 Prescott 于 2007-2-22 12:26 编辑 ]

只看该作者 · 发表于 2007-2-22 14:40

提示: 作者被禁止或删除内容自动屏蔽

帐号		自动登录	找回密码
密码			注册

potomac 该用户已被删除	30^# 发表于 2007-2-21 23:11 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
potomac 该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	31^# 发表于 2007-2-22 02:52 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

RacingPHT 该用户已被删除	32^# 发表于 2007-2-22 11:02 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡

RacingPHT 该用户已被删除	35^# 发表于 2007-2-22 14:40 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡