AMD：Radeon HD 4000系列OpenCL性能有限

tomsmith123 · 发表于 2009-12-24 19:42

回复 86# Edison
广义上CUDA 仍然属于GPGPU，GPGPU 还是一种技术的统称，表示用GPU 来做通用计算的意思。

toshibacom · 发表于 2009-12-24 19:45

回复 Edison
广义上CUDA 仍然属于GPGPU，GPGPU 还是一种技术的统称，表示用GPU 来做通用计算的意思。
tomsmith123 发表于 2009-12-24 19:42

好了，我和Edison都没错，我说的是广义的概念，他说的是狭义的概念。

Edison · 发表于 2009-12-24 19:49

这么说吧，GPU 这个概念是 NVIDIA 最先提出，而 GPGPU 这个概念是 Mark Harris 弄出来的，Mark Harris 现在是在 NVIDIA 。

GPGPU 之所以不再（应该）被采用，除了当初它提出的时候的语义与现时的 GPU 计算不符合外，还有一个问题，那就是实际上并不存在专门的 GPGPU 这样的产品。

tomsmith123 · 发表于 2009-12-24 19:52

回复 90# Edison
GPGPU 不是什么产品，是General-Purpose computation on Graphics Processing Units 的缩写，就是在GPU 上进行的通用计算。

yihua伊华 · 发表于 2009-12-25 00:57

看到精彩讨论了，比较喜欢 E大和tomsmith123

yamhill · 发表于 2009-12-25 01:31

这个啊……

CUDA是用的图形API么？

Asuka · 发表于 2009-12-25 01:49

这个啊……

CUDA是用的图形API么？
yamhill 发表于 2009-12-25 01:31

.............

mooncocoon · 发表于 2009-12-25 10:12

本帖最后由 mooncocoon 于 2009-12-25 10:17 编辑

AMD是一家诚实的公司
+65535

跑FAH的時候，很多人都宣稱RV7的問題僅僅是優化而已
恩，優化……

yamhill · 发表于 2009-12-25 11:28

.............
Asuka 发表于 2009-12-25 01:49

您的点点点点就说明了一切

yamhill · 发表于 2009-12-25 11:28

AMD是一家诚实的公司
+65535

跑FAH的時候，很多人都宣稱RV7的問題僅僅是優化而已
恩，優化……
mooncocoon 发表于 2009-12-25 10:12

是优化问题，而且必须是优化问题！

不过……这个优化貌似要对电路下手……

tomsmith123 · 发表于 2009-12-25 11:52

回复 97# yamhill
不需要电路优化。
GPGPU 编程很花时间的，我有个MD 应用，三个月就完成了第一版，加速比只有5，然后优化了一年，最后相对加速比18。

tomsmith123 · 发表于 2009-12-25 11:53

回复 95# mooncocoon
优化和人的水平和编程习惯有关系，NUDT 能把4870×2 的Linpack 逼近极限，前提是十多人做了半年，以软件外包的代价计算，差不多是100万。

yamhill · 发表于 2009-12-25 11:56

回复 yamhill
不需要电路优化。
GPGPU 编程很花时间的，我有个MD 应用，三个月就完成了第一版，加速比只 ...
tomsmith123 发表于 2009-12-25 11:52

我们在说FAH

还有，希望你继续加油，提高加速比

yamhill · 发表于 2009-12-25 11:56

回复 mooncocoon
优化和人的水平和编程习惯有关系，NUDT 能把4870×2 的Linpack 逼近极限，前提是十多人 ...
tomsmith123 发表于 2009-12-25 11:53

好多人……

那么4870×2的实际和理论相差多大？

tomsmith123 · 发表于 2009-12-25 12:08

回复 101# yamhill
天河I 已经基本到极限了，Linpack。
极限可用性能，C1070 和9270 的差距不大。

tomsmith123 · 发表于 2009-12-25 12:10

回复 100# yamhill
我做的MD 而言，18倍已经是理论极限了。
Folding 我们可能会做，不过和F@H 不会用一种计算模式。

spinup · 发表于 2009-12-25 12:32

这贴的讨论开始转向天河一号里的4870x2是不是只是摆设的问题了。

除去linpack，以后的计算项目能用到487 ...
纳尼？发表于 2009-12-24 15:22

官方说过显卡“暂时”不能很好地提供计算能力。

---除了linpack，其他计算能力是按cpu指标算的。至于这个“暂时”有多长，估计谁都说不准

yamhill · 发表于 2009-12-25 12:35

本帖最后由 yamhill 于 2009-12-25 12:36 编辑

回复 yamhill
我做的MD 而言，18倍已经是理论极限了。
Folding 我们可能会做，不过和F@H 不会用一种计算 ...
tomsmith123 发表于 2009-12-25 12:10

FAH确实不是一种计算模式

在用FAH做对比时，都用的同样或者是类似内容的数据包（内容由斯坦福提供说明）

我感觉，还是暂时把A卡当作DSP比较好

ppeng · 发表于 2009-12-25 12:39

AMD一向有抛弃老用户的传统，看看X1950用户的痛苦吧，WIN7下没有驱动，只能强装老的VISTA驱动，结果就是BUG ...
garou 发表于 2009-12-24 11:14

我的X1650可以正常安装驱动啊

~蜜蜂~ · 发表于 2009-12-25 12:50

http://developer.amd.com/gpu/ATI ... rformance_Notes.pdf

ATI Stream SDK v2.0 文档也指出 Local data share (LDS) 在 OpenCL上不支援 R700 系列 GPU
看来 R700 那个 16kb LDS 将没有作用

帐号		自动登录	找回密码
密码			注册

AMD：Radeon HD 4000系列OpenCL性能有限

浏览过的版块