POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: NewCastle
打印 上一主题 下一主题

AMD:Radeon HD 4000系列OpenCL性能有限

[复制链接]
61#
发表于 2009-12-24 19:42 | 只看该作者
回复 86# Edison
广义上CUDA 仍然属于GPGPU,GPGPU 还是一种技术的统称,表示用GPU 来做通用计算的意思。
回复 支持 反对

使用道具 举报

62#
发表于 2009-12-24 19:45 | 只看该作者
回复  Edison
广义上CUDA 仍然属于GPGPU,GPGPU 还是一种技术的统称,表示用GPU 来做通用计算的意思。
tomsmith123 发表于 2009-12-24 19:42

好了,我和Edison都没错,我说的是广义的概念,他说的是狭义的概念。
回复 支持 反对

使用道具 举报

63#
发表于 2009-12-24 19:49 | 只看该作者
这么说吧,GPU 这个概念是 NVIDIA 最先提出,而 GPGPU 这个概念是 Mark Harris 弄出来的,Mark Harris 现在是在 NVIDIA 。

GPGPU 之所以不再(应该)被采用,除了当初它提出的时候的语义与现时的 GPU 计算不符合外,还有一个问题,那就是实际上并不存在专门的 GPGPU 这样的产品。
回复 支持 反对

使用道具 举报

64#
发表于 2009-12-24 19:52 | 只看该作者
回复 90# Edison
GPGPU 不是什么产品,是General-Purpose computation on Graphics Processing Units  的缩写,就是在GPU 上进行的通用计算。
回复 支持 反对

使用道具 举报

65#
发表于 2009-12-25 00:57 | 只看该作者
看到精彩讨论了,比较喜欢 E大和tomsmith123
回复 支持 反对

使用道具 举报

66#
发表于 2009-12-25 01:31 | 只看该作者
这个啊……

CUDA是用的图形API么?
回复 支持 反对

使用道具 举报

67#
发表于 2009-12-25 01:49 | 只看该作者
这个啊……

CUDA是用的图形API么?
yamhill 发表于 2009-12-25 01:31



.............
回复 支持 反对

使用道具 举报

68#
发表于 2009-12-25 10:12 | 只看该作者
本帖最后由 mooncocoon 于 2009-12-25 10:17 编辑

AMD是一家诚实的公司
+65535

跑FAH的時候,很多人都宣稱RV7的問題僅僅是優化而已
恩,優化……
回复 支持 反对

使用道具 举报

69#
发表于 2009-12-25 11:28 | 只看该作者
.............
Asuka 发表于 2009-12-25 01:49

您的点点点点就说明了一切
回复 支持 反对

使用道具 举报

70#
发表于 2009-12-25 11:28 | 只看该作者
AMD是一家诚实的公司
+65535

跑FAH的時候,很多人都宣稱RV7的問題僅僅是優化而已
恩,優化……
mooncocoon 发表于 2009-12-25 10:12

是优化问题,而且必须是优化问题!

不过……这个优化貌似要对电路下手……
回复 支持 反对

使用道具 举报

71#
发表于 2009-12-25 11:52 | 只看该作者
回复 97# yamhill
不需要电路优化。
GPGPU 编程很花时间的,我有个MD 应用,三个月就完成了第一版,加速比只有5,然后优化了一年,最后相对加速比18。
回复 支持 反对

使用道具 举报

72#
发表于 2009-12-25 11:53 | 只看该作者
回复 95# mooncocoon
优化和人的水平和编程习惯有关系,NUDT 能把4870×2 的Linpack 逼近极限,前提是十多人做了半年,以软件外包的代价计算,差不多是100万。
回复 支持 反对

使用道具 举报

73#
发表于 2009-12-25 11:56 | 只看该作者
回复  yamhill
不需要电路优化。
GPGPU 编程很花时间的,我有个MD 应用,三个月就完成了第一版,加速比只 ...
tomsmith123 发表于 2009-12-25 11:52

我们在说FAH

还有,希望你继续加油,提高加速比
回复 支持 反对

使用道具 举报

74#
发表于 2009-12-25 11:56 | 只看该作者
回复  mooncocoon
优化和人的水平和编程习惯有关系,NUDT 能把4870×2 的Linpack 逼近极限,前提是十多人 ...
tomsmith123 发表于 2009-12-25 11:53

好多人……

那么4870×2的实际和理论相差多大?
回复 支持 反对

使用道具 举报

75#
发表于 2009-12-25 12:08 | 只看该作者
回复 101# yamhill
天河I 已经基本到极限了,Linpack。
极限可用性能,C1070 和9270 的差距不大。
回复 支持 反对

使用道具 举报

76#
发表于 2009-12-25 12:10 | 只看该作者
回复 100# yamhill
我做的MD 而言,18倍已经是理论极限了。
Folding 我们可能会做,不过和F@H 不会用一种计算模式。
回复 支持 反对

使用道具 举报

77#
发表于 2009-12-25 12:32 | 只看该作者
这贴的讨论开始转向天河一号里的4870x2是不是只是摆设的问题了。

除去linpack,以后的计算项目能用到487 ...
纳尼? 发表于 2009-12-24 15:22

官方说过显卡“暂时”不能很好地提供计算能力。

---除了linpack,其他计算能力是按cpu指标算的。至于这个“暂时”有多长,估计谁都说不准
回复 支持 反对

使用道具 举报

78#
发表于 2009-12-25 12:35 | 只看该作者
本帖最后由 yamhill 于 2009-12-25 12:36 编辑
回复  yamhill
我做的MD 而言,18倍已经是理论极限了。
Folding 我们可能会做,不过和F@H 不会用一种计算 ...
tomsmith123 发表于 2009-12-25 12:10

FAH确实不是一种计算模式

在用FAH做对比时,都用的同样或者是类似内容的数据包(内容由斯坦福提供说明)

我感觉,还是暂时把A卡当作DSP比较好
回复 支持 反对

使用道具 举报

79#
发表于 2009-12-25 12:39 | 只看该作者
AMD一向有抛弃老用户的传统,看看X1950用户的痛苦吧,WIN7下没有驱动,只能强装老的VISTA驱动,结果就是BUG ...
garou 发表于 2009-12-24 11:14

我的X1650可以正常安装驱动啊
回复 支持 反对

使用道具 举报

80#
发表于 2009-12-25 12:50 | 只看该作者
http://developer.amd.com/gpu/ATI ... rformance_Notes.pdf

ATI Stream SDK v2.0 文档也指出 Local data share (LDS) 在 OpenCL上不支援 R700 系列 GPU
看来 R700 那个 16kb LDS 将没有作用
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-9 15:23

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表