POPPUR爱换

标题: GPU的通用计算能力怎么衡量? [打印本页]

作者: 天下18    时间: 2008-8-27 23:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: rapfish    时间: 2008-8-27 23:15
但是实际的性能和NV的9500GT差不多{lol:]

秒杀A卡全家
作者: gaiban    时间: 2008-8-27 23:22
当前,还是用大嘴巴来衡量。
作者: boris_lee    时间: 2008-8-27 23:22
fah据说是因为软件的问题,48x0只能用到320个sp,和3850性能比没什么提升,可能要等到GPU3 core
不过
3850和8600GT相当.....
作者: Bohr    时间: 2008-8-27 23:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: 5256qpqp    时间: 2008-8-28 00:06
天下你直接说9500GT秒杀R700不就行了,何必遮遮掩掩
作者: 天下18    时间: 2008-8-28 00:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: 5256qpqp    时间: 2008-8-28 00:22
问下18哪里看一个公司的市场价值
作者: cynix    时间: 2008-8-28 00:33
最近看帖子得看注册时间,呵呵,有意思
作者: Edison    时间: 2008-8-28 01:07
原帖由 boris_lee 于 2008-8-27 23:22 发表
fah据说是因为软件的问题,48x0只能用到320个sp,和3850性能比没什么提升,可能要等到GPU3 core
不过
3850和8600GT相当.....


GPU Client 2 在 AMD 卡上是采用 CAL/Brook+ 实现的,无法实现对具体的 ALU 进行调度控制,调度是完全由 GPU 的调度器、PC 实现的。

Mhouston 在 FAHForum 的原话是这样的:

"Not quite ahu.

The upper limit on the smaller WUs was basically 320 SPs or less. The larger WUs have more atoms so parallelize better automatically. I should note the code is complex so generalizations aren't useful other than at a high level.

We already have good VLIW utilization, so that's not the main issue. CPU overheads are holding back the GPU on smaller WUs, and we are knocking those down (you should have seen an overall PPD boost on many systems with Cat 8.8), but larger boost will require a tweak to CAL and Brook."

他说的是对于小包的 WU,性能看上去会只有 320 SP 或者更少,但是对于大块的 WU 是可以达到更佳的并行度的。

他所指出主要的原因是因为 CPU 在花费在小 WU 的负荷比较高从而抑制了 GPU 的并行度,他们正在设法把这部分的负荷弄小,催化剂 8.8 上可以看到全面的 PPD 提升,而更大的提升需要仰仗 CAL 的优化和 Brook 后端的改进。

当然也不要忽略了这段:

"Quite a bit better than small game shaders. The shaders (kernels) for Folding@Home are massive compared to game shaders so the compiler has much more opportunity to schedule. There are also much fewer memory loads/stores and straight line math. Basically, >4 for the heavy kernels and we have some that are >4.5."
作者: jhj9    时间: 2008-8-28 01:42
原帖由 Bohr 于 2008-8-27 23:57 发表
显卡什么时候支持双精度浮点,才可以yy通用计算


谁告诉你不支持了?尤其是GT200{victory:]
作者: 天下18    时间: 2008-8-28 09:23
提示: 作者被禁止或删除 内容自动屏蔽
作者: darkangel308    时间: 2008-8-28 09:26
等OpenCL和DX11-CS这种通用的GPGPU标准出来了,自然会有测试工具出现的
作者: 天下18    时间: 2008-8-28 20:46
提示: 作者被禁止或删除 内容自动屏蔽
作者: fish2fish    时间: 2008-8-28 21:36
又开始YY了,18你什么时候用9500gt把你浑身上下蛋白质的空间结构计算出来啊?
作者: kamuiyay    时间: 2008-8-28 21:52
提示: 作者被禁止或删除 内容自动屏蔽
作者: ATI专业卡    时间: 2008-8-29 12:07
原帖由 Bohr 于 2008-8-27 23:57 发表
显卡什么时候支持双精度浮点,才可以yy通用计算



9170  9250都已经硬件上支持了.
作者: heidarren    时间: 2008-8-29 14:53
难得让他又发现了ATI的短处,大家就让他发发牢骚吧
他已经很努力了,别再推翻他的理论吧
不得不说他真的很强,鸡皮蒜毛的东西都可以发现,然后把它无限放大
强。。。。。
作者: heidarren    时间: 2008-8-29 14:55
继续努力吧,你是最棒的你知道吗




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4