POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 2131|回复: 18
打印 上一主题 下一主题

GPU的通用计算能力怎么衡量?

[复制链接]
头像被屏蔽
跳转到指定楼层
1#
发表于 2008-8-27 23:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
2#
发表于 2008-8-27 23:15 | 只看该作者
但是实际的性能和NV的9500GT差不多{lol:]

秒杀A卡全家
回复 支持 反对

使用道具 举报

3#
发表于 2008-8-27 23:22 | 只看该作者
当前,还是用大嘴巴来衡量。
回复 支持 反对

使用道具 举报

4#
发表于 2008-8-27 23:22 | 只看该作者
fah据说是因为软件的问题,48x0只能用到320个sp,和3850性能比没什么提升,可能要等到GPU3 core
不过
3850和8600GT相当.....
回复 支持 反对

使用道具 举报

Bohr 该用户已被删除
5#
发表于 2008-8-27 23:57 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

6#
发表于 2008-8-28 00:06 | 只看该作者
天下你直接说9500GT秒杀R700不就行了,何必遮遮掩掩
回复 支持 反对

使用道具 举报

头像被屏蔽
7#
 楼主| 发表于 2008-8-28 00:12 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

8#
发表于 2008-8-28 00:22 | 只看该作者
问下18哪里看一个公司的市场价值
回复 支持 反对

使用道具 举报

9#
发表于 2008-8-28 00:33 | 只看该作者
最近看帖子得看注册时间,呵呵,有意思
回复 支持 反对

使用道具 举报

10#
发表于 2008-8-28 01:07 | 只看该作者
原帖由 boris_lee 于 2008-8-27 23:22 发表
fah据说是因为软件的问题,48x0只能用到320个sp,和3850性能比没什么提升,可能要等到GPU3 core
不过
3850和8600GT相当.....


GPU Client 2 在 AMD 卡上是采用 CAL/Brook+ 实现的,无法实现对具体的 ALU 进行调度控制,调度是完全由 GPU 的调度器、PC 实现的。

Mhouston 在 FAHForum 的原话是这样的:

"Not quite ahu.

The upper limit on the smaller WUs was basically 320 SPs or less. The larger WUs have more atoms so parallelize better automatically. I should note the code is complex so generalizations aren't useful other than at a high level.

We already have good VLIW utilization, so that's not the main issue. CPU overheads are holding back the GPU on smaller WUs, and we are knocking those down (you should have seen an overall PPD boost on many systems with Cat 8.8), but larger boost will require a tweak to CAL and Brook."

他说的是对于小包的 WU,性能看上去会只有 320 SP 或者更少,但是对于大块的 WU 是可以达到更佳的并行度的。

他所指出主要的原因是因为 CPU 在花费在小 WU 的负荷比较高从而抑制了 GPU 的并行度,他们正在设法把这部分的负荷弄小,催化剂 8.8 上可以看到全面的 PPD 提升,而更大的提升需要仰仗 CAL 的优化和 Brook 后端的改进。

当然也不要忽略了这段:

"Quite a bit better than small game shaders. The shaders (kernels) for Folding@Home are massive compared to game shaders so the compiler has much more opportunity to schedule. There are also much fewer memory loads/stores and straight line math. Basically, >4 for the heavy kernels and we have some that are >4.5."
回复 支持 反对

使用道具 举报

11#
发表于 2008-8-28 01:42 | 只看该作者
原帖由 Bohr 于 2008-8-27 23:57 发表
显卡什么时候支持双精度浮点,才可以yy通用计算


谁告诉你不支持了?尤其是GT200{victory:]
回复 支持 反对

使用道具 举报

头像被屏蔽
12#
 楼主| 发表于 2008-8-28 09:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

13#
发表于 2008-8-28 09:26 | 只看该作者
等OpenCL和DX11-CS这种通用的GPGPU标准出来了,自然会有测试工具出现的
回复 支持 反对

使用道具 举报

头像被屏蔽
14#
 楼主| 发表于 2008-8-28 20:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

15#
发表于 2008-8-28 21:36 | 只看该作者
又开始YY了,18你什么时候用9500gt把你浑身上下蛋白质的空间结构计算出来啊?
回复 支持 反对

使用道具 举报

kamuiyay 该用户已被删除
16#
发表于 2008-8-28 21:52 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

17#
发表于 2008-8-29 12:07 | 只看该作者
原帖由 Bohr 于 2008-8-27 23:57 发表
显卡什么时候支持双精度浮点,才可以yy通用计算



9170  9250都已经硬件上支持了.
回复 支持 反对

使用道具 举报

18#
发表于 2008-8-29 14:53 | 只看该作者
难得让他又发现了ATI的短处,大家就让他发发牢骚吧
他已经很努力了,别再推翻他的理论吧
不得不说他真的很强,鸡皮蒜毛的东西都可以发现,然后把它无限放大
强。。。。。
回复 支持 反对

使用道具 举报

19#
发表于 2008-8-29 14:55 | 只看该作者
继续努力吧,你是最棒的你知道吗
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-4 17:33

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表