POPPUR爱换

标题: 看来 everygreen 的 opencl 双精度执行存在硬件上难以逾越的问题 [打印本页]

作者: Edison    时间: 2010-4-30 02:32
标题: 看来 everygreen 的 opencl 双精度执行存在硬件上难以逾越的问题
opencl 中双精度的标准扩展是  cl_khr_fp64,但是到目前为止,AMD 一直都未能实现相应的支持,而在最近的 opencl 官方网站扩展列表中,出现了一个 amd 的厂商扩展:

http://www.khronos.org/registry/cl/extensions/amd/cl_amd_fp64.txt

Status

    Complete, shipping as part of ATi Stream SDK 2.1

Extension Type

    OpenCL device extension

Dependencies

    OpenCL 1.0 is required

Overview

    This extension provides a subset of the functionality of that provided
    by the cl_khr_fp64 extension.  When enabled, the compiler recognizes
    the double scalar and vector types, compiles expressions involving
    those types, and accepts calls to all builtin functions enabled by
    the cl_khr_fp64 extension.  However, this extension does not guarantee
    that all cl_khr_fp64 built in functions are implemented and does not
    guarantee that the built in functions that have been implemented would
    be considered conformant to the cl_khr_fp64 extension.
作者: 听觉疲劳    时间: 2010-4-30 08:25
这是不是说rv870不会出firestream版本了。
作者: gz_easy    时间: 2010-4-30 09:45
Cypress (HD5850, Cat10.4, ATI SDK 2.01, Win7 x86) force_cl_khr_fp64情况下DP Special functions无法得到支持。
[attach]1273153[/attach]
作者: tomsmith123    时间: 2010-4-30 10:39
回复 9# gz_easy

2.1 支持了FP64,但是不保证所有函数和运算都支持。
作者: kaven    时间: 2010-4-30 12:44
amd显卡在在通用计算方面到底还有那些地方落后nv的,一直没时间跟踪,amd最近进步不小啊
作者: luckissy    时间: 2010-4-30 13:48
通用计算 AMD还有不少路要走啊..
作者: eternal0    时间: 2010-4-30 16:33
不用搞什么通用计算
继续专心做游戏卡,广大玩家一定会支持的
twiki 发表于 2010-4-30 13:51


不过还是早晚要做的,就像AMD用4770趟40nm的雷一样,NV现在也是在趟GPGPU这个雷。
作者: Edison    时间: 2010-4-30 16:41
如果只是 DP 的加减乘,在 2.01 已经实现,2.1 只是以厂商扩展的方式提供了一个避免标准双精度执行时候可能遇到的问题。

不能正确执行函数的话,这个双精度的实现性能会大打折扣,例如三角函数之类的,如果使用软件方式执行,速度会慢很多。




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4