POPPUR爱换

标题: AMD：Radeon HD 4000系列OpenCL性能有限 [打印本页]

作者: NewCastle 时间: 2009-12-24 10:01
标题: AMD：Radeon HD 4000系列OpenCL性能有限
日前，AMD发布了ATI Stream SDK 2.0正式版，支持基于CPU和GPU的OpenCL程序开发，不过即使是在Radeon HD 4000系列上，OpenCL性能也会受到限制。

AMD发言人Micah Villmow在官网开发者论坛里指出：“我们已经知道，Radeon HD 4000系列显卡在OpenCL上存在性能问题，但暂时没有计划专门对此进行完善，因为4000系列并没有像5000系列那样专门针对OpenCL进行设计。4000系列的性能会变得更好一些，但这不是(AMD的)工作重心。”

他还进一步解释说：“举个例子，如果(在4000系列上)使用本地存储，它们都会在全局存储中模拟，所以可能需要去主内存中访问两次，这可能就会造成严重的性能损失，而在5000系列上，本地存储都会有硬件本地映射，因此速度会快好几倍……在4000系列上进行(OpenCL)编程也就不能和5000系列上一样。”

根据用户反映，在使用ATI Stream SDK 2.0 Beta 4的时候，Radeon HD 4870的性能只相当于GeForce GTX 260的五分之一左右。考虑到RV770核心从2006年就已经投入开发，而OpenCL 1.0规范直到2008年底才定稿，NVIDIA方面的GT200架构却从一开始就考虑了通用计算，出现这种局面也是可以理解的，同时也解释了ATI Stream SDK为什么不再支持Radeon HD 3000系列。

_______________________

AMD是一家诚实的公司，产品有问题就直接指出来。不像某个神棍厂，天天用马甲招摇撞骗

作者: gzpony 时间: 2009-12-24 10:02
标题: 这个这个。。。国防科大的HPC用的大量4870是怎么回事呢？
AMD：Radeon HD 4000系列OpenCL性能有限

驱动之家[原创] 作者：上方文Q 编辑：上方文Q　
2009-12-24 09:25:19 1296 人阅读 [投递]

日前，AMD发布了ATI Stream SDK 2.0正式版，支持基于CPU和GPU的OpenCL程序开发，不过即使是在Radeon HD 4000系列上，OpenCL性能也会受到限制。

AMD发言人Micah Villmow在官网开发者论坛里指出：“我们已经知道，Radeon HD 4000系列显卡在OpenCL上存在性能问题，但暂时没有计划专门对此进行完善，因为4000系列并没有像5000系列那样专门针对OpenCL进行设计。4000系列的性能会变得更好一些，但这不是(AMD的)工作重心。”

他还进一步解释说：“举个例子，如果(在4000系列上)使用本地存储，它们都会在全局存储中模拟，所以可能需要去主内存中访问两次，这可能就会造成严重的性能损失，而在5000系列上，本地存储都会有硬件本地映射，因此速度会快好几倍……在4000系列上进行(OpenCL)编程也就不能和5000系列上一样。”

根据用户反映，在使用ATI Stream SDK 2.0 Beta 4的时候，Radeon HD 4870的性能只相当于GeForce GTX 260的五分之一左右。考虑到RV770核心从2006年就已经投入开发，而OpenCL 1.0规范直到2008年底才定稿，NVIDIA方面的GT200架构却从一开始就考虑了通用计算，出现这种局面也是可以理解的，同时也解释了ATI Stream SDK为什么不再支持Radeon HD 3000系列。

作者: earcandy 时间: 2009-12-24 10:04
AMD驱动放弃旧型号的速度非常快，全功能只支持5系显卡

作者: Buffer 时间: 2009-12-24 10:07
AMD是一家诚实的公司

作者: 逆火 时间: 2009-12-24 10:07
AMD很诚实地告诉我们：换5系的卡吧。
看着手里4850，充满怀念；看着5系的价格，虚高啊；望了望某厂迟到卡仅有的几张高达图再回头看看5系的价格，杯具啊！

作者: hschun 时间: 2009-12-24 10:18
提示: 作者被禁止或删除内容自动屏蔽

作者: jocover 时间: 2009-12-24 10:20
NVIDIA Nexus Beta 今天有下载了

作者: zifuxyx 时间: 2009-12-24 10:22
天河一号的程序是天朝自己写的吧？？
不懂的爬过...........

作者: zpk167 时间: 2009-12-24 10:33
玩游戏的没影响把？？？？？？？？？？

作者: yamhill 时间: 2009-12-24 10:36
5系列目前无法运行FAH，暂时54

作者: goldman948 时间: 2009-12-24 10:43

不过说实话这个绝对是AMD标准制定的失败
OPEN CL标准的制定被NV把持了
好在现在标准已定，HD5000系就可以 ...
stcshy_2 发表于 2009-12-24 10:30

一天到晚说OPENCL多开放结果AMD一说自己OPENCL不行就转向说被NV把持
如果这个公开标准是偏向NV的话,那也是因为NV自己在通用运算方面花了心力让
公开标准也靠拢过来而已,什么绊子,真是小人心态

作者: gz_easy 时间: 2009-12-24 10:43
引用E大的话：...“估计是AMD 的 RV870 DP 单元有些地方没有完全遵循 opencl 1.0 的要求，需要一些软件上的动作。”...
详见 http://we.pcinlife.com/redirect. ... 74&pid=24659792

作者: yamhill 时间: 2009-12-24 10:44

根本就不是用OPEN CL写的
stcshy_2 发表于 2009-12-24 10:36

就是用那种和汇编差不多的玩意写的嘛

GPU2客户端抛弃了1系列卡，这可以理解，因为1系列就不是统一渲染架构；能兼容2系列、3系列、4系列卡，因为架构相似度很高；5系列卡无法运行，斯坦福说要等GPU3客户端开发出来才能有结果

我相信坛子里应该有和斯坦福那帮开发人员水平相当的，可以找他们获取技术信息

作者: 63723063 时间: 2009-12-24 10:59
天河一号纯粹是为了浮点性能冲p的政绩工程，没见过除了天朝外还有哪家国外公司大规模使用amdgpu进行科学运算的

作者: youngfriend 时间: 2009-12-24 11:09
本人倒是觉得AMD的意思是如果要玩爽OpenCL请升级到5系列

作者: 63723063 时间: 2009-12-24 11:11
amd对用户真是不负责从x1到x4杯具不断浮现，每次出了问题都以旧型号支持度不够来搪塞，天知道买了5系的未来还会出什么问题

作者: garou 时间: 2009-12-24 11:14
AMD一向有抛弃老用户的传统，看看X1950用户的痛苦吧，WIN7下没有驱动，只能强装老的VISTA驱动，结果就是BUG不断............再看看nv，6600gt的驱动都还在不断更新

作者: jocover 时间: 2009-12-24 11:17

amd对用户真是不负责从x1到x4杯具不断浮现，每次出了问题都以旧型号支持度不够来搪塞，天知道买了5系的未来 ...
63723063 发表于 2009-12-24 11:11

目前看来
fermi会支持opencl的global mem cache，而r870不支持

作者: 700 时间: 2009-12-24 11:18
AMD是一家诚实的公司

作者: chaos0714 时间: 2009-12-24 11:44
回复 21# garou

6600的驱动根本就是把以前的老驱动打包进去了，版本号都不变一下。

说起NV的更新，作为一个从NF2，NF3，NF4一路用过来的用户，对此表示无比愤慨！

作者: chinayyj 时间: 2009-12-24 12:04
买260+划算啊！

作者: Edison 时间: 2009-12-24 12:15

喯子凶
这里指的是OpenCL的性能
shesroy 发表于 2009-12-24 12:02

透过模拟实现某个功能自然会导致性能相对的剧降，4000 系列在 opencl 上就是这样，而 5000 系列配合目前的驱动则基本上能满足 opencl 1.0 的最低功能要求。

作者: garou 时间: 2009-12-24 12:21

回复 garou

6600的驱动根本就是把以前的老驱动打包进去了，版本号都不变一下。

说起NV的更新，作 ...
chaos0714 发表于 2009-12-24 11:44

大错，nv使用同一驱动构架，不论9800GT还是66000gt都使用相同的驱动程序文件。

作者: garou 时间: 2009-12-24 12:24

nv驱动放弃旧型号的速度非常快，DX10.1功能只支持200系以上部分显卡
Gartour 发表于 2009-12-24 11:04

这跟硬件有关，难道AMD 可以用驱动让X1950GT生出DX10.1功能？

作者: sunrie 时间: 2009-12-24 12:30
AMD确实抛弃老用户太快了，驱动只对新卡进行优化！

作者: tmz 时间: 2009-12-24 12:31

AMD：Radeon HD 4000系列OpenCL性能有限

驱动之家[原创] 作者：上方文Q 编辑：上方文Q　
2009-12-24 0 ...
gzpony 发表于 2009-12-24 10:02

国防大就拿他做浮点，他们可以建立自己的底层规范，和opencl ****关系。。

作者: sunrie 时间: 2009-12-24 13:17

NV也一样。
左脚选手发表于 2009-12-24 12:33

NV的老卡都能用物理、通用计算啊，我觉得比ATI做得好

作者: lightingmouse 时间: 2009-12-24 13:42
天河的设计理念真不错不是某些人JJYY能抵消的现在担心的是那批4870X2的寿命这玩意儿返修率高的吓人不知道什么时候会悲剧啊

作者: 63723063 时间: 2009-12-24 14:06
http://server.51cto.com/HPC-161496.htm关于天河

作者: jocover 时间: 2009-12-24 14:10

6600GT也行？也能通用运算和物理计算？
左脚选手发表于 2009-12-24 13:58

http://http.developer.nvidia.com/GPUGems2/gpugems2_chapter48.html

用GPGPU可以

作者: Bohr 时间: 2009-12-24 14:12
提示: 作者被禁止或删除内容自动屏蔽

作者: water3661821 时间: 2009-12-24 14:16
顶AMD
希望驱动搞好

作者: earcandy 时间: 2009-12-24 14:17

哦, 原来是硬件上的问题哦. 那靠软件是没得救了.
Gartour 发表于 2009-12-24 14:13

10.1游戏您玩过几个，有什么特色，说来听听？

作者: jocover 时间: 2009-12-24 14:19

哦, 原来是硬件上的问题哦. 那靠软件是没得救了.
Gartour 发表于 2009-12-24 14:13

有时候用软件也可以弥补硬件不足
比如本贴说的4系列模拟出来的opencl local mem和15楼的模拟DP运算等

作者: sunrie 时间: 2009-12-24 14:21

6600GT也行？也能通用运算和物理计算？
左脚选手发表于 2009-12-24 13:58

6600什么年代，HD3000是什么年代，和HD3000同一年代的N卡比一下吧，N卡这点绝对厚道一些！

作者: 63723063 时间: 2009-12-24 14:25

还以为你是行内人，原来是看了这种酸文来诋毁天河的，这篇枪文要用IBM走鹃来比，其实是对天河的很大的肯定 ...
左脚选手发表于 2009-12-24 14:21

你倒是指出不对的地方

作者: tomsmith123 时间: 2009-12-24 14:38
回复 50# sunrie
说到GPGPU，9800PRO 就可以跑，看基于什么标准了。
6600GT 跑CUDA 那是绝对不行的。

作者: yamhill 时间: 2009-12-24 14:42
想讨论天河的，建议等天河的所有部件真正投入使用并且有产出了再说……

作者: chaos0714 时间: 2009-12-24 14:59

天河一号只是linpack第五而已
top500你知道为什么用linpack？linpack只是比较直观的提供分数而已！
现 ...
6訷发表于 2009-12-24 14:47

别扯那么多，在中国找台比这更好的出来就可以了。

作者: 大草原赶羚羊 时间: 2009-12-24 14:59

国防科大的“天河一号”估计和他“独立自主操作系统”一样好吧
xml777 发表于 2009-12-24 14:52

你知道的太多了

作者: Edison 时间: 2009-12-24 15:14

6600GT是NV40架构的，都不支持CUDA，就不要谈GPGPU了。
左脚选手发表于 2009-12-24 14:35

GPGPU 是比 CUDA 落后的 GPU 通用计算概念。

GPGPU 是使用图形 API，例如 DX9、OpenGL，而 CUDA 在硬件上是指具备 shared memory 的 G8X GPU，软件上是指 CUDA C 等高级编程语言的 GPU Computing 计算模型。

作者: 63723063 时间: 2009-12-24 15:14
'独立自主操作系统“？说的是好几年前那个linux马甲版么？

作者: yamhill 时间: 2009-12-24 15:41

天河用的不是OPENCL，在说Linpack性能摆在那了，实际性能已经不错了
纳尼？发表于 2009-12-24 15:00

一个linpack测试就成了实际使用……你继续……

作者: yamhill 时间: 2009-12-24 15:43

是的，据说科研经费超过9位数。
xml777 发表于 2009-12-24 15:30

在大学里，知道科研经费来龙去脉的都清楚是怎么一回事

作者: Asuka 时间: 2009-12-24 15:56
1. linpack本身就可以算是一连串应用程序捆绑在一起的测试，确实可以在某种程度上代表实际性能，而且这个行业的应用本来就是比较封闭的；
2. 天河一号就效率来说算不错了；
3. 天河一号是一个软硬件结合的计算系统，它的优劣和它所使用硬件的优劣没有逻辑上的联系，这点要分清楚

作者: sunrie 时间: 2009-12-24 16:02

物理计算A卡现在的5系列也不行，HD3000系列不是不想支持opencl，而是硬件不支持，这和HD没关系，只是现在 ...
左脚选手发表于 2009-12-24 14:40

所以看样子目前还是用N算了，毕竟还是主流，ATI太多地方太被动了，不爽！

作者: Sakray 时间: 2009-12-24 16:44

6600什么年代，HD3000是什么年代，和HD3000同一年代的N卡比一下吧，N卡这点绝对厚道一些！
sunrie 发表于 2009-12-24 14:21

要是用这些为基准你就上当了……抛弃老用户根本就是惯用的伎俩谁都没少干过

作者: orz2009 时间: 2009-12-24 16:47
作为一个中立FANS 我很欣慰

作者: Bohr 时间: 2009-12-24 16:58
提示: 作者被禁止或删除内容自动屏蔽

作者: sunrie 时间: 2009-12-24 18:00
至少目前通用计算和物理特效N是主流的吧？

作者: tomsmith123 时间: 2009-12-24 18:07
回复 63# xml777
NUDT 在GPU 上远不如中科院系统花得多，仅仅是过程所，花在GPU 的钱就是NUDT 的十倍，目前连个Linpack 都跑不了，你以为过程所的Tesla 做什么的？

作者: 南京小钱 时间: 2009-12-24 18:29
opencl的支持者apple数月前吃进一大批48x0...

作者: toshibacom 时间: 2009-12-24 18:35

1. linpack本身就可以算是一连串应用程序捆绑在一起的测试，确实可以在某种程度上代表实际性能，而且这个行业的应用本来就是比较封闭的；
2. 天河一号就效率来说算不错了；
3. 天河一号是一个软硬件结合的计算系统，它的优劣和它所使用硬件的优劣没有逻辑上的联系，这点要分清楚
Asuka 发表于 2009-12-24 15:56

这次你倒是蛮客观，并没有像某些Nfan因为天河用了4870X2而狂贬低天河。

作者: Edison 时间: 2009-12-24 18:36

回复 xml777
NUDT 在GPU 上远不如中科院系统花得多，仅仅是过程所，花在GPU 的钱就是NUDT 的十倍，目前连 ...
tomsmith123 发表于 2009-12-24 18:07

并非所有的 hpc 都是设计用来跑 linpack 的，例如 GRAPE-DR，跑 linpack 的效率只有 20%，但是它在 n-body 上的性能非常好。

IPE 虽然没有专门跑 linpack，但是他们有许多在 CUDA 上的实际应用案例：
http://www.pcinlife.com/news/har ... 1256720693d835.html

Roadrunner 除了 linpack 跑得快外，也有许多实际的案例：
http://www.lanl.gov/roadrunner/rrseminars.shtml

作者: sagecao 时间: 2009-12-24 18:55
一向不看好所谓的通用计算........

作者: tomsmith123 时间: 2009-12-24 19:03
回复 81# Edison
坦白告诉你，我在IPE 上有应用，看过IPE 的负载LOG，IPE 的Tesla 90％以上空闲的时间很多，和中科院系统的投入完全不成比例，个人以为IPE 的Tesla 系统买得非常失败，更糟糕的是，中科院系统对Fermi 的兴趣也受到影响。
GRAPE 系统本身就是专用系统，没有关心过Linpack。
Cell 的Linpack 效率一直算比较高的，但是Cell 的算法适应性也不是很好，Roadrunner 面向的应用也是有限的，虽然IBM 在努力扩展。IBM 暂停Cell 的继续开发，是两方面原因：首先是异构系统可编程比较差；其次是同构系统效率在Power 7上得到了重大突破。

作者: toshibacom 时间: 2009-12-24 19:28

GPGPU 是比 CUDA 落后的 GPU 通用计算概念。

GPGPU 是使用图形 API，例如 DX9、OpenGL，而 CUDA 在硬件上是指具备 shared memory 的 G8X GPU，软件上是指 CUDA C 等高级编程语言的 GPU Computing 计算模型。Edison 发表于 2009-12-24 15:14

什么叫落后，GPGPU是个泛指概念，GPGPU可以被称为通用图形处理器。其中第一个“GP”通用目的（GeneralPurpose）而第二个“GP”则表示图形处理（GraphicProcess），这两个“GP”搭配起来就是“通用图形”。而再加上“U”(Unit)就成为了完整的通用处理器。
，在GPU上的通用运算上，AMD有GPGPU，NV有GPGPU，Intel也有GPGPU（拉拉比暂时出不来，最终还是会出来的），CUDA只是NV实现GPGPU的具体方案。
再举个例子，GPGPU就好比操作系统，是个泛指概念，CUDA就好比windows，只是操作系统的一类，说操作系统比windows落后，不是滑稽可笑？

作者: tomsmith123 时间: 2009-12-24 19:38
回复 84# toshibacom
GPGPU 是可编程管线GPU 出现后出现的利用GPU Fixed Functions 计算的技术，甚至在可编程管线GPU 出现前，就有人提到。
广义上，CUDA 也是GPGPU，狭义上CUDA 属于US 架构的GPGPU，和可编程管线GPGPU 是不同的。

作者: Edison 时间: 2009-12-24 19:40

什么叫落后，GPGPU是个泛指概念，GPGPU可以被称为通用图形处理器。其中第一个“GP”通用目的（GeneralPur ...
toshibacom 发表于 2009-12-24 19:28

你这样说是因为对 GPGPU 本身的概念起源不清楚，就像我前面所说的，GPGPU 是指使用图形 API 进行通用计算，而这样的方式会存在多种问题，例如编程人员必须了解图形 API 以及一些计算机图形学上的知识。

如果使用你那样操作系统的概念，类似的分类方式是 GPGPU = DOS，CUDA/Stream/Native= Windows，说 DOS 比Windows 落后一定也不好笑，而概念混乱才会是好笑的事情。

作者: toshibacom 时间: 2009-12-24 19:42

回复 toshibacom
GPGPU 是可编程管线GPU 出现后出现的利用GPU Fixed Functions 计算的技术，甚至在可编程 ...
tomsmith123 发表于 2009-12-24 19:38

现在人们提到GPGPU一般都是广义概念吧，就是指通用运算吧，现在英语中提到通用运算字母简写怎么说？不用GPGPU，有新的字母组合缩写了？

作者: tomsmith123 时间: 2009-12-24 19:42
回复 86# Edison
广义上CUDA 仍然属于GPGPU，GPGPU 还是一种技术的统称，表示用GPU 来做通用计算的意思。

作者: toshibacom 时间: 2009-12-24 19:45

回复 Edison
广义上CUDA 仍然属于GPGPU，GPGPU 还是一种技术的统称，表示用GPU 来做通用计算的意思。
tomsmith123 发表于 2009-12-24 19:42

好了，我和Edison都没错，我说的是广义的概念，他说的是狭义的概念。

作者: Edison 时间: 2009-12-24 19:49
这么说吧，GPU 这个概念是 NVIDIA 最先提出，而 GPGPU 这个概念是 Mark Harris 弄出来的，Mark Harris 现在是在 NVIDIA 。

GPGPU 之所以不再（应该）被采用，除了当初它提出的时候的语义与现时的 GPU 计算不符合外，还有一个问题，那就是实际上并不存在专门的 GPGPU 这样的产品。

作者: tomsmith123 时间: 2009-12-24 19:52
回复 90# Edison
GPGPU 不是什么产品，是General-Purpose computation on Graphics Processing Units 的缩写，就是在GPU 上进行的通用计算。

作者: yihua伊华 时间: 2009-12-25 00:57
看到精彩讨论了，比较喜欢 E大和tomsmith123

作者: yamhill 时间: 2009-12-25 01:31
这个啊……

CUDA是用的图形API么？

作者: Asuka 时间: 2009-12-25 01:49

这个啊……

CUDA是用的图形API么？
yamhill 发表于 2009-12-25 01:31

.............

作者: mooncocoon 时间: 2009-12-25 10:12
本帖最后由 mooncocoon 于 2009-12-25 10:17 编辑

AMD是一家诚实的公司
+65535

跑FAH的時候，很多人都宣稱RV7的問題僅僅是優化而已
恩，優化……

作者: yamhill 时间: 2009-12-25 11:28

.............
Asuka 发表于 2009-12-25 01:49

您的点点点点就说明了一切

作者: yamhill 时间: 2009-12-25 11:28

AMD是一家诚实的公司
+65535

跑FAH的時候，很多人都宣稱RV7的問題僅僅是優化而已
恩，優化……
mooncocoon 发表于 2009-12-25 10:12

是优化问题，而且必须是优化问题！

不过……这个优化貌似要对电路下手……

作者: tomsmith123 时间: 2009-12-25 11:52
回复 97# yamhill
不需要电路优化。
GPGPU 编程很花时间的，我有个MD 应用，三个月就完成了第一版，加速比只有5，然后优化了一年，最后相对加速比18。

作者: tomsmith123 时间: 2009-12-25 11:53
回复 95# mooncocoon
优化和人的水平和编程习惯有关系，NUDT 能把4870×2 的Linpack 逼近极限，前提是十多人做了半年，以软件外包的代价计算，差不多是100万。

作者: yamhill 时间: 2009-12-25 11:56

回复 yamhill
不需要电路优化。
GPGPU 编程很花时间的，我有个MD 应用，三个月就完成了第一版，加速比只 ...
tomsmith123 发表于 2009-12-25 11:52

我们在说FAH

还有，希望你继续加油，提高加速比

作者: yamhill 时间: 2009-12-25 11:56

回复 mooncocoon
优化和人的水平和编程习惯有关系，NUDT 能把4870×2 的Linpack 逼近极限，前提是十多人 ...
tomsmith123 发表于 2009-12-25 11:53

好多人……

那么4870×2的实际和理论相差多大？

作者: tomsmith123 时间: 2009-12-25 12:08
回复 101# yamhill
天河I 已经基本到极限了，Linpack。
极限可用性能，C1070 和9270 的差距不大。

作者: tomsmith123 时间: 2009-12-25 12:10
回复 100# yamhill
我做的MD 而言，18倍已经是理论极限了。
Folding 我们可能会做，不过和F@H 不会用一种计算模式。

作者: spinup 时间: 2009-12-25 12:32

这贴的讨论开始转向天河一号里的4870x2是不是只是摆设的问题了。

除去linpack，以后的计算项目能用到487 ...
纳尼？发表于 2009-12-24 15:22

官方说过显卡“暂时”不能很好地提供计算能力。

---除了linpack，其他计算能力是按cpu指标算的。至于这个“暂时”有多长，估计谁都说不准

作者: yamhill 时间: 2009-12-25 12:35
本帖最后由 yamhill 于 2009-12-25 12:36 编辑

回复 yamhill
我做的MD 而言，18倍已经是理论极限了。
Folding 我们可能会做，不过和F@H 不会用一种计算 ...
tomsmith123 发表于 2009-12-25 12:10

FAH确实不是一种计算模式

在用FAH做对比时，都用的同样或者是类似内容的数据包（内容由斯坦福提供说明）

我感觉，还是暂时把A卡当作DSP比较好

作者: ppeng 时间: 2009-12-25 12:39

AMD一向有抛弃老用户的传统，看看X1950用户的痛苦吧，WIN7下没有驱动，只能强装老的VISTA驱动，结果就是BUG ...
garou 发表于 2009-12-24 11:14

我的X1650可以正常安装驱动啊

作者: ~蜜蜂~ 时间: 2009-12-25 12:50
http://developer.amd.com/gpu/ATI ... rformance_Notes.pdf

ATI Stream SDK v2.0 文档也指出 Local data share (LDS) 在 OpenCL上不支援 R700 系列 GPU
看来 R700 那个 16kb LDS 将没有作用

作者: tomsmith123 时间: 2009-12-25 13:23
回复 105# yamhill
GPU 理论上，是一种类型的many core。

作者: yamhill 时间: 2009-12-25 13:24

回复 yamhill
GPU 理论上，是一种类型的many core。
tomsmith123 发表于 2009-12-25 13:23

本来就是

作者: tomsmith123 时间: 2009-12-25 14:48
回复 110# 左脚选手
还是投入问题，NUDT 舍得在这个方面投入，日本方面最初明显投入不足。

作者: yamhill 时间: 2009-12-25 14:50

通过一幅图可以粗略计算一下

上图中，实际成绩563.1T，其中CPU的计算阵列理论是214.956T，这只是理 ...
左脚选手发表于 2009-12-25 14:34

能不能说点linpack以外的？

作者: tomsmith123 时间: 2009-12-25 14:53
回复 112# yamhill
如果你能找到TOP500 中典型机器跑HPCC 的数字，那么也可以讨论，很遗憾，很少。

作者: yamhill 时间: 2009-12-25 15:27

回复 yamhill
如果你能找到TOP500 中典型机器跑HPCC 的数字，那么也可以讨论，很遗憾，很少。
tomsmith123 发表于 2009-12-25 14:53

如果能找到实际使用当中得出的数据，那更好

作者: tomsmith123 时间: 2009-12-25 15:53
回复 114# yamhill
A 跑高斯，B 跑FLUENT，C跑MD，然后你还要比较它们的效能，开玩笑呢。

作者: yamhill 时间: 2009-12-25 15:56

回复 yamhill
A 跑高斯，B 跑FLUENT，C跑MD，然后你还要比较它们的效能，开玩笑呢。
tomsmith123 发表于 2009-12-25 15:53

你想开玩笑，我不拦你

你难道不知道要做对比，必须要找原理上至少相似的对比项目？

作者: yamhill 时间: 2009-12-25 15:57
看你也像做过点项目的人，怎么说这种水平的话，让人费解

作者: tomsmith123 时间: 2009-12-25 15:59
回复 116# yamhill
坦白告诉你，没有做HPC 的人对这样的比较有兴趣，张云泉都不做。

作者: garou 时间: 2009-12-25 16:01

我的X1650可以正常安装驱动啊
ppeng 发表于 2009-12-25 12:39

那是强行安装FOR VISTA的驱动

作者: yamhill 时间: 2009-12-25 16:02

回复 yamhill
坦白告诉你，没有做HPC 的人对这样的比较有兴趣，张云泉都不做。
tomsmith123 发表于 2009-12-25 15:59

我也坦白告诉你个事实，能做HPC的都不是傻子，只不过侧重点不同

还要告诉大家一个底层技术员和CEO的区别，那就是CEO能看到除了技术之外更多的地方

作者: tomsmith123 时间: 2009-12-25 16:06
回复 120# yamhill
原来你是CEO啊，失敬失敬。
有时间，我想麻烦您接见一下张云泉，陈文光两位，让他们听听你的指教。

作者: yamhill 时间: 2009-12-25 16:09

回复 yamhill
原来你是CEO啊，失敬失敬。
有时间，我想麻烦您接见一下张云泉，陈文光两位，让他们听听你 ...
tomsmith123 发表于 2009-12-25 16:06

我的视野还不算广阔，暂时做不到那个位置

CEO之所以在众多技术员中脱颖而出，那是因为在那些人当中，他是整体上最优秀的

所以要谈接见，也要您这个能给我安排活动的人去接见，为什么？都能给我安排接见那两位了，还不高级到天上？

作者: tomsmith123 时间: 2009-12-25 16:13
回复 122# yamhill
这两位和我也就是同行，点点头，吃吃饭，我们一直渴望有高水平的人指路呢。

作者: yamhill 时间: 2009-12-25 16:15

回复 yamhill
这两位和我也就是同行，点点头，吃吃饭，我们一直渴望有高水平的人指路呢。
tomsmith123 发表于 2009-12-25 16:13

您太谦虚了

如果说真要找人的话，找胡哥

作者: yukika 时间: 2009-12-25 16:17
那啥，Paul Otellini原先一定是销售技术员了

作者: toshibacom 时间: 2009-12-25 19:53

能不能说点linpack以外的？
yamhill 发表于 2009-12-25 14:50

一、Linpack的起源及原始用途
LINPACK是线性系统软件包(Linear system package) 的缩写，主要开始于 1974 年 4 月，美国 Argonne 国家实验室应用数学所主任 Jim Pool，在一系列非正式的讨论会中评估，建立一套专门解线性系统问题之数学软件的可能性。后来便提出了 LINPACK 计划案送到国家科学基金会 (National Science Foundation ) 审核，经国家科学基金会同意并提供经费。
LINPACK主要的特色是：
v 率先开创了力学 (Mechanics) 分析软件的制作。
v 建立了将来数学软件比较的标准。
v 提供软件链接库，允许使用者加以修正以便处理特殊问题， (当然程序名称必须改写，并应注明修改之处，以尊重原作者，并避免他人误用。)
v 兼顾了对各计算机系统的通用性，并提供高效率的运算。
至目前为止， LINPACK 还是广泛地应用于解各种数学和工程问题。也由于它高效率的运算，使得其它几种数学软件例如 IMSL、 MATLAB 纷纷加以引用来处理矩阵问题，所以足见其在科学计算上有举足轻重的地位。
二、Linpack性能测试基准
Linpack现在在国际上已经成为最流行的用于测试高性能计算机系统浮点性能的benchmark。通过利用高性能计算机，用高斯消元法求解一元N次稠密线性代数方程组的测试，评价高性能计算机的浮点性能
_____________________________________________________________
LINPACK的初衷并不是制订一个测试计算机性能的统一标准,而只是提供一些常用的计算方法的实现,但是由于该软件包的广泛使用,这样就为通过LINPACK例程来比较不同计算机的性能提供了可能
Linkpack并非仅仅只是一个测试软件，他“还是广泛地应用于解各种数学和工程问题。也由于它高效
率的运算，使得其它几种数学软件例如 IMSL、 MATLAB 纷纷加以引用来处理矩阵问题，所以足见其在科学计算上有举足轻重的地位。 ”
世界上从来没有一个测试软件是完全绝对公平的，因为一个测试软件不可能包括所有的应用测试，所以只能制订一个在领域中相对覆盖面较广的标准来测试，给出一个大致的性能参考依据，Linpack作为公认的TOP500排名的唯一依据，自然是从多方面考虑，而且测试软件业不是一成不变的，就像3Dmark，也会对各种新功能新技术通过版本更新提供支持，今后实际应用如果有改变，Linkpack也应该会对这些改变做出相应调整。或者今后会有比Linpack更科学更全面的测试方法，但是当下，最权威流行的测试HPC的软件还是Linpack。

作者: yamhill 时间: 2009-12-25 21:07

一、Linpack的起源及原始用途
LINPACK是线性系统软件包(Linear system package) 的缩写，主要开始于 19 ...
toshibacom 发表于 2009-12-25 19:53

我从本坛某技术党在讨论linpack是否实用时，学习到了个信息：

linpack基本上是将一连串的低阶方程穿行在一起，然后塞给被测单位进行运算
方程之间没有联系
基本上，等于就是再让被测对象不停地重复的去接线性方程组
怎么说呢
跟实际应用
**钱联系都没有……
只能体现大体上的节电通讯效率趋势和运算单元对线性方程组的吞吐能力
说白了跑linpack跑得很快的系统，与其说是运算能力优秀，倒不如说是节点构筑很合理，交换速度很快

欢迎其他的技术党来鉴定

作者: tomsmith123 时间: 2009-12-25 21:50
回复 127# yamhill
Linpack Bechmark 理论上是一个自然均衡并行计算基准，也就是说，Linpack 是最容易被优化在几乎无限大计算平台上计算的一个基准，和超级计算机的理论聚合性能相比，更接近并行计算任务在计算系统的极限值，这是为什么Linpack 被用于评估一个通用计算平台的性能。
HPC 上运行的应用千差万别，甚至还有很多商业化软件本身对并行计算的优化不足，计算效能极低，目前还没有比Linpack 更简单直观的评测基准。
Linpack 非常简单，如果Linpack 都做不好，那么就不要谈其他了。

欢迎光临 POPPUR爱换 (https://we.poppur.com/)