POPPUR爱换

标题: 系统融合,说说AMD如何做通用计算…… [打印本页]

作者: shu0202    时间: 2009-12-10 21:31
标题: 系统融合,说说AMD如何做通用计算……
      有人曾说CPU最终会取代GPU,也有人说GPU的重要性会超过CPU。目前CPU的核心越堆越多,GPU则是功能越来越多,似乎CPU和GPU正在往一条路上走。那么破除一切界限的可编程能力和超强的并行运算性能能被某种芯片集于一身吗?

      目前的回答是:不行!

      CPU高度的灵活性和为了保持高度灵活性的同时保持高运算效率使得现在的CPU核心非常复杂,GPU则采用针对并行运算的适度复杂但是可以大规模堆积管线的设计。比如6核心“伊斯坦布尔”的大小接近完整管线规模达320条的RV870,将二者的长处集中在同样大小的一个芯片中根本就是痴人说梦。可以说,如果按照CPU的通用性标准设计GPU,那么GPU的运算能力不会比CPU更强;反过来CPU设计要达到GPU的浮点运算能力也就不再是现在意义上的CPU了。

      NV显然选择的是尽量保持浮点运算性能明显优势的同时加强GPU的通用性,Intel则是用简单化和抛弃乱序执行能力换取高性能。目前的情况是NV难产,Intel回炉重炼,AMD低调不宣。

      对既有CPU又有GPU的AMD而言,让二者各行其是变为相互配合是必然的选择。CPU和GPU目前不能在物理上完美的合为一体,但是可以在系统中成为一个运算整体。一个程序,复杂多变的部分由CPU来跑,顺序化并行化的部分由GPU完成。他需要一个前提,CPU和GPU必须能够运行同一类指令系统,而这一类指令系统必然有面向GPU发挥其强大的浮点运算能力的扩展。对程序而言,运算器是不分CPU和GPU的,智能调度会把适合的部分分别喂给CPU和GPU。未来也许整数运算由CPU完成,绝大部分浮点运算交给GPU。

      AMD的“推土机”已经变成了“集装箱”式的模块设计,你不能再说他有几个CPU核心,除了前端和后端,运算部分是一组一组的整数单元和浮点单元,只要工艺允许,你可以很方便的调整比例和规模。未来还可以添加特殊或者专用的运算模块。当然如果这些特殊或专用的运算被统一成一个标准的话,那就只需要一种标准专用架构就行了。现在看来,OpenCL和Driectcompute正朝这方面努力。这样的好处就是:一般应用可以使用集成一体的芯片,性能也并不弱。如果追求强大的通用计算能力就外接独立的GPU运算器,而且可以接好几个,CPU-GPU直连一体。物理运算、AI计算都可以通过这种方式协作完成,而且完全基于开放标准。
作者: Edison    时间: 2009-12-10 21:42
在异构运算的时代,关键是:开发工具。
作者: Buffer    时间: 2009-12-10 21:59
是不是又要回到386,387时代了?

但计算机的发展好像是集成,整合之路。




还是楼主的头像好看
作者: 什么?    时间: 2009-12-10 22:04
推土机和终极版fusion没什么关系吧?

那个完全融合的fusion不是说把CPU的浮点计算都抛给GPU的管线么?
作者: shu0202    时间: 2009-12-10 22:11
Intel停止Larrabee项目恐怕不仅仅是因为进度和性能问题,它应该有新的考虑。对AMD来说,它其实更希望Intel来打开新领域。目前看来,AMD恐怕得单枪匹马实现自己的理想。
作者: earcandy    时间: 2009-12-10 22:17
融合需要强大的软件支持,Intel的集显驱动和AMD的催化剂简直有异曲同工之妙,软件实力可见一斑啊
作者: shu0202    时间: 2009-12-10 22:31
Fusion我看只是个探路石,真正的APU架构恐怕要基于可扩展的CPU-GPU形式。
作者: Edison    时间: 2009-12-10 22:33
Intel停止Larrabee项目恐怕不仅仅是因为进度和性能问题,它应该有新的考虑。对AMD来说,它其实更希望Intel来 ...
shu0202 发表于 2009-12-10 22:11


Intel 并没有停掉 Larrabee 项目,而是将 LRB1 作为一个实验性的东西提供给并行运算的开发人员玩,如果 GPU Computing 在某天达到一个实用临界点的时候,LRB 就会重新上来,按照英特尔的计划,这个东西可能就是 LRB3。
作者: Buffer    时间: 2009-12-10 22:39
如果CPU+GPU流行起来,一个整数,一个浮点,做成通用处理器。

那到时基本就是X86和X87的关系(多了个显示功能),普及到一定时候,是不是又是会融合成一个?真融合成一个,那是不是又只能叫CPU了?

INTEL是整合低端GPU,如果AMD想整合高端GPU,那好像不太利于大家自由搭配。要不出很多个型号?




而且我觉得高图形处理能力是一部分人的需求,而且现在看来离理想的“模拟现实”还差得很远,也许图形计算处理性能需求远大于通用处理性能需求,后果就是图形专用处理器性能发展速度远快于通用处理器。

但又不是人人都有图形处理能力方面的需求,
合在一起好像不利于升级和搭配。合在一起做成通用处理器也可能性能又不如同时期的专用图形处理器(如果到时候还有的话)。

也许有一天CPU真能包干所有的计算需求,但“门门通,样样瘟”始终是会发生的。图形计算的性能需求好像又比通用计算大,始终做成专用处理器也许更合适。
作者: 0阿诺0    时间: 2009-12-10 22:41
Intel停止Larrabee项目恐怕不仅仅是因为进度和性能问题,它应该有新的考虑。对AMD来说,它其实更希望Intel来 ...
shu0202 发表于 2009-12-10 22:11


拉比比很杯具的  1T的浮点 确需要260级的功耗
作者: sagecao    时间: 2009-12-10 22:42
搞个声卡集成到CPU比 集成CPU的GPU更实际
作者: philonb    时间: 2009-12-10 22:48
分久必合,合久必分
作者: Edison    时间: 2009-12-10 22:58
拉比比很杯具的  1T的浮点 确需要260级的功耗
0阿诺0 发表于 2009-12-10 22:41


Intel 给出的结果是实际测试的性能,而不是理论峰值,在 SC09 上,有这样的一些数据:

1.  Intel Larrabee [LRB, 45nm] - 1006 GFLOPS
2.  EVGA GeForce GTX 285 FTW - 425 GFLOPS
3.  nVidia Tesla C1060 [GT200, 65nm] - 370 GFLOPS
4.  AMD FireStream 9270 [RV770, 55nm] - 300 GFLOPS
5.  IBM PowerXCell 8i [Cell, 65nm] - 164 GFLOPS

LRB 的问题除了 silicon 延迟外,完善的软件也是迟迟未能推出。
作者: tctc    时间: 2009-12-10 23:04
我还是很看好AMD的,希望他越来越强
作者: moshou    时间: 2009-12-10 23:05
Intel 给出的结果是实际测试的性能,而不是理论峰值,在 SC09 上,有这样的一些数据:

1.  Intel La ...
Edison 发表于 2009-12-10 22:58



单精度?285/RV770不是上T吗?
RV700号称高达1.2T,怎么才区区0.3?是不是ATI标称的东西都要除以4?
作者: Buffer    时间: 2009-12-10 23:14
本帖最后由 Buffer 于 2009-12-10 23:17 编辑

软件硬化和硬件软化的问题?

CPU更像一个公司的头头,员工像其它部件/处理器。CPU好像更适合管理。

硬解硬压...........,最近甚至十多年前出现的一些硬件都在解放/弥补CPU性能,但最后好像又整合到CPU里。或者随CPU性能提高而消失,但又可能会出现新的性能需求,需要专用处理部件,出现新硬件类型/处理器类型。

GPU好像很特别,这些年的发展.........集成规模早超过了CPU,甚至功耗也超高了。也许是对图形处理的要求太高。




未来不知道是不是虚拟现实与人工智能的天下,到时候不知道谁轻谁重,或者是不是还是要GPU+CPU甚至"AIPU"来配合。



如果把现在的高性能的CPU和高性能GPU做在一起,从规模上看是GPU挂了个CPU,从功能主次上来看是CPU上挂了个GPU。到时候到底是CPU集成GPU,还是GPU集成CPU真难说。

现在如果能把CPU和GPU硬挤在一起,然后慢慢融合.........,最后因为要“通用”损失了图形部分的“专用”性能,N多有更高图形性能需求的人(比例可以从现在的集成与性能级独立显卡用户比例来看)是不是要希望出现个专用图形处理器?


-----------以上只是我这个硬件小白无知的胡思乱想.
作者: ngsms    时间: 2009-12-10 23:35
本帖最后由 ngsms 于 2009-12-10 23:37 编辑

我想若干年后,我们就会拍某台覆满灰尘的主机说,哗~你看这台2009年的电脑居然这么土.还有叫显卡的东西喂.
人机互动居然还用鼠标键盘?那个时候还没有感触式全息影像仪吗?
作者: moshou    时间: 2009-12-10 23:37
除非有天人们对视觉的渴求停止了,在同样规模下,CPU/GPU不管谁整合谁,才有可能实现
作者: Buffer    时间: 2009-12-10 23:44
除非有天人们对视觉的渴求停止了,在同样规模下,CPU/GPU不管谁整合谁,才有可能实现
moshou 发表于 2009-12-10 23:37


现在看来,图形计算对处理器的性能要求太高了。人们想看到的应该是虚拟的“视觉真实”世界,现在看来要达到这一点,图形计算性能提升之路还很远很远。
作者: binbin    时间: 2009-12-11 09:14
amd 2011年推出的fusion仍然是基于老旧的athlon ii核心,只是单纯的把显示芯片集成进去,也就是个低端显卡的用途。要说真正的融合计算,还早着呢,至少cpu和gpu之间的鸿沟,五年内还是无法实现互通的
作者: darkangel308    时间: 2009-12-11 10:14
推土机和终极版fusion没什么关系吧?

那个完全融合的fusion不是说把CPU的浮点计算都抛给GPU的管线么?
什么? 发表于 2009-12-10 22:04



    完全融合之后,就不存在所谓的GPU了
作者: Buffer    时间: 2009-12-11 10:36
AMD是想完全融合,成一个芯片。

现在INTEL出的只是两个芯片封装在一起。以后还不知道INTEL怎么出。


AMD如果只是像INTEL那样融合低性能GPU,那也许还行,相当于现在的整合主板+CPU。
AMD如果把高中低性能的GPU都和CPU融合,那后果就是AMD的GPU只能配AMD的CPU,除非做CPU+GPU的同时,还做独立GPU。但按AMD融合计划,好像不太现实。


但现在INTEL自家没有强大的GPU,无法像AMD那样全线CPU,GPU融合,只有低端才这样做。然后高端产品还是要配别家的GPU,如NV的和AMD的,--------如果AMD到时候不单独出GPU,而是和AMD的CPU融合的产品,那是不是AMD将让自家的GPU份额与自家的CPU份额拉到一致?



所以AMD的融合之路,可能是低端融合,高端分离,又或者全线融合,但继续出纯GPU给INTEL平台用。
INTEL的融合之路,现在看来只能是低端的融合,高端的分离,配NV和AMD的GPU。


现在看来,CPU+GPU好像只适合低端整合平台和笔记本平台。高端的从成本到需求,到搭配,全线融合不太理想。
作者: gz_easy    时间: 2009-12-11 10:41
Intel 给出的结果是实际测试的性能,而不是理论峰值,在 SC09 上,有这样的一些数据:

1.  Intel La ...
Edison 发表于 2009-12-10 22:58

不知Intel是基于怎样的环境测得的数据。
我觉得CPU就是做复杂逻辑控制+简单计算的,它不会追求过分强大的矢量计算,目前的CPU架构浮点性能靠高主频来提高很难,要不就增加浮点部件。
另外CPU指令集扩展都很谨慎且大多是通用指令集,所以指令集限制是否也会影响CPU的浮点性能。
作者: Buffer    时间: 2009-12-11 10:45
或者以后GPU发展成“二代”协处理器(而且和X87一样都是处理浮点运算),甚至和CPU平起平坐(AMD CEO这样说的),等这样的运算需求普及,那到时候可能不管需要不需要,合二为一,全线融合是不可避免的。

到时候融合体又叫CPU。---------可以说是X87历史重演且惊人地相似?
作者: gz_easy    时间: 2009-12-11 10:50
也许以后GPU演化过程中会扮演这样的“专用处理器”角色。
作者: darkangel308    时间: 2009-12-11 10:51
如果CPU+GPU流行起来,一个整数,一个浮点,做成通用处理器。

那到时基本就是X86和X87的关系(多了个显示 ...
Buffer 发表于 2009-12-10 22:39



    融合之后,对于图形需求高的用户,可以直接插个不带显示功能的图形加速卡
作者: gz_easy    时间: 2009-12-11 11:03
目前CPU集群的超级计算机中大部分CPU的逻辑部件浪费了,大多只用里面的浮点部件,而GPU群组成的超级计算机浮点性能更强大。
作者: Buffer    时间: 2009-12-11 11:05
融合之后,对于图形需求高的用户,可以直接插个不带显示功能的图形加速卡
darkangel308 发表于 2009-12-11 10:51


那就不是全线从低到高都融合。实际上和现在差别也不大,只是GPU角色更重要了。这应该是没有高端GPU的INTEL不想见到的吧。
作者: Buffer    时间: 2009-12-11 11:10
融合之后,对于图形需求高的用户,可以直接插个不带显示功能的图形加速卡
darkangel308 发表于 2009-12-11 10:51


而且这样对于双显的支持,大分辨率的支持不太灵活吧?

像AMD 5系都上三显支持了,甚至以后还有四显需求什么的,对于这些情况,显示器接口放主板上不是很好吧?
作者: RealT    时间: 2009-12-11 13:13
提示: 作者被禁止或删除 内容自动屏蔽
作者: Asuka    时间: 2009-12-11 13:43
主流桌面市场现在还有不是RISC的CPU?
作者: Buffer    时间: 2009-12-11 13:48
本帖最后由 Buffer 于 2009-12-11 13:51 编辑

主板上面就一个HTT高速交换器,然后出CPU子卡,GPU子卡,外设扩展子卡...

这样看起来好像有意思,要加性能增加子卡,增加CPU,增加GPU数量,可是民用要换代的时候不知道怎么处理,一丢丢一堆东西。而且成本不知道比起一个CPU和一个GPU是怎么样的情况。按GPU淘汰速度,有需求的人可能一年甚至半年一换。

除非以后N年以内CPU和GPU核心都不变,或者接口不变且兼容,然后大家在这N里有性能需要就加子卡数量。还要能让性能线性增加。这对软件编写也有要求吧。

不过这样真比一个CPU配一个GPU好吗?成本,使用方便性,软件支持,
比如上5个3650才能和一个3850性能持平,上5个3850才能和一个5870性能持平。-----我这里只是比喻。
这好像玩低端SLI和CF。

我觉得这样的模块化适合高性模块能叠加,而不是普通大众用的普及型性能配件模块化叠加,占地,功耗,性能效率也成问题。
而且换代升级的时候,到底是加到5个3650来用还是去换一个3850来用(如果性能相等),这好像也会我们造成困扰。

如果三五年后才升级,我还能找到我的主板能用的CPU和GPU来叠加吗?或者现在市面上有单个实现同样性能的,甚至性能更好的,更省电的,功能更多的,特效更多的,指令集更多的产品,但接口不兼容,我倒底是换还是加呢?
作者: shu0202    时间: 2009-12-11 13:51
Fusion被称作APU,据说浮点运算达到1T上下,按照计划中的240sp来算,负责大部分浮点运算的GPU部分频率比现在的产品要高很多,差不多要达到1.6-2GHz。SOI工艺有这本事么?另外芯片内部有四条HT,也就是说至少外接两路独立的GPU是没有问题的。
作者: gz_easy    时间: 2009-12-11 14:00
主流桌面市场现在还有不是RISC的CPU?
Asuka 发表于 2009-12-11 13:43

从指令角度讲也许可以称CISC outside, RISC inside。
作者: sagecao    时间: 2009-12-11 14:18
先讨论晶体管能否到达7纳米以下的更好...........
作者: RealT    时间: 2009-12-11 14:29
提示: 作者被禁止或删除 内容自动屏蔽
作者: sagecao    时间: 2009-12-11 14:33
CUDA是用GPU去计算,也就是让GPU以渲染管线去执行一段代码,那么,AMD,Intel为什么不把CPU的内部RISC核心暴 ...
RealT 发表于 2009-12-11 14:29



    不兼容你去用?

没看到安腾的结局么
作者: RealT    时间: 2009-12-11 14:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2009-12-11 15:20
CUDA是用GPU去计算,也就是让GPU以渲染管线去执行一段代码,那么,AMD,Intel为什么不把CPU的内部RISC核心暴 ...
RealT 发表于 2009-12-11 14:29


x68指令集并不是影响性能的原因
作者: itany    时间: 2009-12-11 15:22
中高端融合不知道何时能实现,内存/显存问题如何解决?现在的主流内存是128bit/192bit DDR3 1600,显存是25 ...
RealT 发表于 2009-12-11 13:13


我小学的时候用80286时也这样幻想过……




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4