|
完整文章已经放在了AMD爱好者网(www.amdfami.com)上!文章翻译得如果有问题,希望大家指正!
当AMD合并了ATI之后,短时间内在芯片制造商中Intel与nVidia之间很自然就成为了一种战略联盟的关系。如果我们相信我们的电脑是由不同的制造商制造出来的产品组合而成的话,那么我现在正在面临一个全新的开始,一个关于PC中不同厂商生产出来的芯片任务改变的开始。尽管AMD已经开始实施这项名为Torrenza的计划,并走在了这项变革的前列。但是Intel的解决方案也已经开始启动,并没有落后太多。
CPU作为计算机的唯一中央处理单元的时代已经结束了。最好的例子就是GPU的诞生,显卡的中央处理单元:现在的3D处理芯片都是可编程的并且提供了令人难以置信的原始图像处理能力。但是并不仅仅是显示芯片。被应用在最新一代声卡上的创新X-Fi芯片,就是一款处理性能强劲的芯片,我们把它叫做APU(Audio Processing Unit声音处理单元)以及Ageia的PPU(Physics Processing Units 物理处理单元)。PPU是被用来专门处理游戏中的物理计算的。在这段时间里经常出现在新闻中的一个公司叫做AISeek,他们的一项产品经常和头条新闻相关联,新闻的主角就是AISeek开发的专门用来处理3D游戏中人工智能计算的处理器。 在专业的领域,越来越多的芯片被用来做各种各样高效率的计算,从而有效的降低了CPU的工作量。
协处理器(Co-processors):
前面所提到的这些例子都表明在特定的任务中使用特定的处理芯片在一定的条件下是一个非常聪明的选择。就拿AMD的Athlon64以及Intel Core2 Duo来说,他们虽然有能力处理所有的代码,但是对于特别的任务他们却没有特别的处理方法,因为术业有专攻所以全面就导致了全面平庸(原文是句俚语,我不知道翻译的是否恰当their basically jack's of all trades but masters of none.)。正是因为这个道理,所以我们对于现在的显卡在处理图像方面的能力超过CPU几百倍的情况也不用感到惊奇,上面所提到的其他情况也是这个道理。过去,处理器是CPU的心脏(因为我们提到的处理器主要是CPU),但是现在在上面所提到的不同的领域中,CPU变成了一个影响PC处理能力的越来越次要的一个因素。现代的GPU已经在使用的过程中越来越取代了CPU的作用,随着时间的推移,向这样专业的处理器会逐渐地出现在我们的电脑中。IT行业的许多专业人士都预测,在不久的将来我们将会看见更多的专业协处理器用来处理不同领域的不同任务。如果你使用PC主要用来做视频编辑,难道你不选择一个更加高效的处理图形的协处理器来帮助CPU做相关的工作而选择一个仅仅是全面而平庸的CPU来做这些工作吗?
拥有了这些GPU APU PPU AIPU让我们的电脑变得比以往更加强大,更加多变。但是问题是我们如何才能够将这些创新应用在PC上,是使用PCI还是PCI-E总线上的扩展卡来安装这些专用处理器?
流处理(Stream computing)
在协处理器方面,看看ATI最近所作的一些事情非常的有趣。在过去的几年中GPU从一个相对简单的仅能够做几个数量有限的标准处理的芯片变成一个可以做海量计算的庞然大物。早在DirectX 8的时代,GPU就已经完全可以被编程并且在DirectX 9的时候就可以运行32位的浮点运算,这使得很多公司使用GPU来做其他方面的运算而不仅仅是图形方面的运算。其中最重要的进步就是ATI和nVidia最近使用他们的GPU作为PPU用来处理3D游戏中的物理计算。ATI则更进一步,他们将GPU的使用范围扩大的更为广阔可以在不同的领域开展计算,并且使用了Stream Computing这个代码。
现在这段时间ATI一直在强调GPU比传统的CPU更加适合处理不同的运算。ATI的最新一代的显卡在金融风险方面的计算比传统的CPU快16倍,在小型研究的计算上快20倍,在[email=Folding@home]Folding@home[/email]这样的分布式计算方面快了将近40倍(我们AMD爱好者网也在参与这个项目,希望有X1600以上显卡的朋友可以参与到这个项目中来,参加到我们amdfami小组来,我们的Team No.是60458,关于小组最新WU情况的地址http://fah-web.stanford.edu/cgi-bin/main.py?qtype=teampage&teamnum=60458)。
ATI最近也发布了使用GPU运算的[email=Folding@home]Folding@home[/email]的Beta版,他可以让你的X1600级别以上的显卡参加到这个全球性的分布式计算中来,但是这款软件是不带有测试性能的功能的。从下面的图片中你可以很明显的看到Radeon芯片的在[email=Folding@home]Folding@home[/email]项目的计算效率要远远的高于AMD或者Intel的CPU。仅仅2344个GPU就提供了比在高效的Linux的平台下217103个CPU还高的计算量。这个效率甚至比采用IBM Cell处理器的PS3还要高,真的让人折服。然而这个项目仅仅是AMD的Torrenza平台计划的一部分。
Torrenza
AMD是第一个吃螃蟹的公司,并且它们在去年就发表了在这个方向上的最新成果“Torrenza”平台。这项技术使得主板上的多个CPU接口同样可以安装其他类型的芯片。这也就意味着,在未来你的主板除了拥有一个安装CPU的接口之外还将拥有更多的接口用于安装其他的协处理器来提升整个系统的性能。GPU是目前看来最可能的候选者,当然Torrenza允许使用各种各样符合要求的芯片。
现在AMD在Athlon 64以及Opteron处理器上使用的技术就已经为Torrenza平台做好了准备,也就是说AMD已经准备好了在很短的时间内就让Torrenza普及开来。这其中最为重要的一项技术就是AMD使用HyperTransport总线技术来期待传统的前端总线技术。HT是一个非常高速的接口,使用它可以在两个不同的芯片之间高效高速的通信。在Athlon64系统中使用的HT总线并不比传统的FSB总线快多少,但是却在使用双核心的Opteron系统中表现出了他的潜力。Intel的系统使用的是一个中心的构架,所有的处理器都是通过一条或者多条总线和芯片组相连接的。在一个Opteron的多核心系统中,所有的处理器都是通过相互的独立的HyperTransport连接在一起的。这就意味着所有的处理器都可以直接的相互通信而不惜要通过一个所谓的中心,更不需要为了做一件事情而牵扯到所有的处理器。这种一对一的通信方式已经被应用到了Opteron处理器中,使得他可以和其他部件的通信更加的迅速高效,当然在不久的将来,这项技术将会应用到协处理器上来,他使得所有的协处理器在工作的时候,相互之间的通信的延迟更小。
另一个AMD构架的进步是在CPU中集成了内存控制器,这使得每一个接口可以和他的内存之间直接通信,这对于协处理器来说有着巨大的好处。强大的HyperTransport构架使得不同的芯片可以在需要的时候使用自己的内存。比如说,某一个芯片在处理一项特殊的任务的时候自己带有的内存不能满足要求了,在传统的系统中,系统的内存是由一个中央芯片控制的,由于数据首先要通过中向芯片所以必然会导致一定的延迟,也就造成了处理器们排队等待使用内存的情况。
|
|