POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3472|回复: 25
打印 上一主题 下一主题

揭秘未来整合平台 AMD Torrenza 和 Intel CSI

[复制链接]
跳转到指定楼层
1#
发表于 2007-4-1 20:44 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
完整文章已经放在了AMD爱好者网(www.amdfami.com)上!文章翻译得如果有问题,希望大家指正!

当AMD合并了ATI之后,短时间内在芯片制造商中Intel与nVidia之间很自然就成为了一种战略联盟的关系。如果我们相信我们的电脑是由不同的制造商制造出来的产品组合而成的话,那么我现在正在面临一个全新的开始,一个关于PC中不同厂商生产出来的芯片任务改变的开始。尽管AMD已经开始实施这项名为Torrenza的计划,并走在了这项变革的前列。但是Intel的解决方案也已经开始启动,并没有落后太多。
      CPU作为计算机的唯一中央处理单元的时代已经结束了。最好的例子就是GPU的诞生,显卡的中央处理单元:现在的3D处理芯片都是可编程的并且提供了令人难以置信的原始图像处理能力。但是并不仅仅是显示芯片。被应用在最新一代声卡上的创新X-Fi芯片,就是一款处理性能强劲的芯片,我们把它叫做APU(Audio Processing Unit声音处理单元)以及Ageia的PPU(Physics Processing Units 物理处理单元)。PPU是被用来专门处理游戏中的物理计算的。在这段时间里经常出现在新闻中的一个公司叫做AISeek,他们的一项产品经常和头条新闻相关联,新闻的主角就是AISeek开发的专门用来处理3D游戏中人工智能计算的处理器。 在专业的领域,越来越多的芯片被用来做各种各样高效率的计算,从而有效的降低了CPU的工作量。
协处理器(Co-processors):
      前面所提到的这些例子都表明在特定的任务中使用特定的处理芯片在一定的条件下是一个非常聪明的选择。就拿AMD的Athlon64以及Intel Core2 Duo来说,他们虽然有能力处理所有的代码,但是对于特别的任务他们却没有特别的处理方法,因为术业有专攻所以全面就导致了全面平庸(原文是句俚语,我不知道翻译的是否恰当their basically jack's of all trades but masters of none.)。正是因为这个道理,所以我们对于现在的显卡在处理图像方面的能力超过CPU几百倍的情况也不用感到惊奇,上面所提到的其他情况也是这个道理。过去,处理器是CPU的心脏(因为我们提到的处理器主要是CPU),但是现在在上面所提到的不同的领域中,CPU变成了一个影响PC处理能力的越来越次要的一个因素。现代的GPU已经在使用的过程中越来越取代了CPU的作用,随着时间的推移,向这样专业的处理器会逐渐地出现在我们的电脑中。IT行业的许多专业人士都预测,在不久的将来我们将会看见更多的专业协处理器用来处理不同领域的不同任务。如果你使用PC主要用来做视频编辑,难道你不选择一个更加高效的处理图形的协处理器来帮助CPU做相关的工作而选择一个仅仅是全面而平庸的CPU来做这些工作吗?
      拥有了这些GPU APU PPU AIPU让我们的电脑变得比以往更加强大,更加多变。但是问题是我们如何才能够将这些创新应用在PC上,是使用PCI还是PCI-E总线上的扩展卡来安装这些专用处理器?
流处理(Stream computing)
      在协处理器方面,看看ATI最近所作的一些事情非常的有趣。在过去的几年中GPU从一个相对简单的仅能够做几个数量有限的标准处理的芯片变成一个可以做海量计算的庞然大物。早在DirectX 8的时代,GPU就已经完全可以被编程并且在DirectX 9的时候就可以运行32位的浮点运算,这使得很多公司使用GPU来做其他方面的运算而不仅仅是图形方面的运算。其中最重要的进步就是ATI和nVidia最近使用他们的GPU作为PPU用来处理3D游戏中的物理计算。ATI则更进一步,他们将GPU的使用范围扩大的更为广阔可以在不同的领域开展计算,并且使用了Stream Computing这个代码。
      现在这段时间ATI一直在强调GPU比传统的CPU更加适合处理不同的运算。ATI的最新一代的显卡在金融风险方面的计算比传统的CPU快16倍,在小型研究的计算上快20倍,在[email=Folding@home]Folding@home[/email]这样的分布式计算方面快了将近40倍(我们AMD爱好者网也在参与这个项目,希望有X1600以上显卡的朋友可以参与到这个项目中来,参加到我们amdfami小组来,我们的Team No.是60458,关于小组最新WU情况的地址http://fah-web.stanford.edu/cgi-bin/main.py?qtype=teampage&teamnum=60458)。
      ATI最近也发布了使用GPU运算的[email=Folding@home]Folding@home[/email]的Beta版,他可以让你的X1600级别以上的显卡参加到这个全球性的分布式计算中来,但是这款软件是不带有测试性能的功能的。从下面的图片中你可以很明显的看到Radeon芯片的在[email=Folding@home]Folding@home[/email]项目的计算效率要远远的高于AMD或者Intel的CPU。仅仅2344个GPU就提供了比在高效的Linux的平台下217103个CPU还高的计算量。这个效率甚至比采用IBM Cell处理器的PS3还要高,真的让人折服。然而这个项目仅仅是AMD的Torrenza平台计划的一部分。
Torrenza
      AMD是第一个吃螃蟹的公司,并且它们在去年就发表了在这个方向上的最新成果“Torrenza”平台。这项技术使得主板上的多个CPU接口同样可以安装其他类型的芯片。这也就意味着,在未来你的主板除了拥有一个安装CPU的接口之外还将拥有更多的接口用于安装其他的协处理器来提升整个系统的性能。GPU是目前看来最可能的候选者,当然Torrenza允许使用各种各样符合要求的芯片。
      现在AMD在Athlon 64以及Opteron处理器上使用的技术就已经为Torrenza平台做好了准备,也就是说AMD已经准备好了在很短的时间内就让Torrenza普及开来。这其中最为重要的一项技术就是AMD使用HyperTransport总线技术来期待传统的前端总线技术。HT是一个非常高速的接口,使用它可以在两个不同的芯片之间高效高速的通信。在Athlon64系统中使用的HT总线并不比传统的FSB总线快多少,但是却在使用双核心的Opteron系统中表现出了他的潜力。Intel的系统使用的是一个中心的构架,所有的处理器都是通过一条或者多条总线和芯片组相连接的。在一个Opteron的多核心系统中,所有的处理器都是通过相互的独立的HyperTransport连接在一起的。这就意味着所有的处理器都可以直接的相互通信而不惜要通过一个所谓的中心,更不需要为了做一件事情而牵扯到所有的处理器。这种一对一的通信方式已经被应用到了Opteron处理器中,使得他可以和其他部件的通信更加的迅速高效,当然在不久的将来,这项技术将会应用到协处理器上来,他使得所有的协处理器在工作的时候,相互之间的通信的延迟更小。
      另一个AMD构架的进步是在CPU中集成了内存控制器,这使得每一个接口可以和他的内存之间直接通信,这对于协处理器来说有着巨大的好处。强大的HyperTransport构架使得不同的芯片可以在需要的时候使用自己的内存。比如说,某一个芯片在处理一项特殊的任务的时候自己带有的内存不能满足要求了,在传统的系统中,系统的内存是由一个中央芯片控制的,由于数据首先要通过中向芯片所以必然会导致一定的延迟,也就造成了处理器们排队等待使用内存的情况。
venturex 该用户已被删除
2#
发表于 2007-4-1 21:02 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

3#
发表于 2007-4-1 21:03 | 只看该作者
LZ啊,Intel的CSI在哪?
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2007-4-1 21:05 | 只看该作者
下半部分暂时不放出来,因为才翻译完。我自己的网站先用,然后再转过来!嗬嗬!
回复 支持 反对

使用道具 举报

5#
发表于 2007-4-1 21:20 | 只看该作者
通用计算万岁!!:lol:
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
6#
发表于 2007-4-1 22:00 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

zacard 该用户已被删除
7#
发表于 2007-4-2 09:08 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

8#
发表于 2007-4-2 09:30 | 只看该作者
看过lz的下半部分了,但是我觉得CSI的细节公布得更多吧,貌似应用计划也比AMD提前,空中楼阁这种话恐怕要送给AMD。
回复 支持 反对

使用道具 举报

9#
 楼主| 发表于 2007-4-2 09:56 | 只看该作者
AMD的Torrenza基本上已经实现了,其核心部分HT3马上就要来了。CSI好像才是只有概念吧!
回复 支持 反对

使用道具 举报

10#
发表于 2007-4-2 13:07 | 只看该作者
技术帖
路过。。。。
回复 支持 反对

使用道具 举报

xiaxiaf 该用户已被删除
11#
发表于 2007-4-2 13:45 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

12#
 楼主| 发表于 2007-4-2 15:58 | 只看该作者
原帖由 xiaxiaf 于 2007-4-2 13:45 发表
LZ你的网站最好能居中对期,要不把表格的边宽距搞大的,左边看起来不舒服


阿?不是吧,我在家用19''看,感觉很好啊!全部做对奇,右边是空的。最好能截个图,有问题的话我会改的!
回复 支持 反对

使用道具 举报

13#
发表于 2007-4-2 18:19 | 只看该作者
原帖由 Prescott 于 2007-4-1 21:20 发表
通用计算万岁!!:lol:



:thumbsup: 同意啊
回复 支持 反对

使用道具 举报

14#
发表于 2007-4-2 18:24 | 只看该作者
有本事就用“通用计算”玩游戏去:lol:

高码率的视频都看不了
回复 支持 反对

使用道具 举报

15#
发表于 2007-4-2 18:25 | 只看该作者
那个PPU实际上是很啦叽的,呵呵,那可是70Gflops的协处理哇

F@H的flops统计什么也说明不了,

CUDA也效果不明
回复 支持 反对

使用道具 举报

16#
发表于 2007-4-2 18:41 | 只看该作者
不说视频、物理,随便一片音频解码器所做的运算放CPU上就足够让扣肉卡死
回复 支持 反对

使用道具 举报

Bohr 该用户已被删除
17#
发表于 2007-4-2 18:55 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

18#
发表于 2007-4-2 19:05 | 只看该作者
现在还是纯粹理论上的东西,装多个cpu让成本更高了
回复 支持 反对

使用道具 举报

19#
 楼主| 发表于 2007-4-11 16:02 | 只看该作者
感谢大家支持!!!!!!
回复 支持 反对

使用道具 举报

20#
发表于 2007-4-11 16:11 | 只看该作者
why占用宝贵的cpu插槽,而不是放在pci-e槽上呢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-10-21 11:50

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表