POPPUR爱换

标题: IBM Power6处理器发布 65nm+4.7GHz [打印本页]

作者: ghrs2010    时间: 2007-5-22 13:23
标题: IBM Power6处理器发布 65nm+4.7GHz
IBM今天正式揭开了其新一代处理器“Power6”的神秘面纱,并声称这是“有史以来最快的微处理器”。一如昨天Oracle泄密的消息,Power6的最高主频达到了惊人的4.7GHz,比Intel最快的Pentium 4高出近1GHz。

Power6处理器采用65nm工艺制造,集成了7.9亿个晶体管。与前辈Power5相比,Power6不但主频翻了一番还多,多达8MB的二级缓存也是原来的四倍,三级缓存也有32MB。带宽方面,Power6颗提供300GB/s,理论上可以在60秒钟左右的时间里下载苹果的整个iTunes 音乐商店。

Power6不仅规格强悍,性能方面也丝毫不弱。IBM称,“在大量的商业和技术应用中”,基于Power6的System p570机架服务器系统已经创造了25项测试记录。

蓝色巨人另一个值得称道的地方是对功耗的控制。IBM表示,得益于新的“压频快速定向”技术,在主频、性能翻番的同时,Power6 4.7GHz消耗的能量不会高于Power5 2.2GHz,而在同样的2.2GHz主频下,Power6消耗的能量只有Power5的一半。对于服务器业来说,Power6的节能优势无疑会非常明显。

System p570系统将在6月8日开始销售,最多颗配备8颗Power6处理器,运行Unix系统,起价6万美元;System i系列则会稍后出货,运行i5/OS系统。二者还都支持Linux系统。IBM称,Power6已经吸引了业界很多巨头客户的关注,包括正在使用 Intel Itanium和Sun Sparc处理器的Dell、HP和Sun。

IBM还计划在今年晚些时候推出“Power6 Live Partition Mobility”项目,可以让用户将正在运行中的Unix系统从一台机器上转移到其他机器上,可以有效预防硬件失败、保护系统。该项目现在正处于Beta测试中。
作者: acqwer    时间: 2007-5-22 13:43
“压频快速定向”技术是什么玩意,不会说就是自动降频吧。
作者: windslove    时间: 2007-5-22 14:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: psc2001    时间: 2007-5-22 15:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: maomaobear    时间: 2007-5-22 15:59
蓝色巨人另一个值得称道的地方是对功耗的控制。IBM表示,得益于新的“压频快速定向”技术,在主频、性能翻番的同时,Power6 4.7GHz消耗的能量不会高于Power5 2.2GHz,而在同样的2.2GHz主频下,Power6消耗的能量只有Power5的一半。对于服务器业来说,Power6的节能优势无疑会非常明显。

自动降频率电压?还是关闭不需要的处理单元?
作者: bessel    时间: 2007-5-23 16:13
美国可以联系销售代表了。

原帖由 psc2001 于 2007-5-22 15:00 发表

今年下半年采购2台玩玩,难道可以买到了么:loveliness:

作者: agrantleung    时间: 2007-5-23 17:05
4.7G?
强~
和扣肉的服务器版本(忘了叫什么名字)比怎么样?
作者: ghrs2010    时间: 2007-5-23 18:41
原帖由 agrantleung 于 2007-5-23 17:05 发表
4.7G?
强~
和扣肉的服务器版本(忘了叫什么名字)比怎么样?


POWER6的对手不是XEON拉,目前来看Montecito根本就是望尘莫及,等Tukwila吧
作者: bessel    时间: 2007-5-23 22:37
老虎也架不住一群狼的,虽然xeon和opteron都很衰。

原帖由 ghrs2010 于 2007-5-23 18:41 发表


POWER6的对手不是XEON拉,目前来看Montecito根本就是望尘莫及,等Tukwila吧

作者: ghrs2010    时间: 2007-5-23 23:07
原帖由 bessel 于 2007-5-23 22:37 发表
老虎也架不住一群狼的,虽然xeon和opteron都很衰。



和POWER6拼互联效率,这个:funk:

也只有PPC440MP有望战而胜之吧,依托BLUE GENE半无限的扩展能力的话
作者: ConroeXE    时间: 2007-5-23 23:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: ConroeXE    时间: 2007-5-23 23:43
提示: 作者被禁止或删除 内容自动屏蔽
作者: 89度热水    时间: 2007-5-23 23:52
原帖由 ConroeXE 于 2007-5-23 23:43 发表
这东西,思路上可能会引领Intel和AMD下一代CPU。
羡慕啊,我是频率fan+速度fan,尤其仰慕Power6这等YY货。


in Order架构不适合桌面通用性能
作者: ConroeXE    时间: 2007-5-24 00:16
提示: 作者被禁止或删除 内容自动屏蔽
作者: bessel    时间: 2007-5-24 02:09
blue gene是个异种,你有兴趣可以看看blue gene的体系是怎么安排的,那东西的通用性不是特别好,节点之间的带宽也不大,到远处节点的访问性能也不是很好。

之所以说好虎架不住一群狼,其实是因为很多实际应用并不需要那么好的互联,看看fluent的benchmark,
这是典型的工程上的大的应用,至少power5+系统没有占到任何便宜,普通的infiniband互联比
power6的互联便宜多了。这是为什么ib集群越来越多的原因。

真的需要互联的场合,sgi,cray都有很好的解决方案,特别是cray的xd1很有意思。


原帖由 ghrs2010 于 2007-5-23 23:07 发表


和POWER6拼互联效率,这个:funk:

也只有PPC440MP有望战而胜之吧,依托BLUE GENE半无限的扩展能力的话

作者: Prescott    时间: 2007-5-24 08:06
原帖由 ghrs2010 于 2007-5-23 23:07 发表


和POWER6拼互联效率,这个:funk:

也只有PPC440MP有望战而胜之吧,依托BLUE GENE半无限的扩展能力的话

绝大部分应用在blue gene上的可扩展性可以说是很差。他是为了和日本争TOP500第一搞出来的怪胎。现在大部分的程序在IB互联的机群上就可以获得相当不错的并行加速比。

要论高性能计算,Power6短期可能有一定市场,但是肯定不是Nehalem的对手,设想一下由一个4处理器的Nehalem节点组成的机群:每个节点16核心,每核心4GHz,节点总内存带宽1xxGB/s,节点浮点能力256GFLOPS。1024个节点组成的机群Rpeak就是256TGLOPS,在TOP500上就是第二,比现在第一的Blue Gene差一点点。这种东西的易用性和性价比无敌。你要是喜欢看着理论峰值YY也简单,4个插槽插一个Nehalem,剩下3个插Larrabee,Rpeak轻松突破1T。

Power6的强项在企业级计算,并非高性能。企业级所需要的高可靠性和可用性是普通集群不能提供的,这个领域对手是Itanium。

[ 本帖最后由 Prescott 于 2007-5-24 08:14 编辑 ]
作者: ghrs2010    时间: 2007-5-24 10:42
原帖由 Prescott 于 2007-5-24 08:06 发表

绝大部分应用在blue gene上的可扩展性可以说是很差。他是为了和日本争TOP500第一搞出来的怪胎。现在大部分的程序在IB互联的机群上就可以获得相当不错的并行加速比。


IBM参选DARPA的设计构想便以BLUE GENE为原型,并且重点改进了并行加速方面的适应性:采用Grid Computing架构,通过大量内嵌高速DRAM----每CORE内嵌1GB容量)----的定制版Power7完成节点搭建(附带一提,POWER7有点像CELL&POWER6的混合体,其频率表现可能不及POWER6+,不过应当可以胜过POWER6),节点之间再借助特殊的 I/O Link芯片互连.通常情况下內嵌高速DRAM视同CACHE,必要时系统可以借助特殊存取形式将其作为各处理器的主存使用.另外,节点内的处理器共用第二层外部存储器,基本上可以视为双层外部存储器架构

另外,其实我描述的不是应用程序的适应性拉,而是互连架构本身的扩展性,BLUE GENE/L理论上最多支持2^24枚处理器
作者: Prescott    时间: 2007-5-24 11:17
原帖由 ghrs2010 于 2007-5-24 10:42 发表


IBM参选DARPA的设计构想便以BLUE GENE为原型,并且重点改进了并行加速方面的适应性:采用Grid Computing架构,通过大量内嵌高速DRAM----每CORE内嵌1GB容量)----的定制版Power7完成节点搭建(附带一提,POWER7有 ...

连多少颗处理器并不重要。关键是好不好用。

另外,这种PR文章就不要拿出来了。毫无意义。
作者: maomaobear    时间: 2007-5-24 15:11
高性能计算这一块各家都有自己的一套低延迟高带宽互连技术。未来最强的一定是最普及最便宜的。
作者: bessel    时间: 2007-5-24 16:44
嘛叫作grid computing架构?w00t)  这就是官话,忽悠人玩的。

DARPA的官老爷们要peta flops,还要100个peta, 1000个peta叫啥来着俺记不住了。
于是设计师无论如何也要做到单个chip上的tera flops。ibm的设计说的比较多,大概是在单个chip上拼命堆一些浮点单元,所以很像cell,也有些像intel的80核。但是这样内存带宽就很不够,于是要
内嵌dram,不过1GB容量速度也不会太快,火星技术是没有的。
intel那个80核再嵌上1GB作为L3比较象ibm给darpa的东西。不过这个还有好几年,大概在2010--2012年才有,估计没人来挖坟了,嘿嘿。
节点间互联也没啥特殊的,不过现在的blue gene最近邻节点之间带宽只有200MB/s。片外内存也不会太多,现在的
blue gene大概有不到1G Byte。

互联结构的扩展性俺不知道是啥,只要肯扩,有地方放,这种网格结构的mpp总可以无限制的堆下去,这个2^24不知道啥意思。不过眼前的blue gene没戏,一个机柜大概2048个处理器,
2^13个机柜比人类能接受的多了4到8倍,估计ibm有升级到4核以上的意思罢了。

应用程序?人们是要为这样大规模的并行付出代价的,你因该注意到cray在开发新的语言了。


原帖由 ghrs2010 于 2007-5-24 10:42 发表

IBM参选DARPA的设计构想便以BLUE GENE为原型,并且重点改进了并行加速方面的适应性:采用Grid Computing架构,通过大量内嵌高速DRAM----每CORE内嵌1GB容量)----的定制版Power7完成节点搭建(附带一提, POWER7有点像CELL&POWER6的混合体,其频率表现可能不及POWER6+,不过应当可以胜过POWER6),节点之间再借助特殊的 I/O Link芯片互连.通常情况下內嵌高速DRAM视同CACHE,必要时系统可以借助特殊存取形式将其作为各处理器的主存使用.另外,节点内的处理器共用第二层外部存储器,基本上可以视为双层外部存储器架构
另外,其实我描述的不是应用程序的适应性拉,而是互连架构本身的扩展性,BLUE GENE/L理论上最多支持2^24枚处理器

作者: bessel    时间: 2007-5-24 16:56
blue gene 和sx系列的竞争没关系,最早提出这个东西是在199x年,那时候ibm拿了一笔钱来设计机器来算蛋白质。
blue gene 的前身来自哥伦比亚大学找ibm定制的2台算qcd的机器,qcdoc and qcdsp。这两台机器长大了以后叫作blue gene。
你去搜一下就可看看到哥大关于这两台机器的主页,长得和blue gene那叫一个像啊,哈哈,有血缘关系就是不一样。

直接和sx系列竞争的是cray x1 and x1e。这两台机器某些地方比地球模拟器更bt,不过看起来没有sx8变态。

P大,每个socker的nehalem有2xGB/s带宽,4通道内存每处理器?多给点暗示。


原帖由 Prescott 于 2007-5-24 08:06 发表
绝大部分应用在blue gene上的可扩展性可以说是很差。他是为了和日本争TOP500第一搞出来的怪胎。现在大部分的程序在IB互联的机群上就可以获得相当不错的并行加速比。
要论高性能计算,Power6短期可能有一定市场,但是肯定不是Nehalem的对手,设想一下由一个4处理器的Nehalem节点组成的机群:每个节点16核心,每核心4GHz,节点总内存带宽1xxGB/s,节点浮点能力256GFLOPS。1024个节点组成的机群Rpeak就是256TGLOPS,在TOP500上就是第二,比现在第一的Blue Gene差一点点。这种东西的易用性和性价比无敌。你要是喜欢看着理论峰值YY也简单,4个插槽插一个Nehalem,剩下3个插Larrabee, Rpeak轻松突破1T。
Power6的强项在企业级计算,并非高性能。企业级所需要的高可靠性和可用性是普通集群不能提供的,这个领域对手是Itanium。

作者: arkee100    时间: 2007-5-24 17:03
每天一顶
8字补丁
作者: Songhaipeng    时间: 2007-5-24 17:04
IBM的U再好,我用不上。所以不关心。
作者: bessel    时间: 2007-5-24 17:11
买游戏机就用上了。

原帖由 Songhaipeng 于 2007-5-24 17:04 发表
IBM的U再好,我用不上。所以不关心。

作者: ghrs2010    时间: 2007-5-24 17:40
原帖由 bessel 于 2007-5-24 16:44 发表
互联结构的扩展性俺不知道是啥,只要肯扩,有地方放,这种网格结构的mpp总可以无限制的堆下去,这个2^24不知道啥意思。不过眼前的blue gene没戏,一个机柜大概2048个处理器,2^13个机柜比人类能接受的多了4到8倍,估计ibm有升级到4核以上的意思罢了。


依照官方资料,好像是说直到这一规模为止,并行加速比依旧是可以接受的
作者: Prescott    时间: 2007-5-24 17:42
原帖由 bessel 于 2007-5-24 16:56 发表
blue gene 和sx系列的竞争没关系,最早提出这个东西是在199x年,那时候ibm拿了一笔钱来设计机器来算蛋白质。
blue gene 的前身来自哥伦比亚大学找ibm定制的2台算qcd的机器,qcdoc and qcdsp。这两台机器长大了 ...

哦,原来是这样,长见识了。

难怪这种架构的东西跑蛋白质很牛,连Cell都很牛。:lol:
作者: ghrs2010    时间: 2007-5-24 17:43
原帖由 bessel 于 2007-5-24 16:56 发表
P大,每个socker的nehalem有2xGB/s带宽,4通道内存每处理器?


Nehalem并非集成IMC,内存通道数应该取决于CHIPSET吧?

4通道的话,恐怕是XEON才有的待遇了
作者: Prescott    时间: 2007-5-24 17:49
原帖由 ghrs2010 于 2007-5-24 17:43 发表


Nehalem并非集成IMC,内存通道数应该取决于CHIPSET吧?

4通道的话,恐怕是XEON才有的待遇了

我记得很久之前就说过,Nehalem是和Netburst同一个级别的代号。
作者: ghrs2010    时间: 2007-5-24 18:23
原帖由 Prescott 于 2007-5-24 17:49 发表

我记得很久之前就说过,Nehalem是和Netburst同一个级别的代号。


老大误解了我的意思,汗

我是说只有至强版的Nehalem才会有4通道
作者: Prescott    时间: 2007-5-24 18:36
原帖由 ghrs2010 于 2007-5-24 18:23 发表


老大误解了我的意思,汗

我是说只有至强版的Nehalem才会有4通道

我不是一直说的都是4处理器的平台吗?:wacko:
作者: bessel    时间: 2007-5-24 18:59
那是因为他们只贴跑的好的程序的结果。
blue gene上还是不少程序跑的不错的。


原帖由 ghrs2010 于 2007-5-24 17:40 发表


依照官方资料,好像是说直到这一规模为止,并行加速比依旧是可以接受的





欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4