POPPUR爱换

标题: IBM Power6处理器发布 65nm＋4.7GHz [打印本页]

作者: ghrs2010 时间: 2007-5-22 13:23
标题: IBM Power6处理器发布 65nm＋4.7GHz
IBM今天正式揭开了其新一代处理器“Power6”的神秘面纱，并声称这是“有史以来最快的微处理器”。一如昨天Oracle泄密的消息，Power6的最高主频达到了惊人的4.7GHz，比Intel最快的Pentium 4高出近1GHz。

Power6处理器采用65nm工艺制造，集成了7.9亿个晶体管。与前辈Power5相比，Power6不但主频翻了一番还多，多达8MB的二级缓存也是原来的四倍，三级缓存也有32MB。带宽方面，Power6颗提供300GB/s，理论上可以在60秒钟左右的时间里下载苹果的整个iTunes 音乐商店。

Power6不仅规格强悍，性能方面也丝毫不弱。IBM称，“在大量的商业和技术应用中”，基于Power6的System p570机架服务器系统已经创造了25项测试记录。

蓝色巨人另一个值得称道的地方是对功耗的控制。IBM表示，得益于新的“压频快速定向”技术，在主频、性能翻番的同时，Power6 4.7GHz消耗的能量不会高于Power5 2.2GHz，而在同样的2.2GHz主频下，Power6消耗的能量只有Power5的一半。对于服务器业来说，Power6的节能优势无疑会非常明显。

System p570系统将在6月8日开始销售，最多颗配备8颗Power6处理器，运行Unix系统，起价6万美元；System i系列则会稍后出货，运行i5/OS系统。二者还都支持Linux系统。IBM称，Power6已经吸引了业界很多巨头客户的关注，包括正在使用 Intel Itanium和Sun Sparc处理器的Dell、HP和Sun。

IBM还计划在今年晚些时候推出“Power6 Live Partition Mobility”项目，可以让用户将正在运行中的Unix系统从一台机器上转移到其他机器上，可以有效预防硬件失败、保护系统。该项目现在正处于Beta测试中。

作者: acqwer 时间: 2007-5-22 13:43
“压频快速定向”技术是什么玩意，不会说就是自动降频吧。

作者: windslove 时间: 2007-5-22 14:00
提示: 作者被禁止或删除内容自动屏蔽

作者: psc2001 时间: 2007-5-22 15:00
提示: 作者被禁止或删除内容自动屏蔽

作者: maomaobear 时间: 2007-5-22 15:59
蓝色巨人另一个值得称道的地方是对功耗的控制。IBM表示，得益于新的“压频快速定向”技术，在主频、性能翻番的同时，Power6 4.7GHz消耗的能量不会高于Power5 2.2GHz，而在同样的2.2GHz主频下，Power6消耗的能量只有Power5的一半。对于服务器业来说，Power6的节能优势无疑会非常明显。

自动降频率电压？还是关闭不需要的处理单元？

作者: bessel 时间: 2007-5-23 16:13
美国可以联系销售代表了。

原帖由 psc2001 于 2007-5-22 15:00 发表

今年下半年采购2台玩玩，难道可以买到了么:loveliness:

作者: agrantleung 时间: 2007-5-23 17:05
4.7G？
强~
和扣肉的服务器版本（忘了叫什么名字）比怎么样？

作者: ghrs2010 时间: 2007-5-23 18:41

原帖由 agrantleung 于 2007-5-23 17:05 发表
4.7G？
强~
和扣肉的服务器版本（忘了叫什么名字）比怎么样？

POWER6的对手不是XEON拉,目前来看Montecito根本就是望尘莫及,等Tukwila吧

作者: bessel 时间: 2007-5-23 22:37
老虎也架不住一群狼的，虽然xeon和opteron都很衰。

原帖由 ghrs2010 于 2007-5-23 18:41 发表

POWER6的对手不是XEON拉,目前来看Montecito根本就是望尘莫及,等Tukwila吧

作者: ghrs2010 时间: 2007-5-23 23:07

原帖由 bessel 于 2007-5-23 22:37 发表
老虎也架不住一群狼的，虽然xeon和opteron都很衰。

和POWER6拼互联效率,这个:funk:

也只有PPC440MP有望战而胜之吧,依托BLUE GENE半无限的扩展能力的话

作者: ConroeXE 时间: 2007-5-23 23:40
提示: 作者被禁止或删除内容自动屏蔽

作者: ConroeXE 时间: 2007-5-23 23:43
提示: 作者被禁止或删除内容自动屏蔽

作者: 89度热水 时间: 2007-5-23 23:52

原帖由 ConroeXE 于 2007-5-23 23:43 发表
这东西，思路上可能会引领Intel和AMD下一代CPU。
羡慕啊，我是频率fan+速度fan，尤其仰慕Power6这等YY货。

in Order架构不适合桌面通用性能

作者: ConroeXE 时间: 2007-5-24 00:16
提示: 作者被禁止或删除内容自动屏蔽

作者: bessel 时间: 2007-5-24 02:09
blue gene是个异种，你有兴趣可以看看blue gene的体系是怎么安排的，那东西的通用性不是特别好，节点之间的带宽也不大，到远处节点的访问性能也不是很好。

之所以说好虎架不住一群狼，其实是因为很多实际应用并不需要那么好的互联，看看fluent的benchmark，
这是典型的工程上的大的应用，至少power5+系统没有占到任何便宜，普通的infiniband互联比
power6的互联便宜多了。这是为什么ib集群越来越多的原因。

真的需要互联的场合，sgi,cray都有很好的解决方案，特别是cray的xd1很有意思。

原帖由 ghrs2010 于 2007-5-23 23:07 发表

和POWER6拼互联效率,这个:funk:

也只有PPC440MP有望战而胜之吧,依托BLUE GENE半无限的扩展能力的话

作者: Prescott 时间: 2007-5-24 08:06

原帖由 ghrs2010 于 2007-5-23 23:07 发表

和POWER6拼互联效率,这个:funk:

也只有PPC440MP有望战而胜之吧,依托BLUE GENE半无限的扩展能力的话

绝大部分应用在blue gene上的可扩展性可以说是很差。他是为了和日本争TOP500第一搞出来的怪胎。现在大部分的程序在IB互联的机群上就可以获得相当不错的并行加速比。

要论高性能计算，Power6短期可能有一定市场，但是肯定不是Nehalem的对手，设想一下由一个4处理器的Nehalem节点组成的机群：每个节点16核心，每核心4GHz，节点总内存带宽1xxGB/s，节点浮点能力256GFLOPS。1024个节点组成的机群Rpeak就是256TGLOPS，在TOP500上就是第二，比现在第一的Blue Gene差一点点。这种东西的易用性和性价比无敌。你要是喜欢看着理论峰值YY也简单，4个插槽插一个Nehalem，剩下3个插Larrabee，Rpeak轻松突破1T。

Power6的强项在企业级计算，并非高性能。企业级所需要的高可靠性和可用性是普通集群不能提供的，这个领域对手是Itanium。

[ 本帖最后由 Prescott 于 2007-5-24 08:14 编辑 ]

作者: ghrs2010 时间: 2007-5-24 10:42

原帖由 Prescott 于 2007-5-24 08:06 发表

绝大部分应用在blue gene上的可扩展性可以说是很差。他是为了和日本争TOP500第一搞出来的怪胎。现在大部分的程序在IB互联的机群上就可以获得相当不错的并行加速比。

IBM参选DARPA的设计构想便以BLUE GENE为原型,并且重点改进了并行加速方面的适应性:采用Grid Computing架构,通过大量内嵌高速DRAM----每CORE内嵌1GB容量）----的定制版Power7完成节点搭建(附带一提,POWER7有点像CELL&POWER6的混合体,其频率表现可能不及POWER6+,不过应当可以胜过POWER6),节点之间再借助特殊的 I/O Link芯片互连.通常情况下內嵌高速DRAM视同CACHE,必要时系统可以借助特殊存取形式将其作为各处理器的主存使用.另外,节点内的处理器共用第二层外部存储器,基本上可以视为双层外部存储器架构

另外,其实我描述的不是应用程序的适应性拉,而是互连架构本身的扩展性,BLUE GENE/L理论上最多支持2^24枚处理器

作者: Prescott 时间: 2007-5-24 11:17

原帖由 ghrs2010 于 2007-5-24 10:42 发表

IBM参选DARPA的设计构想便以BLUE GENE为原型,并且重点改进了并行加速方面的适应性:采用Grid Computing架构,通过大量内嵌高速DRAM----每CORE内嵌1GB容量）----的定制版Power7完成节点搭建(附带一提,POWER7有 ...

连多少颗处理器并不重要。关键是好不好用。

另外，这种PR文章就不要拿出来了。毫无意义。

作者: maomaobear 时间: 2007-5-24 15:11
高性能计算这一块各家都有自己的一套低延迟高带宽互连技术。未来最强的一定是最普及最便宜的。

作者: bessel 时间: 2007-5-24 16:44
嘛叫作grid computing架构？w00t) 这就是官话，忽悠人玩的。

DARPA的官老爷们要peta flops，还要100个peta， 1000个peta叫啥来着俺记不住了。
于是设计师无论如何也要做到单个chip上的tera flops。ibm的设计说的比较多，大概是在单个chip上拼命堆一些浮点单元，所以很像cell,也有些像intel的80核。但是这样内存带宽就很不够，于是要
内嵌dram,不过1GB容量速度也不会太快，火星技术是没有的。
intel那个80核再嵌上1GB作为L3比较象ibm给darpa的东西。不过这个还有好几年，大概在2010--2012年才有，估计没人来挖坟了，嘿嘿。
节点间互联也没啥特殊的，不过现在的blue gene最近邻节点之间带宽只有200MB/s。片外内存也不会太多，现在的
blue gene大概有不到1G Byte。

互联结构的扩展性俺不知道是啥，只要肯扩，有地方放，这种网格结构的mpp总可以无限制的堆下去，这个2^24不知道啥意思。不过眼前的blue gene没戏，一个机柜大概2048个处理器，
2^13个机柜比人类能接受的多了4到8倍，估计ibm有升级到4核以上的意思罢了。

应用程序？人们是要为这样大规模的并行付出代价的，你因该注意到cray在开发新的语言了。

原帖由 ghrs2010 于 2007-5-24 10:42 发表

IBM参选DARPA的设计构想便以BLUE GENE为原型,并且重点改进了并行加速方面的适应性:采用Grid Computing架构,通过大量内嵌高速DRAM----每CORE内嵌1GB容量）----的定制版Power7完成节点搭建(附带一提, POWER7有点像CELL&POWER6的混合体,其频率表现可能不及POWER6+,不过应当可以胜过POWER6),节点之间再借助特殊的 I/O Link芯片互连.通常情况下內嵌高速DRAM视同CACHE,必要时系统可以借助特殊存取形式将其作为各处理器的主存使用.另外,节点内的处理器共用第二层外部存储器,基本上可以视为双层外部存储器架构
另外,其实我描述的不是应用程序的适应性拉,而是互连架构本身的扩展性,BLUE GENE/L理论上最多支持2^24枚处理器

作者: bessel 时间: 2007-5-24 16:56
blue gene 和sx系列的竞争没关系，最早提出这个东西是在199x年，那时候ibm拿了一笔钱来设计机器来算蛋白质。
blue gene 的前身来自哥伦比亚大学找ibm定制的2台算qcd的机器，qcdoc and qcdsp。这两台机器长大了以后叫作blue gene。
你去搜一下就可看看到哥大关于这两台机器的主页，长得和blue gene那叫一个像啊，哈哈，有血缘关系就是不一样。

直接和sx系列竞争的是cray x1 and x1e。这两台机器某些地方比地球模拟器更bt，不过看起来没有sx8变态。

P大，每个socker的nehalem有2xGB/s带宽，4通道内存每处理器？多给点暗示。

原帖由 Prescott 于 2007-5-24 08:06 发表
绝大部分应用在blue gene上的可扩展性可以说是很差。他是为了和日本争TOP500第一搞出来的怪胎。现在大部分的程序在IB互联的机群上就可以获得相当不错的并行加速比。
要论高性能计算，Power6短期可能有一定市场，但是肯定不是Nehalem的对手，设想一下由一个4处理器的Nehalem节点组成的机群：每个节点16核心，每核心4GHz，节点总内存带宽1xxGB/s，节点浮点能力256GFLOPS。1024个节点组成的机群Rpeak就是256TGLOPS，在TOP500上就是第二，比现在第一的Blue Gene差一点点。这种东西的易用性和性价比无敌。你要是喜欢看着理论峰值YY也简单，4个插槽插一个Nehalem，剩下3个插Larrabee， Rpeak轻松突破1T。
Power6的强项在企业级计算，并非高性能。企业级所需要的高可靠性和可用性是普通集群不能提供的，这个领域对手是Itanium。

作者: arkee100 时间: 2007-5-24 17:03
每天一顶
8字补丁

作者: Songhaipeng 时间: 2007-5-24 17:04
IBM的U再好，我用不上。所以不关心。

作者: bessel 时间: 2007-5-24 17:11
买游戏机就用上了。

原帖由 Songhaipeng 于 2007-5-24 17:04 发表
IBM的U再好，我用不上。所以不关心。

作者: ghrs2010 时间: 2007-5-24 17:40

原帖由 bessel 于 2007-5-24 16:44 发表
互联结构的扩展性俺不知道是啥，只要肯扩，有地方放，这种网格结构的mpp总可以无限制的堆下去，这个2^24不知道啥意思。不过眼前的blue gene没戏，一个机柜大概2048个处理器，2^13个机柜比人类能接受的多了4到8倍，估计ibm有升级到4核以上的意思罢了。

依照官方资料,好像是说直到这一规模为止,并行加速比依旧是可以接受的

作者: Prescott 时间: 2007-5-24 17:42

原帖由 bessel 于 2007-5-24 16:56 发表
blue gene 和sx系列的竞争没关系，最早提出这个东西是在199x年，那时候ibm拿了一笔钱来设计机器来算蛋白质。
blue gene 的前身来自哥伦比亚大学找ibm定制的2台算qcd的机器，qcdoc and qcdsp。这两台机器长大了 ...

哦，原来是这样，长见识了。

难怪这种架构的东西跑蛋白质很牛，连Cell都很牛。:lol:

作者: ghrs2010 时间: 2007-5-24 17:43

原帖由 bessel 于 2007-5-24 16:56 发表
P大，每个socker的nehalem有2xGB/s带宽，4通道内存每处理器？

Nehalem并非集成IMC,内存通道数应该取决于CHIPSET吧?

4通道的话,恐怕是XEON才有的待遇了

作者: Prescott 时间: 2007-5-24 17:49

原帖由 ghrs2010 于 2007-5-24 17:43 发表

Nehalem并非集成IMC,内存通道数应该取决于CHIPSET吧?

4通道的话,恐怕是XEON才有的待遇了

我记得很久之前就说过，Nehalem是和Netburst同一个级别的代号。

作者: ghrs2010 时间: 2007-5-24 18:23

原帖由 Prescott 于 2007-5-24 17:49 发表

我记得很久之前就说过，Nehalem是和Netburst同一个级别的代号。

老大误解了我的意思,汗

我是说只有至强版的Nehalem才会有4通道

作者: Prescott 时间: 2007-5-24 18:36

原帖由 ghrs2010 于 2007-5-24 18:23 发表

老大误解了我的意思,汗

我是说只有至强版的Nehalem才会有4通道

我不是一直说的都是4处理器的平台吗？:wacko:

作者: bessel 时间: 2007-5-24 18:59
那是因为他们只贴跑的好的程序的结果。
blue gene上还是不少程序跑的不错的。

原帖由 ghrs2010 于 2007-5-24 17:40 发表

依照官方资料,好像是说直到这一规模为止,并行加速比依旧是可以接受的

欢迎光临 POPPUR爱换 (https://we.poppur.com/)