POPPUR爱换

标题: 对英特尔这则言论无语了 [打印本页]

作者: vivalinux    时间: 2006-6-21 17:38
标题: 对英特尔这则言论无语了
英特尔深圳IDF:CPU性能应该取决于IPC
http://www.ciw.com.cn/blog/user1 ... /2006523152414.html

“在上午10点多,英特尔公司亚太区先进技术销售与服务总监林圣聪向现场观众作《深入了解英特尔的下一代微体系结构并关注相关的使用模式》的主题演讲。在演讲中,林圣聪表示,1946年,主内存中只有20个晶体管,到了1971年,4004处理器有2300个晶体管,到了2005年,65纳米的处理器已经有10亿个以上的晶体管。这样的效果导致英特尔一定要进行减低电压管理,来减少功耗。过去,大家认为的是性能是频率决定的,功率=电容×电压的平方×频率,现在,大家应该有新的认识,那就是性能取决于IPC,IPC就是CPU每一个时钟周期所执行的指令的多少“

==============================

性能在不同的应用中有着不同的定义,学术界所公认的是以响应时间或者吞吐率做为性能的代表。对于大多数用户而言,响应时间更具有代表性。响应时间=指令数/(IPC*频率)。如果就x86架构层面考虑,指令数仅仅取决于软件的编译环境,在大多数用户使用的都是编译完成的二进制程序的背景下,响应时间由IPC和频率两方面决定。:devil:

在英特尔netburst时代,英特尔一直宣称频率决定性能。现在英特尔IPC远高于竞争对手,频率低于自家前代产品的Core微架构推出后,又声称IPC决定性能。真是服了。:wacko:

另外,现在英特尔也已将频率至上改为了性能/瓦特,市场上明智而技术上荒唐的误导。的确,现在英特尔在Core微架构下无论性能还是性能/瓦特都高于竞争对手AMD,但绝大多数PC、工作站用户是不会真正关心性能/瓦特的,他们只会关心自己用的处理器的功耗是不是高到不可以接受的程度。要真讨论性能/瓦特的话,桌面CPU跟跟ARM、TI这样的嵌入式处理器相比根本不是同一量级的。

英特尔什么时候才能停止误导用户?)_)

[ 本帖最后由 vivalinux 于 2006-6-21 17:44 编辑 ]
作者: incomment    时间: 2006-6-21 18:00
看着你被I 饭喷了 #
一个领导就一个风格。别当intel的市场部门吃干饭的啊。哎 #
作者: hopetoknow2    时间: 2006-6-21 18:22
原帖由 vivalinux 于 2006-6-21 17:38 发表
英特尔深圳IDF:CPU性能应该取决于IPC
http://www.ciw.com.cn/blog/user1 ... /2006523152414.html

“在上午10点多,英特尔公司亚太区先进技术销售与服务总监林圣聪向现场观众作《深入了解英特尔的 ...

销售与服务总监林圣聪说了是唯一取决于IPC吗?

哈哈,这么认真?  让vv把林圣聪抓起, 打屁屁两下。
作者: hopetoknow2    时间: 2006-6-21 18:27
目前我们普通人, 只关心明年中期之后AMD推出的K8L, 浮点和多媒体SSE性能能有多接近Conroe?

而各种牛就让那些搞市场的职业人士去吹吧。
作者: ultraghost    时间: 2006-6-21 18:33
提示: 作者被禁止或删除 内容自动屏蔽
作者: Cameraman    时间: 2006-6-21 18:38
性能/瓦特  P3铜矿、Dothan、Conroe  这三个怎么排序?
作者: deadmeat    时间: 2006-6-21 19:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: 密码错误    时间: 2006-6-21 19:28
提示: 作者被禁止或删除 内容自动屏蔽
作者: babystudio    时间: 2006-6-21 19:38
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-6-21 19:46
很多时候其实都是媒体乱写。
作者: webby    时间: 2006-6-21 19:53
提示: 作者被禁止或删除 内容自动屏蔽
作者: Prescott    时间: 2006-6-21 20:08
原帖由 vivalinux 于 2006-6-21 17:38 发表
另外,现在英特尔也已将频率至上改为了性能/瓦特,市场上明智而技术上荒唐的误导。的确,现在英特尔在Core微架构下无论性能还是性能/瓦特都高于竞争对手AMD,但绝大多数PC、工作站用户是不会真正关心性能/瓦特的,他们只会关心自己用的处理器的功耗是不是高到不可以接受的程度。要真讨论性能/瓦特的话,桌面CPU跟跟ARM、TI这样的嵌入式处理器相比根本不是同一量级的。

你确认桌面CPU和ARM比性能/watt不是一个量级的?
不比别的,就比双精度 GFLOPS怎么样?:lol:

其实就算比Specint,ARM和Merom的Specint/watt也不见得能差多少。你觉得200MHz的ARM,Specint2k能有多少分?能拿到30分吗?Merom 2.33 31W功耗,跑到2400应该还是没有任何问题的。所以,下结论之前先仔细思考一下。

什么事情都有个适用的范围, 不是一个用途的东西来比perf/watt,本来就不科学,根本就不具有可比性。而且,要比perf/watt,都应该在一个合理的性能和功耗范围来比。就如同性价比,我说性价比重要,你非要跳出来说,“现在路边586都可以白捡,所以586的性价比远超Intel的Conroe,完全不是一个数量级,主张什么性价比完全是误导。” 我能有什么话说??

[ 本帖最后由 Prescott 于 2006-6-21 21:06 编辑 ]
作者: 单晶硅传奇    时间: 2006-6-21 20:13
我想知道INTEL出扣肉前的P4时代,I饭会怎么看待这句话
作者: cp251    时间: 2006-6-21 20:26
我怎么一点也没觉得被误导??正在满怀期待的等扣肉王者归来……
作者: spinup    时间: 2006-6-21 22:22
conroe相对dothan来说,增加ipc也并不减小频率,这个说法还是不错的.
在ipc和频率之间,明显增加ipc更困难.

偶是比较偏向ipc的,偶觉得ipc更大一些会更好.
作者: hopetoknow2    时间: 2006-6-21 23:04
原帖由 spinup 于 2006-6-21 22:22 发表
conroe相对dothan来说,增加ipc也并不减小频率,这个说法还是不错的.
在ipc和频率之间,明显增加ipc更困难.

偶是比较偏向ipc的,偶觉得ipc更大一些会更好.

不要太过份。 还大? 再大那就是安藤2了。真的要论实际整数IPC那早已经大幅超过在RISC处理器中最顶级的POWER5了。

[ 本帖最后由 hopetoknow2 于 2006-6-21 23:06 编辑 ]
作者: Edison    时间: 2006-6-21 23:11
目前我测试出来的Conroe decoder能力不过是2.66 ipc(4byte x86指令),比Presler好不了多少,但是远高于Yonah的1.995 IPC。
作者: hopetoknow2    时间: 2006-6-21 23:12
Conroe是目前人类所有主流高性能乱序执行处理器中实际整数IPC最高的处理器了。 而且主频也推到了3G之高, 超频达5G, 风冷达3.99G。

被Intel吹两下也不过分。
作者: hopetoknow2    时间: 2006-6-21 23:13
原帖由 Edison 于 2006-6-21 23:11 发表
目前我测试出来的Conroe decoder能力不过是2.66 ipc(4byte x86指令),比Presler好不了多少。

我修改了, 把整数IPC 改为 实际整数IPC

Presler是望尘莫及
作者: Prescott    时间: 2006-6-21 23:26
原帖由 Edison 于 2006-6-21 23:11 发表
目前我测试出来的Conroe decoder能力不过是2.66 ipc(4byte x86指令),比Presler好不了多少,但是远高于Yonah的1.995 IPC。

这也能测试?怎么测的?你怎么绕过trace cache?
作者: Edison    时间: 2006-6-21 23:31
http://www.pcinlife.com/article/ ... 9326586d154_10.html

仅供参考。
作者: hopetoknow2    时间: 2006-6-21 23:39
原帖由 Prescott 于 2006-6-21 23:26 发表

这也能测试?怎么测的?你怎么绕过trace cache?

不知道他是用什么测的?

不过可以用Spec CPU2000来衡量, 用得分除以主频 => 这才是非常合理来衡量 实际整数IPC。

结果是:
那么多RISC处理器却没有比Core更强的, 而且差距都还不小。

这不仅是对于x86处理器是非常了不起的成就,也是乱序执行处理器的巨大成就, 3G拿下3000分, 实现了  1 的突破。 甩开RISC一大截

以前比这个实际整数IPC效率, K8和P4都很弱的, 都是被RISC随便踩的。
作者: Edison    时间: 2006-6-21 23:41
CINT2000/clock就是IPC的说法我是看到过有,不过对这个说法的根据我还没找到。
作者: hopetoknow2    时间: 2006-6-21 23:47
原帖由 Edison 于 2006-6-21 23:41 发表
CINT2000/clock就是IPC的说法我是看到过有,不过对这个说法的根据我还没找到。

并非就是IPC。而是可以用于衡量IPC。

不同种类处理器的指令集不同,而在CINT2000中执行的指令数也不同。 IPC数字本身并不科学。

但是执行CINT2000,不同类型处理器完成的工作是相同的,谁的相对比值低,谁就实际IPC高。

[ 本帖最后由 hopetoknow2 于 2006-6-21 23:48 编辑 ]
作者: hopetoknow2    时间: 2006-6-21 23:57
CPU2000这种是比较惯用的方法。甚至在架构设计师比较严肃的学术论文中,以CPU2000中仿真测试为基础, 来衡量实际IPC还是很多的。给你举两个例子:

http://www.chinagrid.edu.cn/chin ... ATA/19_05_IPDPS.PDF
http://www.spec.org/workshops/2006/papers/14_akkartik-spec06.pdf
作者: Prescott    时间: 2006-6-22 00:13
原帖由 Edison 于 2006-6-21 23:31 发表
http://www.pcinlife.com/article/ ... 9326586d154_10.html

仅供参考。

测试应该这么看:如果loop小于12K条u-ops,代码全部在trace cache中,那么解码器根本不参与工作,测出来的值就是执行宽度,和解码器没什么关系。

如果loop大于12K条u-ops,那么代码全部要从L2中传过来,这个时候就看解码速度和L2的带宽那个先被撑死(目前铁定是解码器先挂)。

所以,第一个拐点肯定出现在(指令字节数 / 每指令uops数)*12K处。拐点之前的解码带宽就是(指令字节数 * IPC)。最大值就出现在那种翻译成uops只有一条,但是本身长度又爆长的那种,cmp eax, imm32就是这种指令。

第二个拐点肯定出现在L2的容量处。在第一个拐点和第二个拐点之间的值才是P4解码器的真实解码能力。也就是:最大1 Inst. / Cycle。嘿嘿。当然,由于结构的关系,这对于P4来说也不是太大的问题。

第二个拐点之后的值,基本上就是受限于内存带宽,没意义了。

[ 本帖最后由 Prescott 于 2006-6-22 01:16 编辑 ]
作者: vivalinux    时间: 2006-6-22 00:27
原帖由 Prescott 于 2006-6-21 20:08 发表

确认桌面CPU和ARM比性能/watt不是一个量级的?
不比别的,就比双精度 GFLOPS怎么样?

其实就算比Specint,ARM和Merom的Specint/watt也不见得能差多少。你觉得200MHz的ARM,Specint2k能有多少分?能拿到30分吗?Merom 2.33 31W功耗,跑到2400应该还是没有任何问题的。所以,下结论之前先仔细思考一下。

什么事情都有个适用的范围, 不是一个用途的东西来比perf/watt,本来就不科学,根本就不具有可比性。而且,要比perf/watt,都应该在一个合理的性能和功耗范围来比。就如同性价比,我说性价比重要,你非要跳出来说,“现在路边586都可以白捡,所以586的性价比远超Intel的Conroe,完全不是一个数量级,主张什么性价比完全是误导 1 我能有什么话说??


P大,你的观点我只能部分性的同意。

很想拿SPEC2000来说话,但是我目前没有见到ARM比较新款的处理器的SPEC2000测试报告,关于GFLOPS方面更没有办法给出了。所以只能拿我看到的Drystone,相信P大对这个东西已经非常熟悉了。

E6400@65nm Drystone 19640
E6400@65nm Power       65W

ARM11 MPCore@130nm Drystone 2600
ARM11 MPCore@130nm Power   990mw

我想结果很明显的了。200MHz的ARM,如果你指得是ARM7,肯定SPEC2000int是到不了30分的,但现在已经不是ARM7了...

如果拿TI DSP和Intel桌面处理器来比消费电子领域的处理,我想结果肯定是TI大胜,但没啥实际意义,因为毕竟不是同类东西。

我同意你的一个观点:
  什么事情都要有个适用的范围。

但你也要看清我的观点:
1. 我反感在什么情况有利于自己的时候就只拿这个说事,尤其是很容易对用户造成误导的情况下。要知道,中国80%以上的人不知道CPU是啥,内存是啥。所以,媒体说啥,厂商说啥,他们就信啥。当初英特尔宣称性能取决于频率,现在宣称性能取决于IPC,这就是误导用户。其实就目前的状况,只要宣传Intel研发能力如何如何强大,Core微架构CPU在哪些哪些方面性能高于竞争对手多少多少,高于自家前代产品多少多少,功耗控制如何如何先进就完了,没必要那些废话。

2. 性能/瓦特也对绝大多数用户没有实际意义。性能本身测量范围很广,接受用户群也不一样(这就是我为啥举了两个反例以说明性能/瓦特不适用的原因)。例如说,大多数台式机用户关心在他能接受的散热器的价格,重量、噪音的前提下性能如何,很少有人会去看完一部片后瞅自家电表吧?可能只有像google这样的客户,才会去关心性能/瓦特。
作者: vivalinux    时间: 2006-6-22 00:36
原帖由 hopetoknow2 于 2006-6-21 23:12 发表
Conroe是目前人类所有主流高性能乱序执行处理器中实际整数IPC最高的处理器了。 而且主频也推到了3G之高, 超频达5G, 风冷达3.99G。

被Intel吹两下也不过分。


唉,没办法的事情。其实AMD也和Intel差不离,只是还没能力引导业界而已。前段时间AMD中国区两位人士到pcpop去座谈,俺问了近十遍Intel Conroe系列处理器发布后一年AMD将如何应对,两位仁兄愣装作没看见。就是说句:此事我们暂时不方便回答也好啊,这么做也太缺乏礼貌了。
作者: vivalinux    时间: 2006-6-22 00:38
原帖由 Edison 于 2006-6-21 23:41 发表
CINT2000/clock就是IPC的说法我是看到过有,不过对这个说法的根据我还没找到。


估计八成又是哪个攒论文的编出来支持自己观点的...
作者: vivalinux    时间: 2006-6-22 00:41
原帖由 hopetoknow2 于 2006-6-21 23:47 发表

并非就是IPC。而是可以用于衡量IPC。

不同种类处理器的指令集不同,而在CINT2000中执行的指令数也不同。 IPC数字本身并不科学。

但是执行CINT2000,不同类型处理器完成的工作是相同的,谁的相对比值低, ...


恩,对的。IPC本身就是一堆指标中的一个,只能用于衡量性能的一个侧面。不然做一个单条指令的计算机,IPC肯定暴高无比,性能......:sweatingbullets:
作者: Prescott    时间: 2006-6-22 01:11
原帖由 vivalinux 于 2006-6-22 00:27 发表


P大,你的观点我只能部分性的同意。

很想拿SPEC2000来说话,但是我目前没有见到ARM比较新款的处理器的SPEC2000测试报告,关于GFLOPS方面更没有办法给出了。所以只能拿我看到的Drystone,相信P大对这个东西 ...


拿merom比吧,2.33G,按你的数据,Drystone换算能跑到21500左右,功耗31W.
Drystone/Watt = 21500/31 = 690,ARM 2600 / 0.99 = 2600
690 vs. 2600,没有差一个数量级。:lol:

其实,Marketing的那帮人说的话,你也和他较劲就没意思了。

[ 本帖最后由 Prescott 于 2006-6-22 01:13 编辑 ]
作者: Prescott    时间: 2006-6-22 01:25
原帖由 vivalinux 于 2006-6-22 00:38 发表


估计八成又是哪个攒论文的编出来支持自己观点的...

其实大家关心的只不过是执行效率而已,不同指令集比较IPC没什么道理啊。RISC的一条指令和CISC一条指令能比吗?所以公平的做法就是Specint / Hz。

如果过滤掉主频1G以下的古董处理器,那么这个Specint / Hz 的排名结果就是这样:
http://www.aceshardware.com/SPEC ... 800&o=0&o=1

呵呵,不好意思,前面都是Intel的。:p 对了排名靠前的那两个“P4 Xeon”,其实是Yonah核心的Xeon。:sweatingbullets:

[ 本帖最后由 Prescott 于 2006-6-22 01:28 编辑 ]
作者: spaceQ    时间: 2006-6-22 01:33
误导用户的何止一个Intel?
有哪个企业不是在误导用户?
什么“CDMA无辐射”,什么“纯平的,不闪的”,“爱普泰克XXX”
Intel也是JS
全世界的JS都是一样,所谓“无商不奸”。
CPU这东西,中科院的几个海龟+台湾的一个半导体厂,就可以搞定了,技术含量远没有混沌理论+阿兰图灵的细胞自动机高
所以,不误导不行啊,被老百姓看出破绽,资本家咋赚钱啊
其实就是忽悠而已
作者: spaceQ    时间: 2006-6-22 01:35
不过据李开复讲:Google是一个比较纯洁的地方
不知道是不是这样
作者: vivalinux    时间: 2006-6-22 02:12
原帖由 spaceQ 于 2006-6-22 01:33 发表
误导用户的何止一个Intel?
有哪个企业不是在误导用户?
什么“CDMA无辐射”,什么“纯平的,不闪的”,“爱普泰克XXX”
Intel也是JS
全世界的JS都是一样,所谓“无商不奸”。
CPU这东西,中科院的几个海龟+ ...


呃,市场部的人讲话和技术部门的完全不是一个风格....

混沌理论+图灵自动机,汗,有几个人能想出这样的理论,只能是万众无一的天才...
CPU这东西和理论还是不太一样,需要的是钱+人才+技术积累+天才,不同角度,不具备可比性,呵呵。
作者: 喜之狼    时间: 2006-6-22 08:36
这就叫市场运作~能把狗屎吹上天,能悄悄的否认前任的说法就算本事
作者: hopetoknow2    时间: 2006-6-22 11:41
原帖由 vivalinux 于 2006-6-22 00:27 发表


P大,你的观点我只能部分性的同意。

很想拿SPEC2000来说话,但是我目前没有见到ARM比较新款的处理器的SPEC2000测试报告,关于GFLOPS方面更没有办法给出了。所以只能拿我看到的Drystone,相信P大对这个东西 ...

所谓强调IPC, 其实本质不就是在说效率吗?
所谓瓦特性能,更是目前非常重视特性。
这两项都是竞争对手AMD都一直承认的,和大力宣扬的。 Intel拿它们来说事
无非是在告诉大家, 我Intel老大在高主频下,同时实现了空前的实际效率(IPC ), 优异的瓦特性能,低功耗。

真的计较技术实力, 我Intel和AMD根本不是同一个级别的。
作者: 密码错误    时间: 2006-6-22 17:53
提示: 作者被禁止或删除 内容自动屏蔽
作者: Travis    时间: 2006-6-23 03:45
Intel要做的不是“误导”
而是,手里有什么,都要让消费者认可,这是Intel为他们实现的价值
3GHz主频是,IPC和Perf/Watt也是
至于误导不误导的,管它呢

昨天主频就是性能,今天性能取决于IPC,明天性能取决于SSE FP峰值,后天性能取决于核心数量,大后天性能取决于Die Size & Power Consumption……

就是这么回事
Intel P4的主频,AMD的Perf/Watt,和ATi的“管线数”乃至“ATi Done Right”,其实都是一种东西

上GZ这儿看的人,应该具备自动过滤行销口号的基本能力

[ 本帖最后由 Travis 于 2006-6-23 03:53 编辑 ]




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4