POPPUR爱换

标题: 超时空YY:预测一下Nehalem的提升幅度 [打印本页]

作者: the_god_of_pig    时间: 2007-9-21 20:59
标题: 超时空YY:预测一下Nehalem的提升幅度
Nehalem相对同频core2单线程性能提升幅度为同频k8=>k10单线程提升幅度的两倍,其中一半是IMC和缓存体系提供,另一半是FPU加倍和尚未公开的调整提供,预测完毕o:)

超线程的提升幅度变数较多,暂时保留意见B)


不知诸君意见如何:charles:
作者: Prescott    时间: 2007-9-21 21:02
过于乐观了吧。

服务器平台消除了唯一的瓶颈,提升可能很巨大。单是对于内存不是瓶颈的地方,提升可能就不是那么明显了。
作者: the_god_of_pig    时间: 2007-9-21 21:19
标题: 回复 #2 Prescott 的帖子
这个幅度应该不是太大吧,也就30%左右:unsure:

个人认为IMC+缓存的改进提升个15%应该不算过分:wacko:
作者: Prescott    时间: 2007-9-21 21:21
标题: 回复 #3 the_god_of_pig 的帖子
看什么程序了,有些提高100%都不过分,有些30%就很过分了:a)
作者: 来不及思考    时间: 2007-9-21 21:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-9-21 22:16
原帖由 the_god_of_pig 于 2007-9-21 20:59 发表
Nehalem相对同频core2单线程性能提升幅度为同频k8=>k10单线程提升幅度的两倍,其中一半是IMC和缓存体系提供,另一半是FPU加倍和尚未公开的调整提供,预测完毕o:)

超线程的提升幅度变数较多,暂时保留意见B) ...


Nehalem的FPU会加倍?!
w00t)
作者: bessel    时间: 2007-9-21 22:48
额外的超线程能达到多高的效率?

原帖由 Prescott 于 2007-9-21 21:21 发表

看什么程序了,有些提高100%都不过分,有些30%就很过分了:a)

作者: windslove    时间: 2007-9-21 22:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: maomaobear    时间: 2007-9-21 23:03
amd的k7-k8,单纯靠集成mc就提高了20%的性能,intel如果低于这个数,就不用混了。
作者: itany    时间: 2007-9-21 23:25
桌面版又不会集成MC的……
作者: HeavenPR    时间: 2007-9-22 14:32
Wide + HT 的提升应该不会小的,而且毕竟从 P4 吸取了不少经验教训 :wub:
作者: bearward    时间: 2007-9-22 15:14
相当于K7到K8的提升幅度:p
因为K7到K8最大的改变莫过于继承内存控制器和HTT总线.Nehalem相对于C2也差不多。当然内核上的改进就难说了
作者: the_god_of_pig    时间: 2007-9-22 18:30
原帖由 itany 于 2007-9-21 22:16 发表


Nehalem的FPU会加倍?!
w00t)




其实我也不知道这个和Larabee对比的通用是什么(也许就是个不存在的东西),但是按时间来看,要想反映Larabee和传统CPU的区别,拿同时期的Nehalem来满合适的:charles:


其实我也不清楚,反正是YY嘛-_-
作者: bessel    时间: 2007-9-22 21:54
现在的扣肉单周期可以做一个还是2个128bit的sse?忘掉了.

那个nehalem每个core有两个线程,单线程也就是2个 sse.
原帖由 the_god_of_pig 于 2007-9-22 18:30 发表


http://img1.qq.com/digi/pics/3675/3675903.jpg

其实我也不知道这个和Larabee对比的通用是什么(也许就是个不存在的东西),但是按时间来看,要想反映Larabee和传统CPU的区别,拿同时期的Nehalem来满合适 ...

作者: potomac    时间: 2007-9-22 22:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-9-22 22:21
原帖由 bessel 于 2007-9-22 21:54 发表
现在的扣肉单周期可以做一个还是2个128bit的sse?忘掉了.

那个nehalem每个core有两个线程,单线程也就是2个 sse.


现在的Core每个周期可以做一条128bit的SSE 浮点加法和一条乘法
但是问题是,就是含有超线程的话,现在的Core架构只有两个128bit FP单元,两个线程也不可能实现每周期4个,除非执行单元能加倍
作者: 九泉苍月    时间: 2007-9-22 23:29
原帖由 <i>来不及思考</i> 于 2007-9-21 21:55 发表 <a href="http://we.pcinlife.com/redirect.php?goto=findpost&pid=15404902&ptid=823216" target="_blank"><img src="http://we.pcinlife.com/images/common/back.gif" border="0" onload="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new windownCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new windownCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://we.pcinlife.com/images/common/back.gif');}" onmousewheel="return imgzoom(this);" alt="" /></a><br />
不是...啊 <img src="images/smilies/wacko.gif" smilieid="41" border="0" alt="" /> <br />
<br />
下一代应该是P67了吧 <img src="images/smilies/mad.gif" smilieid="38" border="0" alt="" /> 失望啊 <img src="images/smilies/mad.gif" smilieid="38" border="0" alt="" />
<br />
我也期待NetBurst还魂:huh: ,偶还有P4 1.4Socket 423+850GB+128MB RDRAM的超级组合呢:devil:
作者: Prescott    时间: 2007-9-22 23:39
原帖由 itany 于 2007-9-22 22:21 发表


现在的Core每个周期可以做一条128bit的SSE 浮点加法和一条乘法
但是问题是,就是含有超线程的话,现在的Core架构只有两个128bit FP单元,两个线程也不可能实现每周期4个,除非执行单元能加倍

那个说的是单精度吧,哈
作者: bessel    时间: 2007-9-23 02:07
双精度搞不定么,扣肉的理论峰值是那样算得吧?

原帖由 Prescott 于 2007-9-22 23:39 发表


那个说的是单精度吧,哈

作者: the_god_of_pig    时间: 2007-9-23 12:28
原帖由 Prescott 于 2007-9-22 23:39 发表

那个说的是单精度吧,哈



这图说的是单精度么?YY度瞬间骤降一半:(
作者: GZboy    时间: 2007-9-23 12:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-9-23 12:41
原帖由 GZboy 于 2007-9-23 12:39 发表
Nehalem的设计团队不正是设计P4的那一队吗?
NetBurst有机会借尸还魂


P4的那个团队不是辞职去做DSP去了么?
作者: potomac    时间: 2007-9-23 12:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-9-23 12:54
原帖由 potomac 于 2007-9-23 12:45 发表
NetBurst团队是intel自身最有创造力的团队。:wub:


最有创造力的应该是安腾那边吧……
作者: bill_max    时间: 2007-9-23 13:31
慢慢YY~~~~
作者: AMD11    时间: 2007-9-23 14:34
因为没有足够的资料,因此我也YY一下:loveliness: :同频综合性能,提高幅度大约在15%~20%之间,如果加入某些技术,也许会到30%左右,这算是“大跃进”了。
作者: 紫色    时间: 2007-9-27 20:58
NetBurst团队不就是什么“intel俄勒冈开发组”嘛,据说nehalem主要就是靠他们。以色列开发组负责维护core2
作者: itany    时间: 2007-9-27 21:02
原帖由 AMD11 于 2007-9-23 14:34 发表
因为没有足够的资料,因此我也YY一下:loveliness: :同频综合性能,提高幅度大约在15%~20%之间,如果加入某些技术,也许会到30%左右,这算是“大跃进”了。


光SMT就不只20%了……
Penryn随便改改有些游戏的性能提升就超过了20%
作者: AMD11    时间: 2007-9-27 21:10
原帖由 itany 于 2007-9-27 21:02 发表


光SMT就不只20%了……
Penryn随便改改有些游戏的性能提升就超过了20%

:funk: 我没有足够的资料,只是按照我的知识推测。并且我主要推测“综合性能”,单项真的不敢推测。望谅。

幸好是YY。:loveliness:
作者: 紫色    时间: 2007-9-27 21:13
不一定吧,当年netburst引入smt有很大性能提升是因为它的一些执行单元空闲时间多,core系列这方面已经改善了,smt对性能的提升不可能那么多了。smt有的时候甚至会减慢速度帮倒忙呢
作者: itany    时间: 2007-9-27 21:16
原帖由 紫色 于 2007-9-27 21:13 发表
不一定吧,当年netburst引入smt有很大性能提升是因为它的一些执行单元空闲时间多,core系列这方面已经改善了,smt对性能的提升不可能那么多了。smt有的时候甚至会减慢速度帮倒忙呢


难道现在的Conroe里边就没有一大堆执行单元闲着?
(_(
作者: Prescott    时间: 2007-9-27 21:26
原帖由 紫色 于 2007-9-27 21:13 发表
不一定吧,当年netburst引入smt有很大性能提升是因为它的一些执行单元空闲时间多,core系列这方面已经改善了,smt对性能的提升不可能那么多了。smt有的时候甚至会减慢速度帮倒忙呢

Core的CPI如果能到0.25才是理想值,实际呢,不是2.5就谢天谢地了。:wacko:
作者: 紫色    时间: 2007-9-27 21:27
本人比较实际,向来无视那些数几发射、谈simd是几巴掌,谈还不存在的parrot,我认为那些不能当饭吃。建议楼主这样的“超时空YY“火星人应该回到自己的星球继续白日梦。
本论坛太多人活在白日梦里了,有些利用率很低的东西被过分宣扬,并在此基础上造神。这里再鄙视一下“sse救命论“,我真衰,怎么总是用不上sse,体验不了simd的“威力“。我只想说:sse那些电路白白耗掉本人电费,谁能帮我把那些电路抠掉?:a)

[ 本帖最后由 紫色 于 2007-9-27 22:00 编辑 ]
作者: acqwer    时间: 2007-9-27 21:30
原帖由 紫色 于 2007-9-27 21:27 发表
怎么总是用不上sse,体验不了simd的“威力“。我只想说:sse那些电路白白耗掉本人电费,谁能帮我把那些电路抠掉?

不久前你不是还在yy八发射和SSE5吗,这么快就改口了?
作者: itany    时间: 2007-9-27 22:27
原帖由 紫色 于 2007-9-27 21:27 发表
本人比较实际,向来无视那些数几发射、谈simd是几巴掌,谈还不存在的parrot,我认为那些不能当饭吃。建议楼主这样的“超时空YY“火星人应该回到自己的星球继续白日梦。
本论坛太多人活在白日梦里了,有些利用率很低的东西被过分宣扬,并在此基础上造神。这里再鄙视一下“sse救命论“,我真衰,怎么总是用不上sse,体验不了simd的“威力“。我只想说:sse那些电路白白耗掉本人电费,谁能帮我把那些电路抠掉 ...


这个说的很好……
很中肯




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4