POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 2013|回复: 7
打印 上一主题 下一主题

AMD phenom 2 CPU(实际测试+理论推导)

[复制链接]
跳转到指定楼层
1#
发表于 2011-12-26 22:33 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
测试数据时CPU超频到3.8Ghz时候的数据,此时外频304,倍频12.5,cpu-NB频率3000Mhz,HT2000Mhz左右。内存1620Mhz,跑9-9-9-24-33-1T

测试CPU:640开核

国际象棋测试得分如下:

单核,得分2381


双核,得分4770(理论4762)

三核,得分7088(理论7143)

四核,得分9344(理论9524)

五核,得分11555(理论11905)


六核,得分13399(理论14268)

当然,以上,单核独享6MB三缓,双核是共享6MB三缓,相当于每核心3MB,以此类推。(如有不正确的地方,望指出,烦劳解释原因!多谢)

结论:

双核心,性能相对单核增幅100.3359932801344%(性能为单核的200.3359932801344%)

三核心,性能相对单核增幅197.6900461990760%(性能为单核的297.6900461990760%)

四核心,性能相对单核增幅292.4401511969761%(性能为单核的392.4401511969761%)

五核心,性能相对单核增幅385.3002939941201%(性能为单核的485.3002939941201%)

六核心,性能相对单核增幅462.7467450640987%(性能为单核的562.7467450640987%)

以上是实际测试的数据,下面开始理论分析阶段:

AMD羿龙x6的核心面积是346平方毫米,9.04亿晶体管。

根据测试,当双核共享6MB三缓时,效率最好,参考羿龙2 x2 550默认频率跑3800+。

经过查证,三核共享6MB三级缓存时,效率开始下降,参考羿龙 x3 720 默认跑5260+

实际测试,四核共享6MB三缓时,效率比三核共享更低,9344,我跑的测试,以及x4 955超3.8时的成绩,在9300左右。

查资料得到,四核心的羿龙x4的晶体管数量约为7.61亿,即,两个核心约1.43亿,每个核心约0.72亿晶体管。

四核心的速龙x4的晶体管数量约为2.86亿,6MB三级缓存的晶体管约为4.75亿。

如此,经过以上实际测试以及查证,得到一个规律:

双核共享6MB效率最高,三核共享6MB效率次之,一次类推。

因此,当核心数是2的N倍时,缓存若为6的N倍,理论性能用双核性能乘以N;此时的实际性能应该差不多。

当核心数是3的N倍时,缓存数为6的N-1倍时,理论性能用三核性能乘以N;实际性能同上。

由以上经历、结论,得出以下结论(频率3.8Ghz):

1、八核,24MB三级缓存,24.72亿晶体管,理论性能19048。

2、八核,12MB三级缓存,15.22亿晶体管,理论性能18688。

3、八核,8MB三级缓存,12.845亿晶体管,理论性能18240。

以上方案,采用45nm工艺完全不可行,直接考虑32nm方案。

经过查询,发现推土机晶体管为20亿(一说约12亿),核心面积315,SNB,晶体管约9.95亿,核心面积216。

x4 900,晶体管约7.61亿,核心面积258,x6 1000,晶体管约9.04亿,核心面积346。x4 600,晶体管2.86亿,核心面积150左右

由此推测,逻辑核心,45nm工艺下,两个核心的面积是:88。6MB三级缓存面积约110。

进入32nm,没有具体的比例,只能通过堆晶体管数量,缓存之后,对比。

8MB缓存,45nm工艺,面积110/6*8=146.6666......晶体管数量,4.75/6*8=6.33333....亿

推算出,8推土机核心,晶体管数量13.66666(或者5.666666亿)亿。每模块:3.416.....亿(或1.4166......亿)。

PS:个人觉得每模块1.41亿比较合理,故,以下用12亿晶体管左参考。

8个phenom 2架构核心,1.43*4=5.72亿,加上8MB三缓,约为12.05333....亿晶体管,因此,我推测,核心面积330左右。

此面积小于现有的phenom 2 x6 1000T系列。

1号方案,24MB三缓,芯片面积剧增,性能提升不明显,应证了曾经的话:缓存翻倍,性能不能够翻倍,但是成本会翻倍。

2号方案,12MB三缓,芯片面积大幅增加,理论小于400,但是也是成本过高。

3号方案无疑比较适合,在性能,芯片面积,成本上,相对前两个比较均衡。

猜测:

AMD的推土机的确只有12亿晶体管,核心面积315平方毫米。3号方案的八核,在3.0G时,理论性能比I7 2600K默认高出大约10%。同频率时,理论性能比I7 2600K高出25%。

phenom、phenom 2、bulldozer这三个架构,几乎属于同一年,AMD打算将K8改进,K10,phenom出现,phenom表现不好,改进的K10.5、phenom 2 出现,同时bulldozer出现

但是由于种种原因,  bulldozer推迟到11年上市,貌似实际上,  bulldozer 和phenom 2 是同时期的产物,性能理应相近。
2#
发表于 2011-12-26 22:38 | 只看该作者
本帖最后由 amx004 于 2011-12-26 22:39 编辑

楼主你的测试是跑多次取平均值还是只跑了一次??
国际象棋的成绩会上下浮动的
如果你只跑了一次, 上面的很多结论误差也会N倍地放大
回复 支持 反对

使用道具 举报

3#
发表于 2011-12-27 14:02 | 只看该作者
很好的结论,推土机根本是个06年的东西,只不过当时没有工艺能做出来
回复 支持 反对

使用道具 举报

4#
发表于 2011-12-27 22:31 | 只看该作者
原创的无论如何要支持
回复 支持 反对

使用道具 举报

5#
发表于 2011-12-28 10:31 | 只看该作者
很好很专业
回复 支持 反对

使用道具 举报

6#
发表于 2011-12-28 10:41 | 只看该作者
本帖最后由 jackyangel 于 2011-12-28 10:41 编辑

“在3.0G时,理论性能比I7 2600K默认高出大约10%。同频率时,理论性能比I7 2600K高出25%”的民用cpu,你倒是出来啊
回复 支持 反对

使用道具 举报

7#
发表于 2011-12-28 10:42 | 只看该作者
在隔壁也看到了这个帖子。转帖机为何不注明是转帖?或者转帖机就是隔壁的9550pro?
回复 支持 反对

使用道具 举报

8#
发表于 2011-12-28 10:43 | 只看该作者
本帖最后由 acqwer 于 2011-12-28 10:46 编辑

LZ用口水把8个废龙粘起来吗?

用干爹的方案粘,要加上至少和L3容量相当的L4;用Intel的ringbus,会导致L3性能下降;用Crossbar,只怕互联耗电比CPU核心还高。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-24 00:12

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表