POPPUR爱换

标题: 由已发布"山猫"核心的E-350推断推土机大致的性能 [打印本页]

作者: foxroz2003    时间: 2011-6-3 09:44
标题: 由已发布"山猫"核心的E-350推断推土机大致的性能
本帖最后由 foxroz2003 于 2011-6-3 10:07 编辑

    由AMD发布的推土机核心和山猫核心的架构图,可以看出一个山猫核心相当于半个推土机模块,也就是说1.6GHz的E-350的整数性能相当于1.6GHz的一个推土机模块的性能。整数性能:假定多线程效率为100%,频率与性能呈线性增长(Fritz象棋测试软件),那么一个8线程3.2GHz的推土机相当于8个E-350的性能,通过网络上对E-350测试可知,E-350在fritz中的成绩为1600左右,乘以8大约为12800,也就是说3.2GHz推土机8多线程下整数性能(Fritz)为12800左右。
    浮点性能:同样假定多线程效率为100%,频率与性能呈线性增长(Cinebeach R10,R11.5),一个8线程3.2GHz的推土机相当于10个E-350的性能(因为E-350的浮点单元为两个64bitFADD和FMUL,而推土机为两个128bitFMAC,同样位宽下一个FMAC在充分优化下能有两个FADD或FMUL的性能,但cinebeach有否对FMAC优化就不得而知,但一定有提升,所以假定提升为25%),以cinebeachR10为例,E-350多线程下大约是2300左右,乘以10等于23000,也就是说3.2GHz推土机8线程下浮点性能(CinebeachR10)为23000.以上成绩与SNB的对比可以自己补上,但我估计8线程的推土机,的确有能力叫板8线程的I7。
    还有为什么我不说8核推土机而是说8线程推土机,原因是通过推土机与K10的架构图可以看出,一个推土机模块和一个K10核心相类似,都是只有一个fetch和一个decode,而推土机只是相对于K10增加多一个指令保留站和一组运算单元,也就是AMD一直奉行的分离保留站的设计,与之对比intel采用的是统一保留站设计(即浮点和整数共享一个保留站),而AMD采用一个浮点或整数对应一个保留站。但本质上来说,一个fetch一个decode就是一个核心,只是推土机的模块形式更好地执行两个线程,这就是AMD的SMT技术了。所以推土机所谓的四模块8核心,实际是4核心8线程而已。
   


作者: gtx5    时间: 2011-6-3 09:46
山猫是K10的阉割版
和推土机没有可比性

作者: GTX980    时间: 2011-6-3 09:58
“1.6GHz的E-350的整数性能相当于1.6GHz的一个推土机模块的性能”

亮点
作者: inSeek    时间: 2011-6-3 11:00
“实际是4核心8线程而已”
但是这多的一个线程相对于HT让一个core多了多少晶体管...
作者: foxroz2003    时间: 2011-6-3 11:08
回复 inSeek 的帖子

根据AMD所说,intel的HT增加5%晶体管增加20%左右的性能,而推土机大约增加35%左右晶体管(也就是增加多一组运算单元)增加80%的性能。
作者: 043265    时间: 2011-6-3 11:12
按照XX的说法  是毫无意义的

实物出来测试是王道
作者: inSeek    时间: 2011-6-3 11:13
回复 foxroz2003 的帖子

所以如果单纯从单core性价比来说intel的更实在。5% -> 20% 4x,35%->80% 2.29x

作者: 楼上的老狼    时间: 2011-6-3 11:14
干货摆出来才是王道
等吧
作者: ifu    时间: 2011-6-3 11:18
第二代高性能APU K10核心会换为推土机内核,按照楼主这理论性能还缩水了。AMD有这么脑C?
作者: beer966    时间: 2011-6-3 11:22
有的芯片是本本专用的。。。
作者: csqaclp    时间: 2011-6-3 11:50
inSeek 发表于 2011-6-3 11:00
“实际是4核心8线程而已”
但是这多的一个线程相对于HT让一个core多了多少晶体管...

说不准8核推土机晶体管数比I7 2600K还少。
作者: tcgg1983    时间: 2011-6-3 12:10
强烈要求本论坛砖家 预言帝 去AMD公司做市场营销  反正不用出东西 光YY就行了
作者: acqwer    时间: 2011-6-3 12:30
csqaclp 发表于 2011-6-3 11:50
说不准8核推土机晶体管数比I7 2600K还少。

早就公布了,不带L3的一个模块2.13亿,不算8M的L3就比2600K晶体管多了。
作者: rezgbo    时间: 2011-6-3 12:32
看看语言帝...
作者: Heitai    时间: 2011-6-3 12:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: disruptor    时间: 2011-6-3 13:38
所以这次推土机的单线程能力的确非常令人期待,单线程性能应该会很强
作者: disruptor    时间: 2011-6-3 13:40
snb的集显部分也占用了不少晶体管
作者: AlcatrazX    时间: 2011-6-3 13:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: hl1979    时间: 2011-6-3 14:03
这样的比较是没有意义的,一切都是基于假设。而且就算是真如楼主所说的8倍性能差,实际也不可能有达到准确的8倍值的。总的来说,属于yy灌水性质。
作者: 785g    时间: 2011-6-3 14:16
提示: 作者被禁止或删除 内容自动屏蔽
作者: junychen    时间: 2011-6-3 20:35
可以这样比??推土机是AMD花了10年开发的 如果只是如你所说 等于用K10.5小改那推土机早发布了。再有推土机是CMT多线程技术。Intel 和 IBM才使用SMT技术。
作者: 泥巴    时间: 2011-6-4 08:57
还是等实物出来再说~
作者: wqaiwy    时间: 2011-6-4 09:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: CC9K    时间: 2011-6-4 10:08
785g 发表于 2011-6-3 14:16
架构完全不同,相当你个头。

毕竟山猫也不是绝对全新的架构,也是基于现有架构修改而来的,但是是源自K10还是推土机不好说
作者: zergzx    时间: 2011-6-4 18:08
LZ的这份推测贴算是看过的最靠谱、最可信的了,其他的那些推断通通都没有依据,而LZ的论据个人认为还是相当站得住脚的
作者: foxroz2003    时间: 2011-6-4 20:51
回复 zergzx 的帖子

欢迎大家到时挖坟,哈哈。反正这是推测,60-90日后就可以见分晓。我只是认为一个推土机模块整数性能顶多就相当于K10的125%-135%之间。

作者: pkelei    时间: 2011-6-7 16:44
foxroz2003 发表于 2011-6-4 20:51
回复 zergzx 的帖子

欢迎大家到时挖坟,哈哈。反正这是推测,60-90日后就可以见分晓。我只是认为一个推土机 ...

偶认可LS的推测。呵呵

4模块8核心估计是LZ推测的加2个根号?

作者: itany    时间: 2011-10-20 22:33
gtx5 发表于 2011-6-3 09:46
山猫是K10的阉割版
和推土机没有可比性

呵呵…… 挖一下
作者: itany    时间: 2011-10-20 22:34
CC9K 发表于 2011-6-4 10:08
毕竟山猫也不是绝对全新的架构,也是基于现有架构修改而来的,但是是源自K10还是推土机不好说

山猫应该是和推土机一起搞的……
作者: panjanstoneborg    时间: 2011-10-21 14:55
大量喷子都被鉴定出来了,呵呵
作者: efficient3d    时间: 2011-10-21 15:05
推土机的缓存占用太多晶体管了,真正搞计算的内核没多少。16MB的缓存啊,以前都不敢想。
作者: foxroz2003    时间: 2011-10-21 17:18
本帖最后由 foxroz2003 于 2011-10-21 17:18 编辑

我的文章竟然被挖了




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4