POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 10768|回复: 48
打印 上一主题 下一主题

让T神高潮的A15 Geekbench的真相

[复制链接]
跳转到指定楼层
1#
发表于 2012-11-4 16:46 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
本帖最后由 itany 于 2013-1-28 14:19 编辑

如题,samsung Nexus 10 跑出2345的成绩,于是,T神高潮了。
让我们看看背后的真相是什么~

我贴几个典型的成绩:










但是问题是T神从来不会仔细看各项的分数的。

很明显,如果看整数性能,这个是手机和平板最重要的性能,A15双核根本没有超过Atom D525.
这就是真相

再看浮点。我们可以神奇的发现Atom性能异常的低,而A15超过了Core Duo和Core 2. Core Duo的性能和Core 2又比较接近。任何人相信A15的浮点性能超过Core 2么?显然精神正常的人都不会相信的。其实稍微熟悉CPU结构的都也应该知道,Atom里边只有一个SSE单元,而Core Duo里边是两个SSE单元,但只有64位,相当于只有一半,而Core 2里边是2个浮点SSE单元。这就是根本原因。感谢23楼开普勒的反汇编。Greekmark使用了未矢量化的SSE来进行测试而已,SSE单元只能用到64位,所以,Atom只有一个执行单元,而Core和Core 2都只有两个,因而导致这个结果。如果使用了矢量化SSE2,就可以看到Core Duo和Core 2会有明显的差别,并且能把A15轰成渣。Atom虽然只有一个SSE单元,但是,快一倍是没有问题的,和A15能打平。
这是浮点的真相

然后再看内存性能。却是,Arm是集成内存控制器的,所以A15性能比Atom要强得多,这个当然不用多说。同样适用于Core Duo和Core 2. 我们甚至能看到Atom的内存分数和Core 2是相当的。单通道的情况下就看内存速度和FSB。但是别忘了,Atom明年也上集成内存控制器,内存性能只会大于Arm~ 所以Silvermont一来,A15立马就完蛋
等明年吧,呵呵

所以,我只能说,T神啊,您又抽自己了!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
49#
 楼主| 发表于 2013-1-29 13:58 | 只看该作者
Tempestglen 发表于 2013-1-29 09:31
你预测了5w,我预测了3w,然后实测结果是4w,所以你预测基本准确,我的预测就是扯蛋。

T神知道什么叫Throttle么?
明明就是双核功耗超过4W被强制降压降频了,你还在这这么欢乐~
回复 支持 反对

使用道具 举报

48#
发表于 2013-1-29 10:02 | 只看该作者
CPU的通用效能还是看标量能力比较好,矢量指令集只对个别应用(如视频)有明显的提升。就拿ATOM来说跑魔兽3比1.6G的单核K7还卡,但是软解H264比K7强N倍。
回复 支持 反对

使用道具 举报

47#
发表于 2013-1-29 09:34 | 只看该作者
本帖最后由 acqwer 于 2013-1-29 09:49 编辑
Tempestglen 发表于 2013-1-29 09:31
你预测了5w,我预测了3w,然后实测结果是4w,所以你预测基本准确,我的预测就是扯蛋。


ChromeBook的功耗和Nexus10的功耗明显不一样,后者有功耗限制。

Nexus10跑JS的功耗增幅是3.1W,ChromeBook的功耗增幅4.3W,Nexus10的屏幕还高一截,明显两者的CPU部分功耗相差很多。
回复 支持 反对

使用道具 举报

头像被屏蔽
46#
发表于 2013-1-29 09:31 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

45#
发表于 2013-1-29 09:21 | 只看该作者
SSE2的性能提升很好查啊
http://browser.primatelabs.com/geekbench2/263
P4 2.66 FP 1035
http://browser.primatelabs.com/geekbench2/310
Athlon 1.2 FP 1001
Athlon的成绩是同频P4的1倍多。

http://www.spec.org/cpu2000/resu ... 20010212-00451.html
P4 1.3G 503
http://www.spec.org/cpu2000/resu ... 20010311-00524.html
Athlon 1.33G 414
算上ICC优化效率的不同,SSE2下P4和同频Athlon相当
回复 支持 反对

使用道具 举报

44#
发表于 2013-1-29 08:57 | 只看该作者
Tempestglen 发表于 2013-1-28 14:03
单核A15@1.7Ghz就是5w吗?坟

我正式的预测是ChromeBook上的5250双核满载5W,和实际结果基本符合,T神的2.X到3.X都是扯淡。
回复 支持 反对

使用道具 举报

43#
发表于 2013-1-28 15:46 | 只看该作者
Tempestglen 发表于 2013-1-28 15:43
没有矢量化的条件下,atom浮点已经惨败给swift 和A15;如果开启矢量化,那要看neon和sse的效率了。不过既 ...

胡说八道,一个编译好的理论测试YY个头

跑个SPECfp ARM死无葬身之地
回复 支持 反对

使用道具 举报

42#
发表于 2013-1-28 15:44 | 只看该作者
Tempestglen 发表于 2013-1-28 15:38
是滴!



拿个三无OC图YY什么?
atom的同浏览器成绩呢?





回复 支持 反对

使用道具 举报

头像被屏蔽
41#
发表于 2013-1-28 15:43 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
40#
发表于 2013-1-28 15:38 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

39#
发表于 2013-1-28 15:13 | 只看该作者
Tempestglen 发表于 2013-1-28 13:59
惊喜看到很多坟,exynos5250的tdp不是8w了嘛,怎么没爆炸?性能也不是0啊。

非要炸掉地球才算爆炸是吧?就这低能生产出来做电暖器的?
回复 支持 反对

使用道具 举报

38#
发表于 2013-1-28 15:02 | 只看该作者
开普勒 发表于 2013-1-28 14:55
微架构的东西最好用小程序实测

比较标量浮点的话,个人认为A15的效率是相当高的:两条VFP流水线+乱序 ...

不过比实际性能就不能这么测了吧,至少要让带宽有压力

有64bit FP单元标量双精单精就应该一样快了吧,貌似Atom早就是这样了,ARM之前是A8时代64bit浮点还要多周期执行,A9似乎已经改了

回复 支持 反对

使用道具 举报

G70 该用户已被删除
37#
发表于 2013-1-28 15:01 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

36#
发表于 2013-1-28 14:55 | 只看该作者
the_god_of_pig 发表于 2013-1-28 14:37
多谢科普

没记错的话atom SIMD单次吞吐量是128bit,执行4个单精度,不过这是理论值,主要还是看实测NE ...

微架构的东西最好用小程序实测

比较标量浮点的话,个人认为A15的效率是相当高的:两条VFP流水线+乱序发射,相当低的latency,以及与fp32一样快的fp64。
回复 支持 反对

使用道具 举报

35#
发表于 2013-1-28 14:52 | 只看该作者
似乎跨平台测试应该提供源码用户自行编译测得才比较有价值,Geekbench这种提供不同平台版本的套路水分很大,基本是想怎么搞怎么搞
回复 支持 反对

使用道具 举报

34#
发表于 2013-1-28 14:37 | 只看该作者
开普勒 发表于 2013-1-28 14:26
A15有两条流水线可以执行NEON指令(而且跟VFP共用),对fp32来说每条可以处理两个lane。但是,一部分NEON ...

多谢科普

没记错的话atom SIMD单次吞吐量是128bit,执行4个单精度,不过这是理论值,主要还是看实测NEON和SSE的效率变化
回复 支持 反对

使用道具 举报

33#
发表于 2013-1-28 14:30 | 只看该作者
另外,不要指望NEON/SSE能对性能提高多少。编译器自动矢量化的能力相当有限,只对特定的一些模式有效。一般靠程序员显式书写SIMD代码。不过很多算法实际上无法转为用SIMD实现。
回复 支持 反对

使用道具 举报

32#
发表于 2013-1-28 14:26 | 只看该作者
the_god_of_pig 发表于 2013-1-28 14:12
这个ARM也是标量阿,x86的SIMD效率会比NEON高很多?

A15有两条流水线可以执行NEON指令(而且跟VFP共用),对fp32来说每条可以处理两个lane。但是,一部分NEON指令(例如加、乘等)可以发射到两条流水线,这部分指令的吞吐量就是4倍而latency不变。另一部分指令只能发射到其中一条流水线(例如整型转浮点),这部分指令的吞吐量就只有2倍。另外ARMv7对fp64没有NEON,只有ARMv8才支持。

ATOM的SSE性能如何没有测过,看坛里有没有x86专家能解答。
回复 支持 反对

使用道具 举报

31#
 楼主| 发表于 2013-1-28 14:24 | 只看该作者
the_god_of_pig 发表于 2013-1-28 14:12
这个ARM也是标量阿,x86的SIMD效率会比NEON高很多?

呵呵,Arm家的Neon不支持双精度浮点,所以……
http://www.arm.com/zh/products/processors/technologies/neon.php
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-10 18:54

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表