让T神高潮的A15 Geekbench的真相

itany · 发表于 2012-11-4 16:46

本帖最后由 itany 于 2013-1-28 14:19 编辑

如题，samsung Nexus 10 跑出2345的成绩，于是，T神高潮了。
让我们看看背后的真相是什么~

我贴几个典型的成绩：

但是问题是T神从来不会仔细看各项的分数的。

很明显，如果看整数性能，这个是手机和平板最重要的性能，A15双核根本没有超过Atom D525.
这就是真相

再看浮点。我们可以神奇的发现Atom性能异常的低，而A15超过了Core Duo和Core 2. Core Duo的性能和Core 2又比较接近。任何人相信A15的浮点性能超过Core 2么？显然精神正常的人都不会相信的。其实稍微熟悉CPU结构的都也应该知道，Atom里边只有一个SSE单元，而Core Duo里边是两个SSE单元，但只有64位，相当于只有一半，而Core 2里边是2个浮点SSE单元。这就是根本原因。感谢23楼开普勒的反汇编。Greekmark使用了未矢量化的SSE来进行测试而已，SSE单元只能用到64位，所以，Atom只有一个执行单元，而Core和Core 2都只有两个，因而导致这个结果。如果使用了矢量化SSE2，就可以看到Core Duo和Core 2会有明显的差别，并且能把A15轰成渣。Atom虽然只有一个SSE单元，但是，快一倍是没有问题的，和A15能打平。
这是浮点的真相

然后再看内存性能。却是，Arm是集成内存控制器的，所以A15性能比Atom要强得多，这个当然不用多说。同样适用于Core Duo和Core 2. 我们甚至能看到Atom的内存分数和Core 2是相当的。单通道的情况下就看内存速度和FSB。但是别忘了，Atom明年也上集成内存控制器，内存性能只会大于Arm~ 所以Silvermont一来，A15立马就完蛋
等明年吧，呵呵

所以，我只能说，T神啊，您又抽自己了！

itany · 发表于 2013-1-29 13:58

Tempestglen 发表于 2013-1-29 09:31
你预测了5w，我预测了3w，然后实测结果是4w，所以你预测基本准确，我的预测就是扯蛋。

T神知道什么叫Throttle么？
明明就是双核功耗超过4W被强制降压降频了，你还在这这么欢乐~

divx001 · 发表于 2013-1-29 10:02

CPU的通用效能还是看标量能力比较好，矢量指令集只对个别应用（如视频）有明显的提升。就拿ATOM来说跑魔兽3比1.6G的单核K7还卡，但是软解H264比K7强N倍。

acqwer · 发表于 2013-1-29 09:34

本帖最后由 acqwer 于 2013-1-29 09:49 编辑

Tempestglen 发表于 2013-1-29 09:31
你预测了5w，我预测了3w，然后实测结果是4w，所以你预测基本准确，我的预测就是扯蛋。

ChromeBook的功耗和Nexus10的功耗明显不一样，后者有功耗限制。

Nexus10跑JS的功耗增幅是3.1W，ChromeBook的功耗增幅4.3W，Nexus10的屏幕还高一截，明显两者的CPU部分功耗相差很多。

Tempestglen · 发表于 2013-1-29 09:31

提示: 作者被禁止或删除内容自动屏蔽

acqwer · 发表于 2013-1-29 09:21

SSE2的性能提升很好查啊
http://browser.primatelabs.com/geekbench2/263
P4 2.66 FP 1035
http://browser.primatelabs.com/geekbench2/310
Athlon 1.2 FP 1001
Athlon的成绩是同频P4的1倍多。

http://www.spec.org/cpu2000/resu ... 20010212-00451.html
P4 1.3G 503
http://www.spec.org/cpu2000/resu ... 20010311-00524.html
Athlon 1.33G 414
算上ICC优化效率的不同，SSE2下P4和同频Athlon相当

acqwer · 发表于 2013-1-29 08:57

Tempestglen 发表于 2013-1-28 14:03
单核A15@1.7Ghz就是5w吗？坟

我正式的预测是ChromeBook上的5250双核满载5W，和实际结果基本符合，T神的2.X到3.X都是扯淡。

the_god_of_pig · 发表于 2013-1-28 15:46

Tempestglen 发表于 2013-1-28 15:43
没有矢量化的条件下，atom浮点已经惨败给swift 和A15；如果开启矢量化，那要看neon和sse的效率了。不过既 ...

胡说八道，一个编译好的理论测试YY个头

跑个SPECfp ARM死无葬身之地

the_god_of_pig · 发表于 2013-1-28 15:44

Tempestglen 发表于 2013-1-28 15:38
是滴！

拿个三无OC图YY什么？
atom的同浏览器成绩呢？

Tempestglen · 发表于 2013-1-28 15:43

提示: 作者被禁止或删除内容自动屏蔽

Tempestglen · 发表于 2013-1-28 15:38

提示: 作者被禁止或删除内容自动屏蔽

kinno · 发表于 2013-1-28 15:13

Tempestglen 发表于 2013-1-28 13:59
惊喜看到很多坟，exynos5250的tdp不是8w了嘛，怎么没爆炸？性能也不是0啊。

非要炸掉地球才算爆炸是吧？就这低能生产出来做电暖器的？

the_god_of_pig · 发表于 2013-1-28 15:02

开普勒发表于 2013-1-28 14:55
微架构的东西最好用小程序实测

比较标量浮点的话，个人认为A15的效率是相当高的：两条VFP流水线＋乱序 ...

不过比实际性能就不能这么测了吧，至少要让带宽有压力

有64bit FP单元标量双精单精就应该一样快了吧，貌似Atom早就是这样了，ARM之前是A8时代64bit浮点还要多周期执行，A9似乎已经改了

只看该作者 · 发表于 2013-1-28 15:01

提示: 作者被禁止或删除内容自动屏蔽

开普勒 · 发表于 2013-1-28 14:55

the_god_of_pig 发表于 2013-1-28 14:37
多谢科普

没记错的话atom SIMD单次吞吐量是128bit，执行4个单精度，不过这是理论值，主要还是看实测NE ...

微架构的东西最好用小程序实测

比较标量浮点的话，个人认为A15的效率是相当高的：两条VFP流水线＋乱序发射，相当低的latency，以及与fp32一样快的fp64。

the_god_of_pig · 发表于 2013-1-28 14:52

似乎跨平台测试应该提供源码用户自行编译测得才比较有价值，Geekbench这种提供不同平台版本的套路水分很大，基本是想怎么搞怎么搞

the_god_of_pig · 发表于 2013-1-28 14:37

开普勒发表于 2013-1-28 14:26
A15有两条流水线可以执行NEON指令（而且跟VFP共用），对fp32来说每条可以处理两个lane。但是，一部分NEON ...

多谢科普

没记错的话atom SIMD单次吞吐量是128bit，执行4个单精度，不过这是理论值，主要还是看实测NEON和SSE的效率变化

开普勒 · 发表于 2013-1-28 14:30

另外，不要指望NEON/SSE能对性能提高多少。编译器自动矢量化的能力相当有限，只对特定的一些模式有效。一般靠程序员显式书写SIMD代码。不过很多算法实际上无法转为用SIMD实现。

开普勒 · 发表于 2013-1-28 14:26

the_god_of_pig 发表于 2013-1-28 14:12
这个ARM也是标量阿，x86的SIMD效率会比NEON高很多？

A15有两条流水线可以执行NEON指令（而且跟VFP共用），对fp32来说每条可以处理两个lane。但是，一部分NEON指令（例如加、乘等）可以发射到两条流水线，这部分指令的吞吐量就是4倍而latency不变。另一部分指令只能发射到其中一条流水线（例如整型转浮点），这部分指令的吞吐量就只有2倍。另外ARMv7对fp64没有NEON，只有ARMv8才支持。

ATOM的SSE性能如何没有测过，看坛里有没有x86专家能解答。

itany · 发表于 2013-1-28 14:24

the_god_of_pig 发表于 2013-1-28 14:12
这个ARM也是标量阿，x86的SIMD效率会比NEON高很多？

呵呵，Arm家的Neon不支持双精度浮点，所以……
http://www.arm.com/zh/products/processors/technologies/neon.php

帐号		自动登录	找回密码
密码			注册

Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽	46^# 发表于 2013-1-29 09:31 来自手机 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽	41^# 发表于 2013-1-28 15:43 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽	40^# 发表于 2013-1-28 15:38 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

G70 该用户已被删除	37^# 发表于 2013-1-28 15:01 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
G70 该用户已被删除
	回复支持反对使用道具举报显身卡

让T神高潮的A15 Geekbench的真相

本帖子中包含更多资源

浏览过的版块