POPPUR爱换

标题: 让T神高潮的A15 Geekbench的真相 [打印本页]

作者: itany    时间: 2012-11-4 16:46
标题: 让T神高潮的A15 Geekbench的真相
本帖最后由 itany 于 2013-1-28 14:19 编辑

如题,samsung Nexus 10 跑出2345的成绩,于是,T神高潮了。
让我们看看背后的真相是什么~

我贴几个典型的成绩:
[attach]2077400[/attach]

[attach]2077401[/attach]

[attach]2077402[/attach]

[attach]2077403[/attach]

[attach]2077410[/attach]

但是问题是T神从来不会仔细看各项的分数的。

很明显,如果看整数性能,这个是手机和平板最重要的性能,A15双核根本没有超过Atom D525.
这就是真相

再看浮点。我们可以神奇的发现Atom性能异常的低,而A15超过了Core Duo和Core 2. Core Duo的性能和Core 2又比较接近。任何人相信A15的浮点性能超过Core 2么?显然精神正常的人都不会相信的。其实稍微熟悉CPU结构的都也应该知道,Atom里边只有一个SSE单元,而Core Duo里边是两个SSE单元,但只有64位,相当于只有一半,而Core 2里边是2个浮点SSE单元。这就是根本原因。感谢23楼开普勒的反汇编。Greekmark使用了未矢量化的SSE来进行测试而已,SSE单元只能用到64位,所以,Atom只有一个执行单元,而Core和Core 2都只有两个,因而导致这个结果。如果使用了矢量化SSE2,就可以看到Core Duo和Core 2会有明显的差别,并且能把A15轰成渣。Atom虽然只有一个SSE单元,但是,快一倍是没有问题的,和A15能打平。
这是浮点的真相

然后再看内存性能。却是,Arm是集成内存控制器的,所以A15性能比Atom要强得多,这个当然不用多说。同样适用于Core Duo和Core 2. 我们甚至能看到Atom的内存分数和Core 2是相当的。单通道的情况下就看内存速度和FSB。但是别忘了,Atom明年也上集成内存控制器,内存性能只会大于Arm~ 所以Silvermont一来,A15立马就完蛋
等明年吧,呵呵

所以,我只能说,T神啊,您又抽自己了!

作者: itany    时间: 2012-11-4 16:54
坐等T神如何回应~~
作者: the_god_of_pig    时间: 2012-11-4 16:59
因为和实际表现偏差大,这个测试早就无视了已经

不过看atom的成绩里面有个别浮点项目是用向量跑的,不知道是什么原理
作者: raini    时间: 2012-11-4 17:21
itany 发表于 2012-11-4 16:54
坐等T神如何回应~~

太复杂了,这不是要2货SB神转个10个8个弯的才能明白吗

作者: Tempestglen    时间: 2012-11-4 17:28
提示: 作者被禁止或删除 内容自动屏蔽
作者: Heitai    时间: 2012-11-4 17:33
提示: 作者被禁止或删除 内容自动屏蔽
作者: kinno    时间: 2012-11-4 17:38
x87。火星多少年的东西了
作者: the_god_of_pig    时间: 2012-11-4 17:40
Tempestglen 发表于 2012-11-4 17:28
如果跑分程序完美支持超线程,那么1.8GHz A15 2C2T=1.8Ghz Atom 2C4T

问题是支持超线程的跑分程序也是 ...

"atom的性能要被A15虐杀,今天的局面,只不过是应验预言而已"


笑死人了,browsermark/sunspider被atom秒杀,另两个js高一些,考虑ht没被充分利用也就是平手;其他几个跑分勉强和特瓜3相当,真是应验阿


"实际软件支持超线程的大概在5%的样子"

语文老师没告诉你"梦中"和"实际"是两个完全不同的词么?

作者: westlee    时间: 2012-11-4 18:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2012-11-4 18:13
提示: 作者被禁止或删除 内容自动屏蔽
作者: kinno    时间: 2012-11-4 19:33
就arm也敢和intel谈功耗?arm芯片做到10Wtdp那就要爆炸了,性能为0
作者: acqwer    时间: 2012-11-5 09:08
本帖最后由 acqwer 于 2012-11-5 09:15 编辑
Tempestglen 发表于 2012-11-4 17:28
如果跑分程序完美支持超线程,那么1.8GHz A15 2C2T=1.8Ghz Atom 2C4T

问题是支持超线程的跑分程序也是 ...


手机版的A15还在火星,单核1.7G就能上到5W的功耗,按T神的频率-功耗算法,对于2W功耗下跑到2G频率的ATOM,5W时可以跑上3G了,不用什么下一代轻松就秒杀A15。

另外,现在测续航都是上网放片,游戏功耗压根就没测试,这个平台功耗和GPU有一毛钱关系没有?T神就别把ARM高功耗的帽子往GPU头上扣了。

作者: frankincense    时间: 2012-11-5 09:33
acqwer 发表于 2012-11-5 09:08
手机版的A15还在火星,单核1.7G就能上到5W的功耗,按T神的频率-功耗算法,对于2W功耗下跑到2G频率的ATO ...

Mali也是ARM自己的,T神自然不敢多批评,所以你可以看到T神都只是在批PowerVR拉ARM的后腿

作者: 54230859    时间: 2012-11-5 10:03
t神难得创造的东西 大家放过他吧 现在精神病住院都实行自愿了 他估计进不去
作者: 54230859    时间: 2012-11-5 10:03
t神难得创造的东西 大家放过他吧 现在精神病住院都实行自愿了 他估计进不去
作者: itany    时间: 2012-11-5 10:27
Tempestglen 发表于 2012-11-4 17:28
如果跑分程序完美支持超线程,那么1.8GHz A15 2C2T=1.8Ghz Atom 2C4T

问题是支持超线程的跑分程序也是 ...

Geekbench是您老提出来的,现在说测试不符合实际,这不是自己抽自己么?
然后下边就转进了~

首先,没有理由认为乱序就比顺序功耗高。显然CPU不只是执行单元,使用乱序执行是需呀增加发射调度等组件,但是能尽快跑完任务,意味着整个CPU能进入idle状态,反而能节省电量。从另一个角度来看,顺序CPU的流水线经常阻塞,这个时候CPU就在白白的发热,显然是性能功耗比很差的。

其次,现在Atom的主要问题是设计不良,冗余太严重。CPU核心本身主要是FUB自动设计的,而不是手工设计的,本来就比较差;而内部还是通过FSB连接北桥的方式。这样的方式,要节能没有节能,要性能没有性能。

再次,Intel现在是使用相对(自家)落后的32nm工艺,而明年就是22nm,之后会优先开发低功耗的16nm工艺。而Arm这边会从工艺领先或者持平迅速进入到全面落后。

因而,对于Atom来说,在现在到处是缺点的情况下,整数性能完全不输A15,只能表明一点,那就是Atom到处都可以改进,未来的前途无比的光明;而Arm,已经进入到死路,改进余地很少,将不可避免的陷入性能发展停滞。A15之后,Arm还可以搞64位,然后呢?不管Arm也好,T神也好,现在就是在回光返照式的绝唱而已

作者: Tempestglen    时间: 2012-11-5 11:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: the_god_of_pig    时间: 2012-11-5 11:36
Tempestglen 发表于 2012-11-5 11:11
geekbench支持超线程,我拿出来比较,就已经算是开恩了,实际软件pk,A15优势更大。

你的余下的全是废话 ...

T神最后的希望就是全体软件倒退回单线程时代,这样才能使a15免于被特瓜3歼灭的命运

Silvermont和Haswell本来就是要实现性能定位的无缝衔接,当然了,各种意义上这和ARM都没什么关系了

作者: itany    时间: 2012-11-5 13:59
本帖最后由 itany 于 2012-11-5 14:00 编辑
Tempestglen 发表于 2012-11-5 11:11
geekbench支持超线程,我拿出来比较,就已经算是开恩了,实际软件pk,A15优势更大。

你的余下的全是废话 ...

秒A15只需要1G的Haswell性能,而Haswell是3-4G

实际上如果应用都是单线程的,那你家Arm搞四核心岂不是极为蛋疼?
一方面是要说多线程应用不存在,一方面又要堆多核心,能不能这么无耻

作者: raini    时间: 2012-11-5 21:25
itany 发表于 2012-11-5 13:59
秒A15只需要1G的Haswell性能,而Haswell是3-4G [titter>

实际上如果应用都是单线程的,那你家Arm搞四核 ...

现在2货SB神的两个救命稻草,1是支持超线程的应用程序很少;2是系统优化不够。哈哈,两个都只能说明2货SB神果然SB,既不懂硬件,更不懂软件。

作者: maomaobear    时间: 2012-11-5 22:14
标题: RE: 让T神高潮的A15 Geekbench的真相
Tempestglen 发表于 2012-11-5 11:11
geekbench支持超线程,我拿出来比较,就已经算是开恩了,实际软件pk,A15优势更大。

你的余下的全是废话 ...

它不兼容完全的x86指令,不会兼容windows,做再强也伤不到i5,i7
作者: itany    时间: 2013-1-28 12:12
鉴于T神又出来胡扯,我顶一下以正视听
作者: 开普勒    时间: 2013-1-28 13:56
居然没有人反汇编来吐槽一下?

用objdump反汇编libgeekbench-jni.so,以Mandelbrot测试项目为例:

1. x86:

  1. 000ccb2a <_ZN10Mandelbrot6workerEi>:
  2.    ccb2a:       55                      push   %ebp
  3.    ccb2b:       89 e5                   mov    %esp,%ebp
  4.    ccb2d:       57                      push   %edi
  5.    ccb2e:       56                      push   %esi
  6.    ccb2f:       53                      push   %ebx
  7.    ccb30:       83 ec 3c                sub    $0x3c,%esp
  8.    ccb33:       8b 75 08                mov    0x8(%ebp),%esi
  9.    ccb36:       e8 86 91 f6 ff          call   35cc1 <pthread_join@plt+0x109>
  10.    ccb3b:       81 c3 01 34 17 00       add    $0x173401,%ebx
  11.    ccb41:       c7 45 e0 00 00 00 00    movl   $0x0,-0x20(%ebp)
  12.    ccb48:       c7 45 e4 00 00 00 00    movl   $0x0,-0x1c(%ebp)
  13.    ccb4f:       8b 46 38                mov    0x38(%esi),%eax
  14.    ccb52:       8b 4e 3c                mov    0x3c(%esi),%ecx
  15.    ccb55:       f2 0f 10 bb 4c af f8    movsd  -0x750b4(%ebx),%xmm7
  16.    ccb5c:       ff
  17.    ccb5d:       f2 0f 10 b3 e4 e6 f8    movsd  -0x7191c(%ebx),%xmm6
  18.    ccb64:       ff
  19.    ccb65:       f2 0f 2a c0             cvtsi2sd %eax,%xmm0
  20.    ccb69:       89 45 d8                mov    %eax,-0x28(%ebp)
  21.    ccb6c:       f2 0f 5e f8             divsd  %xmm0,%xmm7
  22.    ccb70:       89 4d dc                mov    %ecx,-0x24(%ebp)
  23.    ccb73:       f2 0f 2a c1             cvtsi2sd %ecx,%xmm0
  24.    ccb77:       31 c0                   xor    %eax,%eax
  25.    ccb79:       f2 0f 5e f0             divsd  %xmm0,%xmm6
  26.    ccb7d:       e9 aa 00 00 00          jmp    ccc2c <_ZN10Mandelbrot6workerEi+0x102>
  27.    ccb82:       8d b3 ec e6 f8 ff       lea    -0x71914(%ebx),%esi
  28.    ccb88:       f2 0f 2a c8             cvtsi2sd %eax,%xmm1
  29.    ccb8c:       f2 0f 59 cf             mulsd  %xmm7,%xmm1
  30.    ccb90:       f2 0f 5c 0e             subsd  (%esi),%xmm1
  31.    ccb94:       8b 75 c4                mov    -0x3c(%ebp),%esi
  32.    ccb97:       8d bb c4 aa f8 ff       lea    -0x7553c(%ebx),%edi
  33.    ccb9d:       f2 0f 2a da             cvtsi2sd %edx,%xmm3
  34.    ccba1:       0f 28 c1                movaps %xmm1,%xmm0
  35.    ccba4:       f2 0f 59 de             mulsd  %xmm6,%xmm3
  36.    ccba8:       31 c9                   xor    %ecx,%ecx
  37.    ccbaa:       f2 0f 58 1f             addsd  (%edi),%xmm3
  38.    ccbae:       0f 28 d3                movaps %xmm3,%xmm2
  39.    ccbb1:       0f 28 e2                movaps %xmm2,%xmm4
  40.    ccbb4:       f2 0f 59 c0             mulsd  %xmm0,%xmm0
  41.    ccbb8:       41                      inc    %ecx
  42.    ccbb9:       f2 0f 59 e2             mulsd  %xmm2,%xmm4
  43.    ccbbd:       f2 0f 5c c4             subsd  %xmm4,%xmm0
  44.    ccbc1:       f2 0f 58 c1             addsd  %xmm1,%xmm0
  45.    ccbc5:       0f 28 e0                movaps %xmm0,%xmm4
  46.    ccbc8:       f2 0f 58 e0             addsd  %xmm0,%xmm4
  47.    ccbcc:       f2 0f 59 d4             mulsd  %xmm4,%xmm2
  48.    ccbd0:       0f 28 e0                movaps %xmm0,%xmm4
  49.    ccbd3:       f2 0f 58 d3             addsd  %xmm3,%xmm2
  50.    ccbd7:       0f 28 ea                movaps %xmm2,%xmm5
  51.    ccbda:       f2 0f 5c e1             subsd  %xmm1,%xmm4
  52.    ccbde:       f2 0f 5c eb             subsd  %xmm3,%xmm5
  53.    ccbe2:       f2 0f 59 e4             mulsd  %xmm4,%xmm4
  54.    ccbe6:       f2 0f 59 ed             mulsd  %xmm5,%xmm5
  55.    ccbea:       8d bb f4 e6 f8 ff       lea    -0x7190c(%ebx),%edi
  56.    ccbf0:       f2 0f 58 e5             addsd  %xmm5,%xmm4
  57. ...
复制代码

2. ARMv7:

  1. 000a7f88 <_ZN10Mandelbrot6workerEi>:
  2.    a7f88:       e92d 47f0       stmdb   sp!, {r4, r5, r6, r7, r8, r9, sl, lr}
  3.    a7f8c:       ed2d 8b06       vpush   {d8-d10}
  4.    a7f90:       6c05            ldr     r5, [r0, #64]   ; 0x40
  5.    a7f92:       ee02 5a10       vmov    s4, r5
  6.    a7f96:       eeb8 7bc2       vcvt.f64.s32    d7, s4
  7.    a7f9a:       ed9f 6b3b       vldr    d6, [pc, #236]  ; a8088 <_ZN10Mandelbrot6workerEi+0x100>
  8.    a7f9e:       f8d0 8044       ldr.w   r8, [r0, #68]   ; 0x44
  9.    a7fa2:       ee02 8a90       vmov    s5, r8
  10.    a7fa6:       4604            mov     r4, r0
  11.    a7fa8:       2600            movs    r6, #0
  12.    a7faa:       2700            movs    r7, #0
  13.    a7fac:       2300            movs    r3, #0
  14.    a7fae:       ed9f 8b38       vldr    d8, [pc, #224]  ; a8090 <_ZN10Mandelbrot6workerEi+0x108>
  15.    a7fb2:       ed9f 0b39       vldr    d0, [pc, #228]  ; a8098 <_ZN10Mandelbrot6workerEi+0x110>
  16.    a7fb6:       ed9f 1b3a       vldr    d1, [pc, #232]  ; a80a0 <_ZN10Mandelbrot6workerEi+0x118>
  17.    a7fba:       ee86 ab07       vdiv.f64        d10, d6, d7
  18.    a7fbe:       ed9f 6b3a       vldr    d6, [pc, #232]  ; a80a8 <_ZN10Mandelbrot6workerEi+0x120>
  19.    a7fc2:       eeb8 7be2       vcvt.f64.s32    d7, s5
  20.    a7fc6:       ee86 9b07       vdiv.f64        d9, d6, d7
  21.    a7fca:       e03f            b.n     a804c <_ZN10Mandelbrot6workerEi+0xc4>
  22.    a7fcc:       ee06 3a90       vmov    s13, r3
  23.    a7fd0:       eeb8 5be6       vcvt.f64.s32    d5, s13
  24.    a7fd4:       2100            movs    r1, #0
  25.    a7fd6:       eeb0 7b48       vmov.f64        d7, d8
  26.    a7fda:       ee15 7b0a       vnmls.f64       d7, d5, d10
  27.    a7fde:       eeb0 5b47       vmov.f64        d5, d7
  28.    a7fe2:       ee07 2a90       vmov    s15, r2
  29.    a7fe6:       eeb8 4be7       vcvt.f64.s32    d4, s15
  30.    a7fea:       eeb0 2b40       vmov.f64        d2, d0
  31.    a7fee:       ee04 2b09       vmla.f64        d2, d4, d9
  32.    a7ff2:       eeb0 6b45       vmov.f64        d6, d5
  33.    a7ff6:       eeb0 4b42       vmov.f64        d4, d2
  34.    a7ffa:       eeb0 7b42       vmov.f64        d7, d2
  35.    a7ffe:       ee27 3b07       vmul.f64        d3, d7, d7
  36.    a8002:       3101            adds    r1, #1
  37.    a8004:       ee16 3b06       vnmls.f64       d3, d6, d6
  38.    a8008:       ee33 6b05       vadd.f64        d6, d3, d5
  39.    a800c:       ee36 3b06       vadd.f64        d3, d6, d6
  40.    a8010:       eeb0 2b44       vmov.f64        d2, d4
  41.    a8014:       ee03 2b07       vmla.f64        d2, d3, d7
  42.    a8018:       ee32 3b44       vsub.f64        d3, d2, d4
  43.    a801c:       ee23 3b03       vmul.f64        d3, d3, d3
  44.    a8020:       eeb0 7b42       vmov.f64        d7, d2
  45.    a8024:       ee36 2b45       vsub.f64        d2, d6, d5
  46.    a8028:       ee02 3b02       vmla.f64        d3, d2, d2
  47.    a802c:       eeb4 3bc1       vcmpe.f64       d3, d1
  48.    a8030:       eef1 fa10       vmrs    APSR_nzcv, fpscr
  49.    a8034:       da01            bge.n   a803a <_ZN10Mandelbrot6workerEi+0xb2>
  50.    a8036:       29ff            cmp     r1, #255        ; 0xff
  51.    a8038:       d1e1            bne.n   a7ffe <_ZN10Mandelbrot6workerEi+0x76>
  52.    a803a:       fb00 f101       mul.w   r1, r0, r1
  53.    a803e:       1876            adds    r6, r6, r1
  54.    a8040:       f147 0700       adc.w   r7, r7, #0
  55.    a8044:       3201            adds    r2, #1
  56.    a8046:       4542            cmp     r2, r8
  57. ...
复制代码

很明显:

1、这个项目,测的是fp64(不代表其它项目也是fp64)
2、x86上,用的是标量的SSE,没有矢量化
3、ARMv7上,用的是VFP,没有动用NEON(fp64也无法NEON)。



作者: Tempestglen    时间: 2013-1-28 13:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2013-1-28 14:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2013-1-28 14:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: the_god_of_pig    时间: 2013-1-28 14:05
Tempestglen 发表于 2013-1-28 13:59
惊喜看到很多坟,exynos5250的tdp不是8w了嘛,怎么没爆炸?性能也不是0啊。

GPU、CPU同时满载下CPU靠降频把功耗从4瓦多压到0.5瓦以下,性能和0也差不多






作者: itany    时间: 2013-1-28 14:06
本帖最后由 itany 于 2013-1-28 14:20 编辑
开普勒 发表于 2013-1-28 13:56
居然没有人反汇编来吐槽一下?

用objdump反汇编libgeekbench-jni.so,以Mandelbrot测试项目为例:

果然没有矢量化啊

谢谢您的反汇编! 主贴已经更新了。多谢执教!

作者: the_god_of_pig    时间: 2013-1-28 14:07
Tempestglen 发表于 2013-1-28 14:05
猪神,你家atom的sun spider被日了,哈哈。

是吗?
[attach]2160569[/attach]
[attach]2160570[/attach]


作者: the_god_of_pig    时间: 2013-1-28 14:12
itany 发表于 2013-1-28 14:06
果然没有矢量化啊

这个ARM也是标量阿,x86的SIMD效率会比NEON高很多?

作者: itany    时间: 2013-1-28 14:24
the_god_of_pig 发表于 2013-1-28 14:12
这个ARM也是标量阿,x86的SIMD效率会比NEON高很多?

呵呵,Arm家的Neon不支持双精度浮点,所以……
http://www.arm.com/zh/products/processors/technologies/neon.php
作者: 开普勒    时间: 2013-1-28 14:26
the_god_of_pig 发表于 2013-1-28 14:12
这个ARM也是标量阿,x86的SIMD效率会比NEON高很多?

A15有两条流水线可以执行NEON指令(而且跟VFP共用),对fp32来说每条可以处理两个lane。但是,一部分NEON指令(例如加、乘等)可以发射到两条流水线,这部分指令的吞吐量就是4倍而latency不变。另一部分指令只能发射到其中一条流水线(例如整型转浮点),这部分指令的吞吐量就只有2倍。另外ARMv7对fp64没有NEON,只有ARMv8才支持。

ATOM的SSE性能如何没有测过,看坛里有没有x86专家能解答。
作者: 开普勒    时间: 2013-1-28 14:30
另外,不要指望NEON/SSE能对性能提高多少。编译器自动矢量化的能力相当有限,只对特定的一些模式有效。一般靠程序员显式书写SIMD代码。不过很多算法实际上无法转为用SIMD实现。
作者: the_god_of_pig    时间: 2013-1-28 14:37
开普勒 发表于 2013-1-28 14:26
A15有两条流水线可以执行NEON指令(而且跟VFP共用),对fp32来说每条可以处理两个lane。但是,一部分NEON ...

多谢科普

没记错的话atom SIMD单次吞吐量是128bit,执行4个单精度,不过这是理论值,主要还是看实测NEON和SSE的效率变化

作者: the_god_of_pig    时间: 2013-1-28 14:52
似乎跨平台测试应该提供源码用户自行编译测得才比较有价值,Geekbench这种提供不同平台版本的套路水分很大,基本是想怎么搞怎么搞
作者: 开普勒    时间: 2013-1-28 14:55
the_god_of_pig 发表于 2013-1-28 14:37
多谢科普

没记错的话atom SIMD单次吞吐量是128bit,执行4个单精度,不过这是理论值,主要还是看实测NE ...

微架构的东西最好用小程序实测

比较标量浮点的话,个人认为A15的效率是相当高的:两条VFP流水线+乱序发射,相当低的latency,以及与fp32一样快的fp64。
作者: G70    时间: 2013-1-28 15:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: the_god_of_pig    时间: 2013-1-28 15:02
开普勒 发表于 2013-1-28 14:55
微架构的东西最好用小程序实测

比较标量浮点的话,个人认为A15的效率是相当高的:两条VFP流水线+乱序 ...

不过比实际性能就不能这么测了吧,至少要让带宽有压力

有64bit FP单元标量双精单精就应该一样快了吧,貌似Atom早就是这样了,ARM之前是A8时代64bit浮点还要多周期执行,A9似乎已经改了


作者: kinno    时间: 2013-1-28 15:13
Tempestglen 发表于 2013-1-28 13:59
惊喜看到很多坟,exynos5250的tdp不是8w了嘛,怎么没爆炸?性能也不是0啊。

非要炸掉地球才算爆炸是吧?就这低能生产出来做电暖器的?
作者: Tempestglen    时间: 2013-1-28 15:38
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2013-1-28 15:43
提示: 作者被禁止或删除 内容自动屏蔽
作者: the_god_of_pig    时间: 2013-1-28 15:44
Tempestglen 发表于 2013-1-28 15:38
是滴!



拿个三无OC图YY什么?
atom的同浏览器成绩呢?






作者: the_god_of_pig    时间: 2013-1-28 15:46
Tempestglen 发表于 2013-1-28 15:43
没有矢量化的条件下,atom浮点已经惨败给swift 和A15;如果开启矢量化,那要看neon和sse的效率了。不过既 ...

胡说八道,一个编译好的理论测试YY个头

跑个SPECfp ARM死无葬身之地

作者: acqwer    时间: 2013-1-29 08:57
Tempestglen 发表于 2013-1-28 14:03
单核A15@1.7Ghz就是5w吗?坟

我正式的预测是ChromeBook上的5250双核满载5W,和实际结果基本符合,T神的2.X到3.X都是扯淡。
作者: acqwer    时间: 2013-1-29 09:21
SSE2的性能提升很好查啊
http://browser.primatelabs.com/geekbench2/263
P4 2.66 FP 1035
http://browser.primatelabs.com/geekbench2/310
Athlon 1.2 FP 1001
Athlon的成绩是同频P4的1倍多。

http://www.spec.org/cpu2000/resu ... 20010212-00451.html
P4 1.3G 503
http://www.spec.org/cpu2000/resu ... 20010311-00524.html
Athlon 1.33G 414
算上ICC优化效率的不同,SSE2下P4和同频Athlon相当
作者: Tempestglen    时间: 2013-1-29 09:31
提示: 作者被禁止或删除 内容自动屏蔽
作者: acqwer    时间: 2013-1-29 09:34
本帖最后由 acqwer 于 2013-1-29 09:49 编辑
Tempestglen 发表于 2013-1-29 09:31
你预测了5w,我预测了3w,然后实测结果是4w,所以你预测基本准确,我的预测就是扯蛋。


ChromeBook的功耗和Nexus10的功耗明显不一样,后者有功耗限制。

Nexus10跑JS的功耗增幅是3.1W,ChromeBook的功耗增幅4.3W,Nexus10的屏幕还高一截,明显两者的CPU部分功耗相差很多。

作者: divx001    时间: 2013-1-29 10:02
CPU的通用效能还是看标量能力比较好,矢量指令集只对个别应用(如视频)有明显的提升。就拿ATOM来说跑魔兽3比1.6G的单核K7还卡,但是软解H264比K7强N倍。
作者: itany    时间: 2013-1-29 13:58
Tempestglen 发表于 2013-1-29 09:31
你预测了5w,我预测了3w,然后实测结果是4w,所以你预测基本准确,我的预测就是扯蛋。

T神知道什么叫Throttle么?
明明就是双核功耗超过4W被强制降压降频了,你还在这这么欢乐~




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4