Futuremark已经解释了为啥A7物理得分低的原因。个人解读一下，欢迎讨论

largewc · 发表于 2013-10-21 11:01

Tempestglen 发表于 2013-10-21 10:58
3.0ghz的频率足够，所以1M L2@高频也足以应付随机访存，A7是1.3Ghz所以难以应付同样的访存压力。

不用脑补这个了，arm64最大的提升就是neon变成双发射，性能翻了一倍。

明年你可以继续用geekbench来跑arm64，这个成绩估计baytrail是追不上了（因为不支持avx）。

acqwer · 发表于 2013-10-21 11:06

Tempestglen 发表于 2013-10-21 10:58
3.0ghz的频率足够，所以1M L2@高频也足以应付随机访存，A7是1.3Ghz所以难以应付同样的访存压力。

T神分析一下上面贴的4412 VS 4212啊，莫非1.5G对比1.3G就是一个质的飞跃了？

slice · 发表于 2013-10-21 11:08

本帖最后由 slice 于 2013-10-21 11:12 编辑

largewc 发表于 2013-10-21 10:45
simd对流花数据优势很大，但是我觉得没前途，统一寻址快到来了，这个到来以后，gpu做流化才是未来的趋势 ...

唉，你这样说还真是的。
如果谁真的做到CPU和GPU的融合，那么这些东西交给GPU是理所应当的。

针对视频编码这些SIMD可以发挥的场景，AVX这些提升很大没有异议。
但我有一个问题就是，AVX之类的指令的实现，晶体管的代价有多大？
可否前端是AVX之类的指令集，其实是GPU的运算单元实现？
CPU本身用大量晶体管来实现GPU适合做的事情，没啥必要的感觉。
CPU和GPU的融合，AMD最先说，谁最可能真的实现呢？

我很好奇，CPU实现个AVX晶体管的代价有多大？

largewc · 发表于 2013-10-21 11:09

wangqi7721 发表于 2013-10-20 22:59
苹果已经默秒全，，，wp8已经被果粉忽略了。。。8260a神流畅，a6在ios7面前就是渣。老话，跟他们谈性能，他 ...

微软的优化基于gpu了，ie11的jpg图片加载，也就是zip解压部分改由gpu来算了，这个比simd性能肯定好多了，这是未来的趋势。

largewc · 发表于 2013-10-21 11:12

slice 发表于 2013-10-21 11:08
唉，你这样说还真是的。
如果谁真的做到CPU和GPU的融合，那么这些东西交给GPU是理所应当的。

这个我不懂了，如果这个真有威胁，可能明年的cherry trail集成avx也有可能。

但是我觉得意义并不大，因为视频解码，bt可是四核的，即使没有avx，表现也不会差。。
当然四核arm64表现会更好，这是没疑问的。

intel的apu应该是2015年，2015年以后，估计基于gpu优化逐渐就能成为主流了。

Tempestglen · 发表于 2013-10-21 11:14

提示: 作者被禁止或删除内容自动屏蔽

slice · 发表于 2013-10-21 11:14

本帖最后由 slice 于 2013-10-21 11:15 编辑

largewc 发表于 2013-10-21 11:12
这个我不懂了，如果这个真有威胁，可能明年的cherry trail集成avx也有可能。

但是我觉得意义并不大，因 ...

Intel Quick Sync Video 编码就飞快，又是怎么个概念？
我想这些越是专用的电路，效率就越高。
当然适应面就越低，只有特定场景才能使用。
不想AVX这样子，在一定领域具有适用性。

largewc · 发表于 2013-10-21 11:18

slice 发表于 2013-10-21 11:14
Intel Quick Sync Video 编码就飞快，又是怎么个概念？
我想这些越是专用的电路，效率就越高。
当然适应 ...

avx要说没用也是不现实的，对于游戏提升还是有价值的，因为手机的vertex shader应该也主要是simd通过gpu驱动模拟的，而不是gpu计算的，所以有一定价值。

本代baytrail看来intel还是没准备拼游戏性能啊。

frankincense · 发表于 2013-10-21 11:26

slice 发表于 2013-10-21 11:08
唉，你这样说还真是的。
如果谁真的做到CPU和GPU的融合，那么这些东西交给GPU是理所应当的。

说到AVX的实现，其实可以看看Xeon Phi
CPU与GPU的融合，AMD或许现在走在前面，但使用几乎相同指令集的Xeon Phi会更容易融合到传统CPU里头，而且新版Xeon Phi已经可以单独作为CPU使用了

Tempestglen · 发表于 2013-10-21 11:26

提示: 作者被禁止或删除内容自动屏蔽

largewc · 发表于 2013-10-21 11:28

frankincense 发表于 2013-10-21 11:26
说到AVX的实现，其实可以看看Xeon Phi
CPU与GPU的融合，AMD或许现在走在前面，但使用几乎相同指令集的Xe ...

我觉得这样做挺好的，这样做可以通过open mp这种公开标准就好了（ios目前仍然不支持，标准gcc是支持的），不需要特定出来一个gpu版本。

不过未来很难说，需要软硬商一起制定标准，wintel是否可以一起使力还不一定。

frankincense · 发表于 2013-10-21 11:33

largewc 发表于 2013-10-21 11:28
我觉得这样做挺好的，这样做可以通过open mp这种公开标准就好了（ios目前仍然不支持，标准gcc是支持的）， ...

不过按Intel的现有路线，似乎对GPU融入CPU的前景短期内并不看好，至少到Skylake（2015年）都没有把Xeon Phi直接塞进CPU的计划，倒是在做Xeon+Xeon Phi共用插座的异构协作模式

largewc · 发表于 2013-10-21 11:35

本帖最后由 largewc 于 2013-10-21 11:37 编辑

frankincense 发表于 2013-10-21 11:33
不过按Intel的现有路线，似乎对GPU融入CPU的前景短期内并不看好，至少到Skylake（2015年）都没有把Xeon P ...

Skylake支持统一寻址了，应该是跟核显统一寻址了，之前pram发的intel那个ppt说明了这个（不敏感吧）

intel的统一寻址就是skylake，还有一个就是线程内存访问限制（应该是一种新的安全机制，我对这个感兴趣，对浏览器的提升应该会很明显）

largewc · 发表于 2013-10-21 12:02

本帖最后由 largewc 于 2013-10-21 12:36 编辑

frankincense 发表于 2013-10-21 11:26
说到AVX的实现，其实可以看看Xeon Phi
CPU与GPU的融合，AMD或许现在走在前面，但使用几乎相同指令集的Xe ...

粗略看了一下，win的geekbench不支持avx，这样的话，128bit的simd，haswell同频接近于a7已经相当不错了。

avx用128bit的sse跑到接近于准256bit的neon，说明haswell的通用处理部分比a7强的太多了，如果geekbech跑avx，肯定可以大幅度甩开a7

xf-108 · 发表于 2013-10-21 12:45

本帖最后由 xf-108 于 2013-10-21 12:45 编辑

largewc 发表于 2013-10-21 10:35
a57是neon双发射的，可以理解了，接近于一个256bit的avx了，geekbench就是测试simd的，我看了一下win下的 ...

AVX跟AVX2.0同为256bit，但是后者性能是前者两倍，也就是128bit SSE的四倍，假如256bit neon性能跟128bit SSE相当的话……

largewc · 发表于 2013-10-21 13:46

本帖最后由 largewc 于 2013-10-21 13:47 编辑

xf-108 发表于 2013-10-21 12:45
AVX跟AVX2.0同为256bit，但是后者性能是前者两倍，也就是128bit SSE的四倍，假如256bit neon性能跟128b ...

我说geekbench完全测试simd有点夸张，但是应该70%的影响来自于这个。
a7的128 + 128因为通用部分不足，被haswell仅仅靠sse就拉平了，但是atom应该做不到。

除去simd，a7同频可能比a6还是有一定提升的，各种因素吧，包含内存，但是提升的大头应该是双发射neon。

明年估计t神会一直用geekbench来恶心atom，因为atom确实不支持avx，跑simd估计不如arm64.

不过atom支持avx也没用，因为geekbench也不支持avx

the_god_of_pig · 发表于 2013-10-21 13:48

Tempestglen 发表于 2013-10-21 11:26
6589的计算能力远不如A7，它的1M L2不是瓶颈。

搞清楚“计算能力”和“计算geekbench能力”的区别先

the_god_of_pig · 发表于 2013-10-21 13:57

largewc 发表于 2013-10-21 13:46
我说geekbench完全测试simd有点夸张，但是应该70%的影响来自于这个。
a7的128 + 128因为通用部分不足， ...

atom砍avx好像是为了功耗，水果大概无所谓，毕竟就一低频双核

largewc · 发表于 2013-10-21 13:58

本帖最后由 largewc 于 2013-10-21 13:58 编辑

the_god_of_pig 发表于 2013-10-21 13:57
atom砍avx好像是为了功耗，水果大概无所谓，毕竟就一低频双核

嗯，这个我同意，明年看看这个neon的实际表现吧，其他家高功耗的四核a57能不能跑稳定频率。

Tempestglen · 发表于 2013-10-21 14:01

提示: 作者被禁止或删除内容自动屏蔽

帐号		自动登录	找回密码
密码			注册

Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽	126^# 发表于 2013-10-21 11:14 来自手机 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽	130^# 发表于 2013-10-21 11:26 来自手机 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽	140^# 发表于 2013-10-21 14:01 来自手机 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Tempestglen Tempestglen 当前离线积分 32 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

Futuremark已经解释了为啥A7物理得分低的原因。个人解读一下，欢迎讨论

浏览过的版块