POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: ifu
打印 上一主题 下一主题

Futuremark已经解释了为啥A7物理得分低的原因。个人解读一下,欢迎讨论

[复制链接]
121#
发表于 2013-10-21 11:01 | 只看该作者
Tempestglen 发表于 2013-10-21 10:58
3.0ghz的频率足够,所以1M L2@高频也足以应付随机访存,A7是1.3Ghz所以难以应付同样的 访存压力。

不用脑补这个了,arm64最大的提升就是neon变成双发射,性能翻了一倍。

明年你可以继续用geekbench来跑arm64,这个成绩估计baytrail是追不上了(因为不支持avx)。
回复 支持 反对

使用道具 举报

122#
发表于 2013-10-21 11:06 | 只看该作者
Tempestglen 发表于 2013-10-21 10:58
3.0ghz的频率足够,所以1M L2@高频也足以应付随机访存,A7是1.3Ghz所以难以应付同样的 访存压力。

T神分析一下上面贴的4412 VS 4212啊,莫非1.5G对比1.3G就是一个质的飞跃了?
回复 支持 反对

使用道具 举报

123#
发表于 2013-10-21 11:08 | 只看该作者
本帖最后由 slice 于 2013-10-21 11:12 编辑
largewc 发表于 2013-10-21 10:45
simd对流花数据优势很大,但是我觉得没前途,统一寻址快到来了,这个到来以后,gpu做流化才是未来的趋势 ...

唉,你这样说还真是的。
如果谁真的做到CPU和GPU的融合,那么这些东西交给GPU是理所应当的。

针对视频编码这些SIMD可以发挥的场景,AVX这些提升很大没有异议。
但我有一个问题就是,AVX之类的指令的实现,晶体管的代价有多大?
可否前端是AVX之类的指令集,其实是GPU的运算单元实现?
CPU本身用大量晶体管来实现GPU适合做的事情,没啥必要的感觉。
CPU和GPU的融合,AMD最先说,谁最可能真的实现呢?

我很好奇,CPU实现个AVX晶体管的代价有多大?
回复 支持 反对

使用道具 举报

124#
发表于 2013-10-21 11:09 | 只看该作者
wangqi7721 发表于 2013-10-20 22:59
苹果已经默秒全,,,wp8已经被果粉忽略了。。。8260a神流畅,a6在ios7面前就是渣。老话,跟他们谈性能,他 ...

微软的优化基于gpu了,ie11的jpg图片加载,也就是zip解压部分改由gpu来算了,这个比simd性能肯定好多了,这是未来的趋势。
回复 支持 反对

使用道具 举报

125#
发表于 2013-10-21 11:12 | 只看该作者
slice 发表于 2013-10-21 11:08
唉,你这样说还真是的。
如果谁真的做到CPU和GPU的融合,那么这些东西交给GPU是理所应当的。

这个我不懂了,如果这个真有威胁,可能明年的cherry trail集成avx也有可能。

但是我觉得意义并不大,因为视频解码,bt可是四核的,即使没有avx,表现也不会差。。
当然四核arm64表现会更好,这是没疑问的。

intel的apu应该是2015年,2015年以后,估计基于gpu优化逐渐就能成为主流了。
回复 支持 反对

使用道具 举报

头像被屏蔽
126#
发表于 2013-10-21 11:14 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

127#
发表于 2013-10-21 11:14 | 只看该作者
本帖最后由 slice 于 2013-10-21 11:15 编辑
largewc 发表于 2013-10-21 11:12
这个我不懂了,如果这个真有威胁,可能明年的cherry trail集成avx也有可能。

但是我觉得意义并不大,因 ...

Intel Quick Sync Video 编码就飞快,又是怎么个概念?
我想这些越是专用的电路,效率就越高。
当然适应面就越低,只有特定场景才能使用。
不想AVX这样子,在一定领域具有适用性。
回复 支持 反对

使用道具 举报

128#
发表于 2013-10-21 11:18 | 只看该作者
slice 发表于 2013-10-21 11:14
Intel Quick Sync Video 编码就飞快,又是怎么个概念?
我想这些越是专用的电路,效率就越高。
当然适应 ...

avx要说没用也是不现实的,对于游戏提升还是有价值的,因为手机的vertex shader应该也主要是simd通过gpu驱动模拟的,而不是gpu计算的,所以有一定价值。

本代baytrail看来intel还是没准备拼游戏性能啊。
回复 支持 反对

使用道具 举报

129#
发表于 2013-10-21 11:26 | 只看该作者
slice 发表于 2013-10-21 11:08
唉,你这样说还真是的。
如果谁真的做到CPU和GPU的融合,那么这些东西交给GPU是理所应当的。

说到AVX的实现,其实可以看看Xeon Phi
CPU与GPU的融合,AMD或许现在走在前面,但使用几乎相同指令集的Xeon Phi会更容易融合到传统CPU里头,而且新版Xeon Phi已经可以单独作为CPU使用了
回复 支持 反对

使用道具 举报

头像被屏蔽
130#
发表于 2013-10-21 11:26 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

131#
发表于 2013-10-21 11:28 | 只看该作者
frankincense 发表于 2013-10-21 11:26
说到AVX的实现,其实可以看看Xeon Phi
CPU与GPU的融合,AMD或许现在走在前面,但使用几乎相同指令集的Xe ...

我觉得这样做挺好的,这样做可以通过open mp这种公开标准就好了(ios目前仍然不支持,标准gcc是支持的),不需要特定出来一个gpu版本。

不过未来很难说,需要软硬商一起制定标准,wintel是否可以一起使力还不一定。
回复 支持 反对

使用道具 举报

132#
发表于 2013-10-21 11:33 | 只看该作者
largewc 发表于 2013-10-21 11:28
我觉得这样做挺好的,这样做可以通过open mp这种公开标准就好了(ios目前仍然不支持,标准gcc是支持的), ...

不过按Intel的现有路线,似乎对GPU融入CPU的前景短期内并不看好,至少到Skylake(2015年)都没有把Xeon Phi直接塞进CPU的计划,倒是在做Xeon+Xeon Phi共用插座的异构协作模式
回复 支持 反对

使用道具 举报

133#
发表于 2013-10-21 11:35 | 只看该作者
本帖最后由 largewc 于 2013-10-21 11:37 编辑
frankincense 发表于 2013-10-21 11:33
不过按Intel的现有路线,似乎对GPU融入CPU的前景短期内并不看好,至少到Skylake(2015年)都没有把Xeon P ...


Skylake支持统一寻址了,应该是跟核显统一寻址了,之前pram发的intel那个ppt说明了这个(不敏感吧)

intel的统一寻址就是skylake,还有一个就是线程内存访问限制(应该是一种新的安全机制,我对这个感兴趣,对浏览器的提升应该会很明显)
回复 支持 反对

使用道具 举报

134#
发表于 2013-10-21 12:02 | 只看该作者
本帖最后由 largewc 于 2013-10-21 12:36 编辑
frankincense 发表于 2013-10-21 11:26
说到AVX的实现,其实可以看看Xeon Phi
CPU与GPU的融合,AMD或许现在走在前面,但使用几乎相同指令集的Xe ...


粗略看了一下,win的geekbench不支持avx,这样的话,128bit的simd,haswell同频接近于a7已经相当不错了。


avx用128bit的sse跑到接近于准256bit的neon,说明haswell的通用处理部分比a7强的太多了,如果geekbech跑avx,肯定可以大幅度甩开a7
回复 支持 反对

使用道具 举报

135#
发表于 2013-10-21 12:45 | 只看该作者
本帖最后由 xf-108 于 2013-10-21 12:45 编辑
largewc 发表于 2013-10-21 10:35
a57是neon双发射的,可以理解了,接近于一个256bit的avx了,geekbench就是测试simd的,我看了一下win下的 ...


AVX跟AVX2.0同为256bit,但是后者性能是前者两倍,也就是128bit SSE的四倍,假如256bit neon性能跟128bit SSE相当的话……
回复 支持 反对

使用道具 举报

136#
发表于 2013-10-21 13:46 | 只看该作者
本帖最后由 largewc 于 2013-10-21 13:47 编辑
xf-108 发表于 2013-10-21 12:45
AVX跟AVX2.0同为256bit,但是后者性能是前者两倍,也就是128bit SSE的四倍,假如256bit neon性能跟128b ...


我说geekbench完全测试simd有点夸张,但是应该70%的影响来自于这个。
a7的128 + 128因为通用部分不足,被haswell仅仅靠sse就拉平了,但是atom应该做不到。

除去simd,a7同频可能比a6还是有一定提升的,各种因素吧,包含内存,但是提升的大头应该是双发射neon。

明年估计t神会一直用geekbench来恶心atom,因为atom确实不支持avx,跑simd估计不如arm64.

不过atom支持avx也没用,因为geekbench也不支持avx
回复 支持 反对

使用道具 举报

137#
发表于 2013-10-21 13:48 | 只看该作者
Tempestglen 发表于 2013-10-21 11:26
6589的计算能力远不如A7,它的1M L2不是瓶颈。

搞清楚“计算能力”和“计算geekbench能力”的区别先
回复 支持 反对

使用道具 举报

138#
发表于 2013-10-21 13:57 | 只看该作者
largewc 发表于 2013-10-21 13:46
我说geekbench完全测试simd有点夸张,但是应该70%的影响来自于这个。
a7的128 + 128因为通用部分不足, ...

atom砍avx好像是为了功耗,水果大概无所谓,毕竟就一低频双核
回复 支持 反对

使用道具 举报

139#
发表于 2013-10-21 13:58 | 只看该作者
本帖最后由 largewc 于 2013-10-21 13:58 编辑
the_god_of_pig 发表于 2013-10-21 13:57
atom砍avx好像是为了功耗,水果大概无所谓,毕竟就一低频双核


嗯,这个我同意,明年看看这个neon的实际表现吧,其他家高功耗的四核a57能不能跑稳定频率。
回复 支持 反对

使用道具 举报

头像被屏蔽
140#
发表于 2013-10-21 14:01 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-6-16 06:05

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表