POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: ifu
打印 上一主题 下一主题

Futuremark已经解释了为啥A7物理得分低的原因。个人解读一下,欢迎讨论

[复制链接]
101#
发表于 2013-10-20 22:27 | 只看该作者
Tempestglen 发表于 2013-10-20 19:20
大footprint的随机访存就是原因,毫无疑问,再牛的prefetch也无济于事,intel的prefetch也无能为力。

连重点都抓不住?你就告诉我Intel的哪次CPU换代时同频同缓存大小的情况下性能只提高4%好了
你把脏水全泼L2上的结果只能说明A7的内核设计是个渣而已
回复 支持 反对

使用道具 举报

102#
发表于 2013-10-20 22:33 | 只看该作者
本帖最后由 YsMilan 于 2013-10-20 22:36 编辑
Tempestglen 发表于 2013-10-20 19:20
大footprint的随机访存就是原因,毫无疑问,再牛的prefetch也无济于事,intel的prefetch也无能为力。


真的吗?那T神你说1MB的赛扬E系列是如何做到频率和缓存大小双双下降的情况下性能还能超过PentiumD的?
回复 支持 反对

使用道具 举报

103#
发表于 2013-10-20 22:53 | 只看该作者
注意到没有,按照T神的两个条件
1,A7性能对于A6翻番
2.3DMark物理得分只增加4%是locality不好
结论:A7在locality不好的程序,比如游戏上的性能降幅是50%,再换句话说A7一到游戏就变A6了...不愧是大水果出品
回复 支持 反对

使用道具 举报

104#
发表于 2013-10-20 22:59 来自手机 | 只看该作者
苹果已经默秒全,,,wp8已经被果粉忽略了。。。8260a神流畅,a6在ios7面前就是渣。老话,跟他们谈性能,他们就谈功耗,跟他们谈功耗,他们谈流畅,软件加成,再谈就系统加成,,,比个鸡把啊,a7再牛逼,有木有高通800牛逼,t4牛逼,3770k一样在虚拟安卓机中完秒之?果粉拥有黑科技。。。
回复 支持 反对

使用道具 举报

105#
发表于 2013-10-20 23:05 | 只看该作者
YsMilan 发表于 2013-10-20 22:33
真的吗?那T神你说1MB的赛扬E系列是如何做到频率和缓存大小双双下降的情况下性能还能超过PentiumD的?

菜羊E1200双核的缓存只有512kb……拿这个说更震撼。
回复 支持 反对

使用道具 举报

106#
发表于 2013-10-20 23:05 来自手机 | 只看该作者
扯白了,苹果就是amd245双核配泰坦或290x吗,,,
回复 支持 反对

使用道具 举报

107#
发表于 2013-10-20 23:09 来自手机 | 只看该作者
靠gpu堆屏幕的料,倒是符合重大果粉心愿,拿放大镜才能体验的效果,科技以堆料为本。,,
回复 支持 反对

使用道具 举报

108#
发表于 2013-10-20 23:26 来自手机 | 只看该作者
大胆预测,风扇是以后手机的标配,大哥大重回人间。。。54wh电池装到手机上,,,安卓默秒win7,ios无敌天下。。。lunix开始收费,安卓,ios全完蛋,un啥bb统一桌面,个人电脑迎来了史上最大的一次性能倒退,我们都回到win95的时代。
回复 支持 反对

使用道具 举报

109#
发表于 2013-10-21 09:18 | 只看该作者
本帖最后由 acqwer 于 2013-10-21 09:21 编辑
ifu 发表于 2013-10-20 16:02
我帖子写得很清楚了,这种随机访存,如果L/S单元数量都差不多的情况下。频率高的和核多的占优。
其实这b ...


AMD的PPT是集显对集显比总分,你居然没看出来?或者说你以为别人都蠢到看不出来?
回复 支持 反对

使用道具 举报

110#
发表于 2013-10-21 09:27 | 只看该作者
现代在乱序执行下的CPU,还有可能有完美的locality吗?
程序员需要关注CPU内部的cache布局了?好吧,我这个程序员落伍了!
我不知道现在有哪个大学的计算机课程还在鼓励大家用汇编写程序的,
T神说这是程序员的基本素质,就像要求一个机械设计师理解原子结构一样,
完成风马牛不及!
回复 支持 反对

使用道具 举报

111#
发表于 2013-10-21 09:27 | 只看该作者
ifu 发表于 2013-10-20 21:24
这是两个概念,DRAM是指可以随机访问。
3DMark这事是每次访问都是真随机毫无规律可言,这其实对所有处理 ...

这位专家的意思是3dmark的程序员都是烂货,你自己来改造下那个物理引擎吧,让其他CPU不提升的情况下大水果性能翻倍。

对了6589也是1M L2啊,频率还只有1.2G,不知是怎么避免这个情况的?还请专家讲解一下吧。
回复 支持 反对

使用道具 举报

112#
发表于 2013-10-21 09:37 | 只看该作者
本帖最后由 acqwer 于 2013-10-21 09:41 编辑

http://community.futuremark.com/ ... os+4+Dual%29/review
1.6G 4c 1M L2 9435
http://community.futuremark.com/ ... laxy+Note+II/review
1.4G 2c 512K L2 4051
算同规格效率 4212的分数是4051/1.4*1.6*2=9259,IPC差距只有2%不到,考虑到Note2的内存规格较高,两个可以说完全一样,没看出核心数减少、L2减少、频率减少带来的效率降低。
回复 支持 反对

使用道具 举报

113#
发表于 2013-10-21 09:39 | 只看该作者
raini 发表于 2013-10-21 09:27
现代在乱序执行下的CPU,还有可能有完美的locality吗?
程序员需要关注CPU内部的cache布局了?好吧,我这个 ...

早告诉他是常识了
可是常识这种东西对神来说是无效的...
回复 支持 反对

使用道具 举报

114#
发表于 2013-10-21 10:34 | 只看该作者
本帖最后由 largewc 于 2013-10-21 12:27 编辑
Tempestglen 发表于 2013-10-20 16:17
首先,你别搅浑水,cyclone不代表所有的arm。

其次,我已经请求futuremark做其他试验,他们之前不是把 ...


狗屁,你在侮辱全世界程序员的智商吗,物理引擎很大的一头是场景管理,场景管理就是一个自恒二叉树,你来找一个算法,让自恒二叉树变成线性的,然后再变成一个连续内存(不用指针索引),你来解决一下看看,来挑战一下全世界程序的智商。


我都测试过了,我说过了,最大的改变不过是xcode5能自动针对neon优化了,而且,a7比a6最大的改变是neon是双发射的(arm64的neon就是双发射,没疑问),也就是近似于一个256bit的avx了,而geekbench不过就是一个simd测试而已。所谓的性能翻倍主要来源于此而已。

3dsmark说整理到连续内存,只是为了测试,并不是物理引擎真的可以整理成一个连续的,如果要把一个二叉树刻意整理,整理的时间可能比计算的时间还长,一般是不会做这种无用功的优化的。

而且3dmark之说后端的计算连续化了,前端为什么不行,因为二叉树的快速遍历根本不可能整理成一个所谓能够流化的方案

----------------
最后我的结论就是,a7在simd上已经达到avx的级别,在常规通用cpu上,跟a6并没有什么提升,仍然不及baytrail,就这样了。
----------------
这句收回,因为看了一下geekbench并不支持avx,也就是haswell用128bit的sse跑出来这个成绩,那还是很可观了,跑avx也不是a7能比的。
回复 支持 反对

使用道具 举报

115#
发表于 2013-10-21 10:35 | 只看该作者
the_god_of_pig 发表于 2013-10-20 16:46
YY前先去找找你的15000分的脸

a57是neon双发射的,可以理解了,接近于一个256bit的avx了,geekbench就是测试simd的,我看了一下win下的geekbench的代码,90%的测试都是流化测试,也就是simd测试。
回复 支持 反对

使用道具 举报

116#
发表于 2013-10-21 10:37 | 只看该作者
再说什么内存问题就是胡扯蛋了。
回复 支持 反对

使用道具 举报

117#
发表于 2013-10-21 10:41 | 只看该作者
T神别这样

这种帖子不适合你出来咬
回复 支持 反对

使用道具 举报

118#
发表于 2013-10-21 10:45 | 只看该作者
本帖最后由 largewc 于 2013-10-21 10:45 编辑
Airhouse 发表于 2013-10-21 10:42
感觉我们又要回到指令集互殴的年代了。从MMX到AltiVec到SSE到Neon再到AVX


simd对流花数据优势很大,但是我觉得没前途,统一寻址快到来了,这个到来以后,gpu做流化才是未来的趋势,vc支持的c++ amp算是做了一些提前的打算。

simd指令没有继续发展的必要了,这是我的观点。


通用cpu比性能,跑跑快速排序,跑跑super pi这种还是靠谱一些的。
回复 支持 反对

使用道具 举报

头像被屏蔽
119#
发表于 2013-10-21 10:58 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

120#
发表于 2013-10-21 11:01 | 只看该作者
Tempestglen 发表于 2013-10-21 10:58
3.0ghz的频率足够,所以1M L2@高频也足以应付随机访存,A7是1.3Ghz所以难以应付同样的 访存压力。

不用脑补这个了,arm64最大的提升就是neon变成双发射,性能翻了一倍。

明年你可以继续用geekbench来跑arm64,这个成绩估计baytrail是追不上了(因为不支持avx)。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-6-20 20:24

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表