POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: ifu
打印 上一主题 下一主题

6发射。。。A7这么强的raw power,A8再改进恐怕得玩多线程了

[复制链接]
21#
发表于 2013-10-31 09:39 来自手机 | 只看该作者
532 发表于 2013-10-31 09:33
不是啦,愤怒小鸟那么多物理特效,又没装老黄的显卡能gpu跑物理X,a7的cpu算不过来的啦,L2都卡死了我估计 ...

小鸟是box2d,不是bullet,不过原理差不多
回复 支持 反对

使用道具 举报

22#
发表于 2013-10-31 09:41 来自手机 | 只看该作者
本帖最后由 largewc 于 2013-10-31 09:47 编辑
ifu 发表于 2013-10-31 09:30
haswell也做不到同时发射 4 INT adds+ 2 FP adds当然L/S还是比A7强的

显然a7做不到超过2浮点计算能力,不借助simd,单说浮点的话,看不到a7比a6可能更快的地方。a6三发射端口对于2的浮点来说,也很充裕了。
回复 支持 反对

使用道具 举报

23#
发表于 2013-10-31 10:45 | 只看该作者
擦才发现这标题还给高亮了,跟隔壁交易区一样黑亮给群众鞭尸围观的么

小鸟那个说真的,touch4在个别场景一发KO引起太多物体崩塌的话,一样会卡,我也不晓得是不是得i7 5g跑才流畅,台式机上没玩过
回复 支持 反对

使用道具 举报

24#
发表于 2013-10-31 10:48 | 只看该作者
532 发表于 2013-10-31 10:45
[sweatingbullets>擦才发现这标题还给高亮了,跟隔壁交易区一样黑亮给群众鞭尸围观的么

[sweatingbullet ...

多到一定程度啥也会卡,游戏一般控制在一定范围内。

box2d我们自己做过一个小东西自己玩,但是没有做过商品游戏。


bullet和ode都做过商业游戏。
回复 支持 反对

使用道具 举报

25#
 楼主| 发表于 2013-10-31 10:58 | 只看该作者
largewc 发表于 2013-10-31 09:41
显然a7做不到超过2浮点计算能力,不借助simd,单说浮点的话,看不到a7比a6可能更快的地方。a6三发射端口对 ...

浮点本来在日常应用中所占比例就小。
haswell也只能同时发射2条浮点指令,没人会认为haswell和a6一个档次吧
回复 支持 反对

使用道具 举报

26#
发表于 2013-10-31 11:07 | 只看该作者
ifu 发表于 2013-10-31 10:58
浮点本来在日常应用中所占比例就小。
haswell也只能同时发射2条浮点指令,没人会认为haswell和a6一个档次 ...

haswell确实也只有两个,但是haswell支持avx,加入向量矩阵的专项指令显然可以大幅度加速3d程序。
arm可能未来的版本也会加入这个吧,那时候浮点同频差距就不会太了。


arm再加入这些东西以后,带来的编译问题也会加重,不过这个对于苹果来说并不是什么太大的问题。

我继续维持苹果可能会做出最强的arm的结论,未来苹果会从指令集和微构架入手改良arm,继续堆叠运算单元的时代将要过去了。
回复 支持 反对

使用道具 举报

shadowlich 该用户已被删除
27#
发表于 2013-10-31 11:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

28#
发表于 2013-10-31 11:55 | 只看该作者
LZ又是从哪里看出A7只有一组L/S呢,莫非是Apple内部的CPU开发人员?
回复 支持 反对

使用道具 举报

29#
发表于 2013-10-31 11:59 | 只看该作者
acqwer 发表于 2013-10-31 11:55
LZ又是从哪里看出A7只有一组L/S呢,莫非是Apple内部的CPU开发人员?

最起码也是官方发炎人,前些天还“在此我正式宣布a7 ipc是a6两倍”来着
回复 支持 反对

使用道具 举报

30#
发表于 2013-10-31 12:01 | 只看该作者
four integer adds and two FP adds in parallel

这是SIMD的情况下吧
回复 支持 反对

使用道具 举报

31#
发表于 2013-10-31 12:03 | 只看该作者
532 发表于 2013-10-31 11:59
[sweatingbullets>最起码也是官方发炎人,前些天还“在此我正式宣布a7 ipc是a6两倍”来着

其实原文有这一句
You can also perform up to two loads or stores per clock.

不过砖家没看懂罢了。
回复 支持 反对

使用道具 举报

32#
发表于 2013-10-31 12:25 | 只看该作者
acqwer 发表于 2013-10-31 12:01
这是SIMD的情况下吧

应该不是,simd的话fp应该有8组了。

估计整数确实叠到了4组

a7两组l/s吧,ifu转的那段话不是说了。
回复 支持 反对

使用道具 举报

33#
发表于 2013-10-31 12:31 | 只看该作者
本帖最后由 the_god_of_pig 于 2013-10-31 12:34 编辑
acqwer 发表于 2013-10-31 12:03
其实原文有这一句

不过砖家没看懂罢了。

最近好像流行在无源码的情况下靠数单元和cache判断瓶颈,所以在预设观点的前提下无视某些单元也是正常的
回复 支持 反对

使用道具 举报

34#
 楼主| 发表于 2013-10-31 12:47 | 只看该作者
acqwer 发表于 2013-10-31 11:55
LZ又是从哪里看出A7只有一组L/S呢,莫非是Apple内部的CPU开发人员?

同时只能2L ,2S,(1L+1S) 当然不如 haswell的2L+1S
回复 支持 反对

使用道具 举报

35#
 楼主| 发表于 2013-10-31 12:48 | 只看该作者
shadowlich 发表于 2013-10-31 11:23
LZ你谈苹果就谈苹果,不要在没搞清楚的情况下就扯xbox。人家的32M ESRAM明明CPU/GPU都可以用。到你这里就成 ...

回复 支持 反对

使用道具 举报

36#
发表于 2013-10-31 12:52 | 只看该作者
本帖最后由 acqwer 于 2013-10-31 12:57 编辑
ifu 发表于 2013-10-31 12:47
同时只能2L ,2S,(1L+1S) 当然不如 haswell的2L+1S


不知和只有1L 1S的Nehalem或者Core2相比,哪个更瓶颈呢?
[img]
http://images.anandtech.com/revi ... ure/nehalemexec.png[/img]
回复 支持 反对

使用道具 举报

37#
 楼主| 发表于 2013-10-31 12:53 | 只看该作者
532 发表于 2013-10-31 11:59
[sweatingbullets>最起码也是官方发炎人,前些天还“在此我正式宣布a7 ipc是a6两倍”来着

“在此我正式宣布a7 ipc是a6两倍”找来看看?
回复 支持 反对

使用道具 举报

38#
 楼主| 发表于 2013-10-31 12:57 | 只看该作者
largewc 发表于 2013-10-31 11:07
haswell确实也只有两个,但是haswell支持avx,加入向量矩阵的专项指令显然可以大幅度加速3d程序。
arm可 ...

这玩意就simd了,大部分非数值之类的程序能向量化的不多。
要重负载浮点计算GPU融合才是大势,不知道水果啥时候能融合
回复 支持 反对

使用道具 举报

39#
发表于 2013-10-31 13:00 | 只看该作者
largewc 发表于 2013-10-31 12:25
应该不是,simd的话fp应该有8组了。

估计整数确实叠到了4组

如果是一次多少指令就不会用4adds这种特指了吧,Conreo的128bit的SIMD 描述就是4 fp adds or muls每周期。
回复 支持 反对

使用道具 举报

40#
发表于 2013-10-31 13:04 | 只看该作者
intel真是丧心病狂   L4那给CPU和Iris Pro共用
顺便也把Kaveri加进你的丧心病狂名单吧

请不要看到几行字就高潮
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-2 21:13

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表