POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: the_god_of_pig
打印 上一主题 下一主题

媲美A15:iphone5s CPU持续全开频率只有900Mhz

  [复制链接]
头像被屏蔽
101#
发表于 2013-10-31 14:29 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
102#
发表于 2013-10-31 14:31 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
103#
发表于 2013-10-31 14:32 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
104#
发表于 2013-10-31 14:41 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

105#
发表于 2013-10-31 14:45 | 只看该作者
Tempestglen 发表于 2013-10-31 14:31
既然你说了刚体物理,一定知道ODE被良好的prefetch提升了60%性能。而我们都知道prefetch对随机访存一点用 ...

你用你自己的脑子想想,刚体碰撞和柔体的运算差别就知道你说的都是屁话了
回复 支持 反对

使用道具 举报

头像被屏蔽
106#
发表于 2013-10-31 14:52 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

107#
发表于 2013-10-31 15:04 | 只看该作者
Tempestglen 发表于 2013-10-31 14:52
futuremark的人说的很清楚
sse和neon在physcis测试中没用用处,甚至手动打开neon优化开关 都没有用。
...

两者的算法完全不同,你搞机械的应该学过流体力学,不应该要我教吧。

A7的问题别人写的很清楚了——在某些环节可以得到2倍甚至更高的提升,但是整体的提升并不大——我觉得这很好理解吧。

推土机的测试出来后,H264的开发人员还不是说XXX环节用上FMA提升几倍,但是最终整体的提升也就几个点。A7并没有提升整体的性能,但是在某些能用上SIMD的环节上面提升巨大,可惜的是,用到SIMD的地方不多。

至于你队友扯出的什么L/S啊,L2啊都是搞笑,Nahelem的L/S比A7少,L2比A7小,L3比A7小,比比性能试试啊。Haswell的L/S提升巨大,性能又提高了多大点。高频更是无稽之谈,这些处理器的东西速度都是跟着频率走的,如果低频是瓶颈,那么高频同样是瓶颈。
回复 支持 反对

使用道具 举报

108#
 楼主| 发表于 2013-10-31 15:07 | 只看该作者
Tempestglen 发表于 2013-10-31 14:41
我不是IT专业人士,但是有人懂行。

架构设计的技术含量多了去了,例如LSU前端的queue怎么维护,bypass要 ...

你居然把某人的话转过来,这不是打你队友的脸吗?
回复 支持 反对

使用道具 举报

109#
发表于 2013-10-31 15:11 | 只看该作者
本帖最后由 largewc 于 2013-10-31 15:15 编辑
Tempestglen 发表于 2013-10-31 14:31
既然你说了刚体物理,一定知道ODE被良好的prefetch提升了60%性能。而我们都知道prefetch对随机访存一点用 ...


ode我更熟悉了,我们的物理引擎就是基于ode改的,ode性能不如bullet,我们目前是兼容ode和bullet。

我刚才说了物理前端和后端,前端是碰撞检测,后端是物理计算


有一个概念可以普及一下,物理引擎基本上是碰撞,然后计算速度,这里就有一个悖论,因为球掉到地面上,按照这样做永远无法稳定下来,它永远是掉到地上,然后弹起,永远都是抖动的,不能稳定

所以ode用了一个简单的办法,就是后端计算默认计算20遍,取一个影响平均值,这个办法可以有效避免抖动问题,使得场景固定下来。

bullet后端研究的不多,但是肯定不是ode这种办法,应该通过巧妙的一些算法回避了计算20遍。

ode这个20遍是不进行前端碰撞检测的,所以ode的后端计算也很耗时,这个适合于一般教育场景,可以肯定的是,游戏肯定不会用20倍计算的办法,通常会通过一些特殊手段,当速度低于一定程度,就认为是固定的来回避抖动。

我们的游戏ode版本只给了一遍,20这个参数只能是一些demo级别的软件可以接受。

相信这个测试是用默认ode的参数来的,最后默认的20遍计算对于prefetch来说那是固定的,内存已经固定化了,当然不存在问题。前端的碰撞检测仍然无法做到明显的加速。

但是这个办法太笨了,收费物理引擎一般不会用这种办法,bulllet是因为amd投资免费了吧,bullet水平比ode还是明显更好的。
回复 支持 反对

使用道具 举报

头像被屏蔽
110#
发表于 2013-10-31 15:15 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

111#
发表于 2013-10-31 15:16 | 只看该作者
本帖最后由 largewc 于 2013-10-31 15:23 编辑
Tempestglen 发表于 2013-10-31 15:15
这是某个环节的问题?

物理模拟 ,代码写的这么差的bullet就能当典型代表?


bullet显然比ode好多了


ode也是开源的,只是名义上不免费,实际上估计也没人交钱

现在bullet这么强,ode未来估计更没市场了。
回复 支持 反对

使用道具 举报

112#
 楼主| 发表于 2013-10-31 15:16 | 只看该作者
Tempestglen 发表于 2013-10-31 15:15
这是某个环节的问题?

物理模拟 ,代码写的这么差的bullet就能当典型代表?

就等你来写了
回复 支持 反对

使用道具 举报

113#
发表于 2013-10-31 15:19 | 只看该作者
Tempestglen 发表于 2013-10-31 15:15
这是某个环节的问题?

物理模拟 ,代码写的这么差的bullet就能当典型代表?

开源的box2d也是这种办法,多遍计算,早期小鸟可以看得出,场景一直在摇摆,你可以下载一个看看,这是小鸟为了不用多遍计算,做出的一些妥协。
回复 支持 反对

使用道具 举报

114#
发表于 2013-10-31 15:40 | 只看该作者
Tempestglen 发表于 2013-10-31 15:15
这是某个环节的问题?

物理模拟 ,代码写的这么差的bullet就能当典型代表?

你说差,请拿出证据,两者都是开源的,你来分析下代码,让我们知道bullet到低差在哪里吧。
回复 支持 反对

使用道具 举报

头像被屏蔽
115#
发表于 2013-10-31 15:42 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

116#
发表于 2013-10-31 15:44 | 只看该作者
本帖最后由 acqwer 于 2013-10-31 15:50 编辑
Tempestglen 发表于 2013-10-31 15:42
futuremark的人不是亲口承认了bullet是随机访存了吗?

你能找到preftech提升了bullet性能的证据?一个 ...


地球上面99%的程序绝大部分情况下都是随机访存的,包括IOS和OSX。

随机和循序有个很相似的对比,SSD VS HHD阵列,循序读取的性能差不多,都受限于接口,那个的性能更好?
回复 支持 反对

使用道具 举报

117#
发表于 2013-10-31 16:24 | 只看该作者
神说不好就不好呗!在神的世界里,所有的东西都是有序的,产生都是有原因的。
既然苹果公司认为随机访存是没必要的,那就没必要吧!
反正跑分是高的,对比是没有的,体验就在手指摸一下屏幕的快慢上!
回复 支持 反对

使用道具 举报

118#
发表于 2013-10-31 16:25 | 只看该作者
Tempestglen 发表于 2013-10-31 15:42
futuremark的人不是亲口承认了bullet是随机访存了吗?

你能找到preftech提升了bullet性能的证据?一个 ...

那你就写一个最大利用上prefetch的物理引擎吧!
不过鉴于你在开发SBMark,还是让你中科院的高材生朋友帮你写吧!
让我们也开开眼界好了!
回复 支持 反对

使用道具 举报

头像被屏蔽
119#
发表于 2013-10-31 16:27 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
120#
发表于 2013-10-31 16:30 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-20 12:06

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表