POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: ifu
打印 上一主题 下一主题

Futuremark已经解释了为啥A7物理得分低的原因。个人解读一下,欢迎讨论

[复制链接]
头像被屏蔽
81#
发表于 2013-10-20 18:44 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

82#
发表于 2013-10-20 18:49 | 只看该作者
吓尿了!T神一说locality吓死了,怎么这个都成了程序员的职责了!莫非现在都返回到汇编写程序的年代了?不过T神永远是正确的,T神说内存应该是locality的就locality吧,毕竟T神连线程都不懂,何况还能懂多任务系统内存的复杂性吗?
不如让T神给大家演示一下,怎么用C,或者T神偏爱的Obj C搞个locality的程序来?
回复 支持 反对

使用道具 举报

头像被屏蔽
83#
发表于 2013-10-20 18:50 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

84#
发表于 2013-10-20 19:09 | 只看该作者
本帖最后由 YsMilan 于 2013-10-20 19:13 编辑
Tempestglen 发表于 2013-10-20 18:40
A7当然可以1v2对付那些S800/bt/5420什么的,但是遇到bullet这种随机内存访问的程序, 总不能把1M L2当2M ...


按你逻辑,烂代码导致L2命中率低是吧
那能低到什么程度呢?极端点就算命中率为0吧,那相当于L2废掉
换句话说,没L2的A7比没L2的A6快4%...代码都一样啊
结论:苹果这几年都是吃干饭的,除了L2缓存有点改进,也就是你的顺序读取,运算器加内存访问也就4%的进步...大水果壮哉!
回复 支持 反对

使用道具 举报

85#
发表于 2013-10-20 19:11 | 只看该作者
本帖最后由 YsMilan 于 2013-10-20 19:12 编辑
Tempestglen 发表于 2013-10-20 18:44
一看你就是智商缺乏,对付随机访存,火星人也没有什么好办法,就是堆L2容量增加S/L增加频率而已,这方面一 ...


随机访存就是A7跟A6半斤八两的借口?
就问你一句,同样关掉L2,Core2快还是PD快?
就你也来谈智商...
回复 支持 反对

使用道具 举报

头像被屏蔽
86#
发表于 2013-10-20 19:19 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
87#
发表于 2013-10-20 19:20 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

88#
发表于 2013-10-20 19:32 | 只看该作者
某专业人士要是还在这混估计某神已经被喷死了
回复 支持 反对

使用道具 举报

头像被屏蔽
89#
发表于 2013-10-20 19:40 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

90#
发表于 2013-10-20 19:45 | 只看该作者
Tempestglen 发表于 2013-10-20 18:50
说了半天, 你是在强调prefetch的重要性,问题是A7的prefetch就是比A6强大得多得多。

prefetch对付loc ...
如果给A7配备2M L2,跑physics也是A15的2倍

快去给apple写信,告诉他们你发现了性能翻番的方法
回复 支持 反对

使用道具 举报

91#
发表于 2013-10-20 19:49 | 只看该作者
Tempestglen 发表于 2013-10-20 19:40
不好意思,我正是咨询了某专业人士才敢发表上述观点:prefetch对随机访存无效,楼主也是这么认为的,就你 ...

数数单元外加对着程序的语言描述YY一下就算出性能,i粉没那本事啊
回复 支持 反对

使用道具 举报

头像被屏蔽
92#
发表于 2013-10-20 20:05 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

93#
发表于 2013-10-20 20:09 | 只看该作者
Tempestglen 发表于 2013-10-20 20:05
locality本来就是编译器/微架构/程序员三方通力合作才能完成的事情。

A7从微架构上讲,完全具备1v2对 ...

你就扯淡吧
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
94#
发表于 2013-10-20 20:42 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

95#
 楼主| 发表于 2013-10-20 20:57 | 只看该作者
westlee 发表于 2013-10-20 20:42
ice storm physics分数:

3.0-3.2g的e3300,1m l2 ,ice storm大约22000。

1)这个要看数据规模 footprint,如果cache 都不命中,那肯定是频率高的占便宜,原因我贴中已经说明
2)ICE STORM不是3DMark mobile Unlimited,算法也不见得一样
回复 支持 反对

使用道具 举报

96#
 楼主| 发表于 2013-10-20 21:11 | 只看该作者
Tempestglen 发表于 2013-10-20 18:50
说了半天, 你是在强调prefetch的重要性,问题是A7的prefetch就是比A6强大得多得多。

prefetch对付loc ...

A7配备2M L2跑3DMark physics也未必A15的2倍。因为2MB未必能保证cache 都命中。
回复 支持 反对

使用道具 举报

97#
 楼主| 发表于 2013-10-20 21:24 | 只看该作者
westlee 发表于 2013-10-20 18:15
内存本来就是随机访问的,连续读写才是少见的。

DRAM(Dynamic Random Access Memory),即动态随机存 ...

这是两个概念,DRAM是指可以随机访问。
3DMark这事是每次访问都是真随机毫无规律可言,这其实对所有处理器来说都是一常灾难,除非cache足够大但这不现实
好的程序员会很注意data layout来充分利用cache避免cache miss
回复 支持 反对

使用道具 举报

98#
发表于 2013-10-20 21:27 | 只看该作者
那到底怎样才能跑一万五,要排t神去水果搞cpu layout的还是派ifu去三滴马克做死程?
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
99#
发表于 2013-10-20 22:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
100#
发表于 2013-10-20 22:25 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-6-20 20:18

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表