POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: 罗菜鸟
打印 上一主题 下一主题

终于第一款ARM64出来了

[复制链接]
181#
发表于 2013-10-18 11:20 | 只看该作者
largewc 发表于 2013-10-18 11:17
1mb?随便一个解压就超过了,随便一个图片处理,或者脚本都能超过,3dmark绝对跟内存量没关。

大部分程序数据局部性很好,每次访问都一个cache miss,  haswell来了也瞎掰。对于现代处理器而言大多情况下cache命中率都>90%
回复 支持 反对

使用道具 举报

182#
发表于 2013-10-18 11:20 | 只看该作者
本帖最后由 largewc 于 2013-10-18 11:38 编辑
frankincense 发表于 2013-10-18 11:18
APU也就刚刚实现统一内存寻址
Intel未正式支持内部GPU加速,软件就不会那么快跟上的

是的,但是这个是趋势是没错的。

其他家arm和intel,我估计暂时不可能推广这种模式。

如果四核完全普及了,短时间内可以开启编译器的多核优化,用这个加速单线程的程序,这个是目前比较靠谱的做法。
就是打开OPENMP,我又查了一下,xcode5貌似仍然不支持OpenMP,不知道是否支持GPU加速,看看有没有开关。


微软是在vs2012中加入了c++ amp,可以把c++代码进行gpu加速。
回复 支持 反对

使用道具 举报

183#
发表于 2013-10-18 11:32 | 只看该作者
本帖最后由 acqwer 于 2013-10-18 11:32 编辑
ifu 发表于 2013-10-18 11:15
大部分程序数据局部性很好,3dmark这事在于数据规模超出了A7的1MB L2 cache


自己到3dmark官网查查老Core2,512K、1M、2M L2的区别啊
回复 支持 反对

使用道具 举报

184#
发表于 2013-10-18 12:15 | 只看该作者
ifu 发表于 2013-10-18 11:15
大部分程序数据局部性很好,3dmark这事在于数据规模超出了A7的1MB L2 cache

正常的程序有不超过L2的吗?那还要内存干吗?

倒是某些数学跑分经常连L2都占不满

回复 支持 反对

使用道具 举报

185#
发表于 2013-10-18 12:31 来自手机 | 只看该作者
the_god_of_pig 发表于 2013-10-18 12:15
正常的程序有不超过L2的吗?那还要内存干吗?[sweat>

倒是某些数学跑分经常连L2都占不满[wink>

文科生吧?
回复 支持 反对

使用道具 举报

186#
发表于 2013-10-18 12:32 | 只看该作者
the_god_of_pig 发表于 2013-10-18 12:15
正常的程序有不超过L2的吗?那还要内存干吗?[sweat>

倒是某些数学跑分经常连L2都占不满[wink>

局部性并不是指整个程序放cache里面
回复 支持 反对

使用道具 举报

头像被屏蔽
187#
发表于 2013-10-18 15:02 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

188#
发表于 2013-10-18 19:32 | 只看该作者
ifu 发表于 2013-10-18 11:20
大部分程序数据局部性很好,每次访问都一个cache miss,  haswell来了也瞎掰。对于现代处理器而言大多情况 ...

intel能做到命中率过90%,等于AMD什么的玩意儿也能做到?
回复 支持 反对

使用道具 举报

189#
发表于 2013-10-18 19:40 | 只看该作者
ifu 发表于 2013-10-18 09:24
Silvermont是有手机产品线规划的,手机soc这块比平板大 intel怎么可能无视。现在上市的成品Silvermont平板 ...

手机哪有平板重要啊,只有苹果才最担心手机了,Intel最关心的是平板。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-2 23:19

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表