POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 9408|回复: 108
打印 上一主题 下一主题

说说各位战了很久的一些话题,比如IP,比如安卓,比如64位

[复制链接]
跳转到指定楼层
1#
发表于 2013-9-16 21:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 welo000 于 2013-9-16 22:10 编辑

CPU不是只差0.1G么,怎么物理分数差近千分??难道GPU也上?


另外,无论IP5多么流畅,可上的网页还不是X86电脑上那个,怪不得不给开FLASH,完整的电脑模式浏览,双核肯定是要爆的,对吧。


我过手过三台IP5(一台有锁日版,一台行货,还捡了一台),你们确定没经历过不停开游戏和软件,在切换和开启的时候卡一下的情形?UI划来划去流畅有啥意义啊

和很多名牌的安卓旗舰对比,我发现安卓和IP在响应上安卓最大的差距是实体按键(菜单键返回键),也就是说,很多时候如果是按触摸屏上软件提供的各种功能图标,软件瞬间响应,但是如果是实体键,却会产生延迟,这就奇葩了,刚好,IP没这两个键,SO。。。。

另外一点,各位可以用图瑞2做下对比,对比苹果处理器和其他ARM处理器,你们会发现,图瑞2阉割的正好是苹果处理器一直在加强的,而那部分,在大数据处理的时候,最影响响应

关于64位,就我的知识面看,CPU支持64位最大的益处貌似是双精度的支持(单精度是32位,双精度是64位的,以上说的是浮点运算),那么,连I7上双精度都要捉瞎,ARM上了有啥用?-----不可否认,A15提升最大的就是浮点性能,这妥妥就是要上超算的节奏

另外,64位软件会相应比32位大,位数问题,无解,自然也就占用更大的运行内存,IP5S居然还是1G,可怜的果粉,妥妥被坑的节奏

IP5的外观是我最喜欢的。。。。。

更喜欢其文件传输速度,传毛片进手机真是飞快,安卓还是爬文件的时候,IP5已经在看了

PS:话说,我在这里看了半年T神和各位的表演,才发现原来不用赞助也能注册,专门去下了微信,我对自己都无语了
2#
发表于 2013-9-16 22:48 来自手机 | 只看该作者
:L 不觉明厉……
回复 支持 反对

使用道具 举报

3#
发表于 2013-9-16 23:13 | 只看该作者
流畅这个你就不懂了,果粉的脑袋里的生物钟是随着界面帧率速度动态变化的,比如界面60fps的时候他们的生物钟频率是a,帧率30fps的时候他们的生物钟频率是50%a,简单说就是等比增减,所以视神经跟大脑逻辑中枢一直的判断都是很“流畅”。

听不懂没关系,去看看《李献计历险记》即可
回复 支持 反对

使用道具 举报

4#
发表于 2013-9-16 23:39 | 只看该作者
你以为32->64位就把寄存器变为64位?

http://www.arm.com/zh/products/p ... v8-architecture.php
A64 是一种支持 AArch64 执行状态的全新 32 位固定长度指令集。下面摘要说明了 A64 ISA 的特性。
基于 5 位寄存器说明符的简洁解码表
指令语义与 AArch32 中大致相同
31 个随时可供访问的通用 64 位寄存器
无模式 GP 寄存器组 - 改进的性能和能耗
程序计数器 (PC) 和堆栈指针 (SP) 非通用寄存器
可用于大多数指令的专用零寄存器
与 A32 的主要差异有:

支持 64 位操作数的新指令  大多数指令可具有 32 位或 64 位参数
地址假定为 64 位大小  P64 和 LLP64 是主要目标数据模型
条件指令远少于 AArch32  条件 {跳转、比较、选择}
无任意长度的加载/存储多重指令  增加了用于处理寄存器对的 LD/ST 'P'
A64 高级 SIMD 和标量浮点支持在语义上类似于 A32 支持;它们共享浮点/向量寄存器文件(V0 至 V31)。A64 提供了 3 项主要功能增强:

更多 128 位寄存器:32 x 128 位宽寄存器;可视为 64 位宽寄存器
高级 SIMD 支持 DP 浮点执行
高级 SIMD 支持完全 IEEE 754 执行;舍入模式、非规范化数字、NaN 处理
有一些针对 IEEE754-2008 的附加浮点指令:

MaxNum/MinNum 指令
使用 RoundTiesAway 的浮点到整数转换
A64 中的寄存器封装模型也不同于 A32:

所有向量寄存器均为 128 位宽,Vx[127:0]:

双精度标量浮点使用 Vx[63:0]
单精度标量浮点使用 Vx[31:0]
回复 支持 反对

使用道具 举报

5#
发表于 2013-9-17 00:42 | 只看该作者
迁移到64位对应用程序的性能冲击是很大的,我说的不是浮点,是整数。

从x86转64的测试数据,供参考:

一些算术密集型的程序性能会增长,SPEC 06里的libquantum涨了30%多

一些喜欢调用小函数的程序会增长,h264ref涨了30%多

一些在循环内部变量多的程序会增长,hmmer涨了30%多

另外就是内存密集型的程序,性能会倒退,倒退十几二十几个百分点。

总体平均是性能增加7%上下
回复 支持 反对

使用道具 举报

6#
 楼主| 发表于 2013-9-17 08:10 来自手机 | 只看该作者
ifu 发表于 2013-9-16 23:39
你以为32->64位就把寄存器变为64位?

http://www.arm.com/zh/products/processors/instruction-set-arch ...

你复制了那么多,还不是我一句话的意思,双精度....话说,你明白啥叫双精度么
回复 支持 反对

使用道具 举报

7#
 楼主| 发表于 2013-9-17 08:14 来自手机 | 只看该作者
本帖最后由 welo000 于 2013-9-17 08:19 编辑
huangpobu 发表于 2013-9-17 00:42
迁移到64位对应用程序的性能冲击是很大的,我说的不是浮点,是整数。

从x86转64的测试数据,供参考:


指令字长增加相当于周期内发射数增加,且不增加预测负担,这种增长是数学的胜利,不需要你摆数据,小学生都能明白火车多了一倍的车节运输总量可以上去
但是,其中还存在吞吐量的问题,总线宽度不上去,l0 l1就那么多,又不设计内存控制器,单靠cpu自己处理,你以为liunx的内核中断调度表是神一般的存在么
回复 支持 反对

使用道具 举报

8#
发表于 2013-9-17 08:20 | 只看该作者
本帖最后由 slice 于 2013-9-17 08:24 编辑
welo000 发表于 2013-9-17 08:14
指令字长增加相当于周期内发射数增加,且不增加预测负担,这种增长是数学的胜利,不需要你摆数据,小学 ...

问题是多了一倍的车厢,本来跑120公里,变成了跑80公里。
不管怎么说,除了大内存能够带来的提升外,64位所能取得的大部分性能提升,其实在32位下也可以实现。

对于1G内存的Iphone来说,其实Android上64位更迫切,呵呵。
回复 支持 反对

使用道具 举报

9#
发表于 2013-9-17 09:57 | 只看该作者
本帖最后由 huangpobu 于 2013-9-17 10:03 编辑
welo000 发表于 2013-9-17 08:14
指令字长增加相当于周期内发射数增加,且不增加预测负担,这种增长是数学的胜利,不需要你摆数据,小学 ...


你根本没明白我的意思。

所谓指令字长增加相当于周期内发射数增加是扯淡,libquantum测出来前端stall增加了40%,但性能最后反超32位 30%多。code density上去了不代表实际发射数就会等价上升。

为什么大量使用函数指针调函数的程序会在64位下跑的更快?这跟指令字长根本无关。跟ISA约定的函数调用方式有关。

你若不是学微架构的,我也就不要求你明白这么多,架构师评估的方式不是看32转64拍脑袋就决定了。如果你是学微架构的,只能为你的老师感到遗憾,他根本就没有教会你一个架构设计评估的基本思维方式是什么。
回复 支持 反对

使用道具 举报

10#
发表于 2013-9-17 10:06 | 只看该作者
争论32 vs 64之前可以先看看这篇文章。

这是4400+ 在SPECint 2006上的实测数据和分析。

做微架构的人是怎么思考的,我认为这篇文章体现的很清楚:定量为上,定性为下。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

11#
 楼主| 发表于 2013-9-17 10:22 来自手机 | 只看该作者
huangpobu 发表于 2013-9-17 09:57
你根本没明白我的意思。

所谓指令字长增加相当于周期内发射数增加是扯淡,libquantum测出来前端stal ...

你扯得再多,在x86 for win上都经历过,效率提升在哪里,更强的分支预测,更高的总线下都搞不定,你以为苹果是火星科技?
回复 支持 反对

使用道具 举报

12#
发表于 2013-9-17 10:22 | 只看该作者
煎饼果子

这个词完美地呈现了果子每次做SoC都是摊了一张大煎饼

天津人民智慧多
回复 支持 反对

使用道具 举报

13#
发表于 2013-9-17 10:25 | 只看该作者
welo000 发表于 2013-9-17 10:22
你扯得再多,在x86 for win上都经历过,效率提升在哪里,更强的分支预测,更高的总线下都搞不定,你以为苹 ...

我先不回答你的问题。

我就问你一句,你学什么的?

如果不是干这行的,我上面对你的指责全部撤销,当我没说,我就换一个你能理解的方式说。

如果你是干这行的,应该很明白做架构评估的准则是什么:量化优先,量化分析出来之前,一切定性都是猜测。结果你在7楼表现的是完全相反的思维方式,以定性抢白定量,如果继续这样下去,你的职业生涯会很危险。
回复 支持 反对

使用道具 举报

14#
发表于 2013-9-17 11:05 | 只看该作者
本帖最后由 largewc 于 2013-9-17 11:10 编辑

arm变成64bit比x86变成64bit意义更大一些,还是那个,arm是定长指令,64bit以后,才能首次让操作数用满32bit,这对于原来的32bit程序来说,代码密度变大了,效率也高了。

32bit的x86,实际cpu内部的定长应该是介于32-64之间的,可以用满32bit。



这在浮点赋值上意义更大,之前的32bit,那是不可能直接一条指令赋值float的。


arm因为这个,性能就可能可以提高10%。
回复 支持 反对

使用道具 举报

15#
发表于 2013-9-17 13:49 | 只看该作者
本帖最后由 ifu 于 2013-9-17 13:52 编辑
welo000 发表于 2013-9-17 08:10
你复制了那么多,还不是我一句话的意思,双精度....话说,你明白啥叫双精度么

扯蛋,啥叫modern instruction set,2x GPRs,2x FPRs?和双精度有毛关系
回复 支持 反对

使用道具 举报

16#
 楼主| 发表于 2013-9-17 15:54 | 只看该作者
ifu 发表于 2013-9-17 13:49
扯蛋,啥叫modern instruction set,2x GPRs,2x FPRs?和双精度有毛关系

麻烦你说下一你对这几个英文的理解
回复 支持 反对

使用道具 举报

17#
发表于 2013-9-17 16:59 | 只看该作者
welo000 发表于 2013-9-17 15:54
麻烦你说下一你对这几个英文的理解

拿几本计算机系统结构、编译原理之类的书读读你就知道了
回复 支持 反对

使用道具 举报

18#
发表于 2013-9-17 18:33 | 只看该作者
看17楼的发言,我明白了为什么说“三天不打,上房揭瓦”是真理。

Hold住,虽然说看见不懂装懂的装逼货色很火大,但是不能吵架。。。。
回复 支持 反对

使用道具 举报

19#
发表于 2013-9-17 21:15 | 只看该作者
welo000 发表于 2013-9-17 15:54
麻烦你说下一你对这几个英文的理解

通用寄存器和浮点寄存器都不知道干啥的么
前者是配个ALU存整数的,后者一般是配合SIMD单元存矢量数据的
回复 支持 反对

使用道具 举报

20#
 楼主| 发表于 2013-9-17 21:56 | 只看该作者
ifu 发表于 2013-9-17 16:59
拿几本计算机系统结构、编译原理之类的书读读你就知道了

问题是我感觉你不知道
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-3-2 00:57

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表