POPPUR爱换

标题: 既然喷神提到了PA团队那我就来验验PA的成色。 [打印本页]

作者: 芦鹏Coolboy    时间: 2013-3-13 14:56
标题: 既然喷神提到了PA团队那我就来验验PA的成色。
本帖最后由 芦鹏Coolboy 于 2013-3-13 15:00 编辑

喷神极为推崇PA团队的swift a6、a7处理器。
这swift 的名头我听过,印象中架构是三发射然后做出了3.x DIMIP/MHZ的性能。跟Krait类似。
喷神之所以推崇PA团队是因为他们中的一部分做出了strongarm。
呵呵strongarm又出自喷神最不齿的inter。
所以查下资料验验PA的成色。
Krait
4 KB / 4 KB L0, 16 KB / 16 KB L1, 512 KB L2
3.3 DIMIP/MHZ
swift  
L1: 32 kB instruction + 32 kB data, L2: 1 MB
3.5 DIMIP/MHZ
Krait与swift 的对比。果粉们可能欢呼雀跃超了Krait0.2DMIPS性能。其实呢swift  L1大了一倍 L2大了一倍 。性能强点正常。谁叫你多吃多占呢,多干点活也正常。隐含的BUG就是NEON位宽竟然是Krait的一半。也可以简单说swift浮点性能是Krait的一半。此PA团队的成色就呼之欲出了。真乃脑残级啊,改了那么多东西NEON竟然忘了改了。哎看来strongarm神话难重现了。
而且貌似A6X的封装尺寸是最大的,没有苹果罩着PA团队估计也会像爱立信那样被各大佬轮着打脸吧。
其实未来移动处理器争锋的关键在于浮点性能,PA这么改凸显PA的短视。

作者: PRAM    时间: 2013-3-13 15:34
DMIPS很扯淡的,其实有SPEC2000的话,比较有说服力
作者: huangpobu    时间: 2013-3-13 15:45
流水线的效率不只是看几发射的。

一般说指令发射都是解码器末端—乱序执行队列的交付能力,从指令缓存开始,它的命中率和延迟,分支预测准确率,到解码宽度,再到发射宽度,以及执行宽度都需要考量,Krait是解码宽度3,发射宽度4,执行宽度7.

混淆解码宽度和发射宽度的一个可能原因是发射对应的原生术语“issue”有时候指解码宽度,真正的发射宽度有时候写作dispatch吧.

NEON这个东西似乎是从A9开始变成选配的?
作者: the_god_of_pig    时间: 2013-3-13 15:49
说起浮点,看那天T神贴的论文里面A9跑specfp是一坨翔
作者: 芦鹏Coolboy    时间: 2013-3-13 15:50
huangpobu 发表于 2013-3-13 15:45
流水线的效率不只是看几发射的。

一般说指令发射都是解码器末端—乱序执行队列的交付能力,从指令缓存开 ...

是选配的不过除了nvdia T2。
几乎没有几个脑残公司阉割。
当然某些工控soc上NENO也属于脑残。
这东西强了比弱了好。否则怎么放1080P 2k啊。
作者: Tempestglen    时间: 2013-3-13 16:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: 芦鹏Coolboy    时间: 2013-3-13 16:07
Tempestglen 发表于 2013-3-13 16:00
哟,krait有种和swift pk 浮点吗?

你这个问题应该引申为swift有种上windows8 或Android吗?
或苹果有种让krait上IOS吗。
否则连统一的测试平台都没有。只能各说个话。
swift 64bit neno
krait 128bit neon
krait 还有多核心各自的电量控制更省电。孰优孰劣不言自明。
作者: Tempestglen    时间: 2013-3-13 16:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: 芦鹏Coolboy    时间: 2013-3-13 16:24
本帖最后由 芦鹏Coolboy 于 2013-3-13 16:29 编辑

http://www.imp3.net/14/show.php?itemid=21707
骁龙600的最终成绩为743 1.9GHz
743*1.3/1.9=508
而且你这图表我表示看不懂。时高时低,最终分数多少啊。
而且我表示这是软件没有为krait优化的跑分结果。而且目标系统是Android。
一个为目标系统充分优化的软件+为特定硬件优化的系统
PK
一个不为目标系统充分优化的软件+不为特定硬件优化的系统
的分数没有代表性
所以最好的平台是WINDOWS8 RT
高通krait已经上了
[size=15.555556297302246px]苹果的swift有胆子脱离老爹的怀抱去客场作战吗?
作者: Tempestglen    时间: 2013-3-13 16:33
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2013-3-13 16:38
提示: 作者被禁止或删除 内容自动屏蔽
作者: 芦鹏Coolboy    时间: 2013-3-13 16:41
Tempestglen 发表于 2013-3-13 16:38
微软怎么会采用apple的soc? apple也不一定会给。

照这么说,高通也没有胆子上ios设备。

呵呵这是高通想不想够不够胆子上的事吗?
明显是苹果让不让的事。
好像有传言说苹果廉价版会用高通的U到时候再看吧。
作者: Tempestglen    时间: 2013-3-13 16:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: the_god_of_pig    时间: 2013-3-13 17:12
就测cpu的实际浮点性能而言Linpack娱乐性比Geekbench还高
作者: koppie    时间: 2013-3-14 08:17
Krait有L0啊,三级缓存结构啊,怎么能和二级结构的swift直接比呢

NEON在A9是选配的。话说这些SIMD指令集扩展,编译器一般无法有效利用,只能手动插入汇编才能优化得比较好。而且SOC的设计思路更改很大,音频视频图像都有专用的处理器

swift的浮点好像是支持VFPv4和NEON v2的
作者: koppie    时间: 2013-3-14 08:18
芦鹏Coolboy 发表于 2013-3-13 16:24
http://www.imp3.net/14/show.php?itemid=21707
骁龙600的最终成绩为743 1.9GHz
743*1.3/1.9=508

你以为android没有为这几种常见的SOC优化?哈哈哈
作者: 芦鹏Coolboy    时间: 2013-3-14 11:06
koppie 发表于 2013-3-14 08:17
Krait有L0啊,三级缓存结构啊,怎么能和二级结构的swift直接比呢

NEON在A9是选配的。话说这些SIMD指令集 ...

1都是CPU怎么不能比。按你的意思AMD和inter的Cpu根本没法比因为结构不一样。
2SIMD不能直接用我嚓。你还停留在ARM9时代。插入汇编也是利用的方式好不好。
3Android是建立于通用cpu之上的。不可能为某种cpu特别优化。优化也指的是通用A8-A9什么的。
作者: huangpobu    时间: 2013-3-14 12:32
芦鹏Coolboy 发表于 2013-3-14 11:06
1都是CPU怎么不能比。按你的意思AMD和inter的Cpu根本没法比因为结构不一样。
2SIMD不能直接用我嚓。你还 ...

这个,插入汇编实在是麻烦。我平时是钻研一些奇技淫巧喜欢学习这个方面,但是问去公司里做软件的同学都说项目时间都不一定赶得及,还用汇编抠代码,属于自掘坟墓。不到不得已,谁会去用汇编啊
作者: koppie    时间: 2013-3-15 05:41
芦鹏Coolboy 发表于 2013-3-14 11:06
1都是CPU怎么不能比。按你的意思AMD和inter的Cpu根本没法比因为结构不一样。
2SIMD不能直接用我嚓。你还 ...

内存系统是一个hierachy,三级的缓存系统和二级的缓存系统是有区别的。Nehalem的L1/L2都比Core 2要小

插入汇编只适用于特别短但是耗时却最长的部分,这种手动优化的方式人力成本高昂

Android通用?为什么好多机子半年也用不上新系统。。。。
作者: 芦鹏Coolboy    时间: 2013-3-15 10:42
koppie 发表于 2013-3-15 05:41
内存系统是一个hierachy,三级的缓存系统和二级的缓存系统是有区别的。Nehalem的L1/L2都比Core 2要小

...

假如你有所有厂商官方驱动+bootloader那所有机型同步移植android版本是轻而易举的事情。
这才是很多机子半年或永久用不上新系统的原因。
插入汇编这事 看需求了 扯界面的用属于蛋疼。做游戏搞视频的不用属于水平低。
作者: Tempestglen    时间: 2013-9-11 17:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: asdf567    时间: 2013-9-11 19:25
反正果子又是摊了一张大煎饼
作者: the_god_of_pig    时间: 2013-9-11 19:49
Tempestglen 发表于 2013-9-11 17:39
LZ还在吗?先读读Strongarm的历史,再看看今天的Swift a7,你还能笑出来?

本人预测Iphone5S Swif ...

某塞钱跑分+苹果PPT就高潮到找不着北了啊?

还等什么A7,按照某苹果mark,A6跑物理测试分数是A5 3.5倍,IPC早就"超过"A57了
作者: Tempestglen    时间: 2013-9-11 20:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: 芦鹏Coolboy    时间: 2013-9-12 22:08
Tempestglen 发表于 2013-9-11 17:39
LZ还在吗?先读读Strongarm的历史,再看看今天的Swift a7,你还能笑出来?

本人预测Iphone5S Swif ...

我简单帮你算一下A7的处理器性能
1.7/1.3=1.3076
1.53*1.3076=2
3.5DMIPS*1.53=5.355DMIPS
而wiki上A57的性能最高应为 4.76
http://en.wikipedia.org/wiki/List_of_ARM_microprocessor_cores
At least 4.1 DMIPS/MHz per core (Up to 4.76 DMIPS/MHz depending on implementation).
所以结果只可能有一个就是苹果吹水。

作者: 芦鹏Coolboy    时间: 2013-9-12 22:26
而且苹果贸然的启动ARMv8架构。虽然在参数上领先。但在每瓦性能比上是否像现在A15已上市这些手机一样坑爹就待观察。不要成为下一个爱斯基摩版手机。高性能时坚持不了2秒就自动降频。
像T4风扇机一样就搞笑了。
作者: Tempestglen    时间: 2013-9-13 08:29
提示: 作者被禁止或删除 内容自动屏蔽
作者: dennyq    时间: 2013-9-13 09:29
Tempestglen 发表于 2013-3-13 16:00
哟,krait有种和swift pk 浮点吗?

T神,IOS能不能跑Spec2000呀?
作者: raini    时间: 2013-9-13 09:38
Tempestglen 发表于 2013-9-13 08:29
只能是apple吹水,就不能是apple水平高?
谁告诉你apple自己的微架构同频一定不超过公版的Cortex A57了? ...

谁告诉你apple自己的微架构同频一定超过公版的Cortex A57了?上帝告诉你的?
哦,对,我等是凡人,跟上帝开不了茶话会
作者: 三刀流    时间: 2013-9-13 14:52
怎么天天都有战斗打响呢。。。
作者: huangpobu    时间: 2013-9-13 20:07
连PA semi都不放在眼里。这个叫芦鹏coolboy的人是什么来头?

当年PA semi的工程VP,Jim Keller是这个世界上最强大的CPU架构师(可能没有之一),参与设计过两代Alpha处理器,X86-64 ISA的起草者之一,AMD K8的首席架构师,Apple A4,A5芯片主管,现在看AMD快不行了,又跑回AMD救火去了。

DMIPS这种东西也就是骗骗外行。多少年前的代码了,还拿来做benchmark
作者: 芦鹏Coolboy    时间: 2013-9-13 20:56
huangpobu 发表于 2013-9-13 20:07
连PA semi都不放在眼里。这个叫芦鹏coolboy的人是什么来头?

当年PA semi的工程VP,Jim Keller是这个世界 ...

事实摆在眼前 自己看第一页 用自己的脑子好好想想 。
我不知道你所云的这几个人是谁我只知道所谓优秀的手机soc架构应该是
1 结构合理没有明显短板 2性能强大而又兼顾高效能
你自己喜欢拜神是你的事
鄙人不才也算用过PA的东西SA110那时真是优秀极了。我从来没说过SA110不优秀。
你自己好好想想假如PA不在苹果 它的 A4 A5 A6 A7与众厂商soc同台竞技能活下去吗?
所谓优秀的PA其实是优秀的苹果。苹果用那家的soc都能让这家赚得盆满钵满。
又回到前一个帖子的问题但凡技术上成功的企业总能找到适合自己的市场空间。
PA技术上是成功的但远达不到优秀的地步。在A9时代KITA是最优秀的架构所以市场空间最大。
A15 PA没玩直接跃到A57时代。现在没有任何可供对比的架构所以不做评论,
但根据苹果的宣传口径吹水是无疑的了。
作者: raini    时间: 2013-9-13 22:09
Tempestglen 发表于 2013-9-11 17:39
LZ还在吗?先读读Strongarm的历史,再看看今天的Swift a7,你还能笑出来?

本人预测Iphone5S Swif ...

回顾历史?
哈哈哈,跟算盘大国是一个表现。
作者: huangpobu    时间: 2013-9-14 00:16
芦鹏Coolboy 发表于 2013-9-13 20:56
事实摆在眼前 自己看第一页 用自己的脑子好好想想 。
我不知道你所云的这几个人是谁我只知道所谓优秀的手 ...

我说了,DMIPS是扯淡。

这个东西延用到现在完全是流毒,连SPEC都不见得能让每个人心服口服的时代里,DMIPS这个东西是根本不能说明任何问题的。
作者: huangpobu    时间: 2013-9-14 00:29
本帖最后由 huangpobu 于 2013-9-14 00:48 编辑
芦鹏Coolboy 发表于 2013-9-13 20:56
事实摆在眼前 自己看第一页 用自己的脑子好好想想 。
我不知道你所云的这几个人是谁我只知道所谓优秀的手 ...

你根本不具备评点一个架构是否优秀的能力,我给你出的那道题你都不敢接,分支预测器只是架构前端里面的一个组件,一个组件你都搞不定,谈什么架构。
第一页的帖子硬伤累累,首先用DMIPS就犯了大忌,其次比较缓存看大小还完全忽略了Krait L0 cache,哪家公司雇你去做架构分析那就是倒闭的节奏。

我从未见过哪个架构师对着缓存大小和DMIPS就敢估计性能。没有量化分析数据,不可能做什么评估。





欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4