POPPUR爱换

标题: 水果A7处理器部分资料 [打印本页]

作者: 66666 时间: 2013-9-11 07:42
标题: 水果A7处理器部分资料
本帖最后由 66666 于 2013-9-11 07:43 编辑

基于ARMv8指令集独立设计，自称是第一个64bit手机（不知道ATOM手机版是不是支持），支持LPDDR3。

die size：102mm2，10亿晶体管。从晶体管密度看应该是28nm，而非之前传闻的intel 22nm。

具体性能测试估计这2天鬼佬们就会放出来，A7的一大卖点touch id使用专门协处理器跟MOTO所谓X8概念类似，虽然A7用了powerVR6但是对于GPGPU部分基本没有提到，GPGPU在手机上基本还是处于连概念都算不上的阶段。

作者: Tempestglen 时间: 2013-9-11 07:51
提示: 作者被禁止或删除内容自动屏蔽

作者: Tempestglen 时间: 2013-9-11 07:56
提示: 作者被禁止或删除内容自动屏蔽

作者: ifu 时间: 2013-9-11 08:00
虽未见具体测评，但看A7这架势秒A15 S800坨坨的。。。大水果威武，IPC不说定还真提升30%

作者: Tempestglen 时间: 2013-9-11 08:12
提示: 作者被禁止或删除内容自动屏蔽

作者: frankincense 时间: 2013-9-11 08:26
Atom Z2580/Z2760都阉割了x64的支持

作者: xreal 时间: 2013-9-11 08:29

难道是台基电的28?

作者: muramasa 时间: 2013-9-11 08:35
如果die size正确的话不像是28nm啊
snb是995M cpu/1160M total 216mm2@32nm
A7如果是1000M 102mm2 那么应该是20或者22nm了

作者: ifu 时间: 2013-9-11 08:38

muramasa 发表于 2013-9-11 08:35
如果die size正确的话不像是28nm啊
snb是995M cpu/1160M total 216mm2@32nm
A7如果是1000M 102mm2 那么应 ...

应该是28nm，参考一下28nm的显卡核心晶体管密度。
至于是不是台积电就不好说了

作者: xreal 时间: 2013-9-11 08:40

intel 的话肯定是22工艺。。。

作者: ifu 时间: 2013-9-11 08:43

Tempestglen 发表于 2013-9-11 08:12
Arm v8指令集， register都double了，苹果的微架构设计能力本来就超英国arm公版，过去的史上最强arm就是 ...

估计下代得靠double cpu核数来double性能，否则核数不变double性能的话 IPC都快赶上桌面处理器了

作者: sim0831 时间: 2013-9-11 08:51
本帖最后由 sim0831 于 2013-9-11 08:52 编辑

A7还是三星28nm
而明年A8确认就是台积电20nm了

话说今日9/11英特尔也要发布BayTrail了，到底22nm Atom支不支持x64(64bit)啊？

作者: frankincense 时间: 2013-9-11 08:53

sim0831 发表于 2013-9-11 08:51
A7还是三星28nm
而明年A8确认就是台积电20nm了

BayTrail-D/M基本都应该支持，BayTrail-T很可能支持，Merrifield就难说了

作者: 66666 时间: 2013-9-11 08:54
本帖最后由 66666 于 2013-9-11 08:56 编辑

muramasa 发表于 2013-9-11 08:35
如果die size正确的话不像是28nm啊
snb是995M cpu/1160M total 216mm2@32nm
A7如果是1000M 102mm2 那么应 ...

GK104：294mm2，35.6亿。明显就是28nm，台积电代工的可能性很大，当然三星也很有可能。

作者: asdf567 时间: 2013-9-11 08:56

frankincense 发表于 2013-9-11 08:53
BayTrail-D/M基本都应该支持，BayTrail-T很可能支持，Merrifield就难说了

x64支持并无必要啊，暂时还用不着那些寻址

作者: PRAM 时间: 2013-9-11 08:57
SLIVERMONT是完全的64B了 A7 GPU据说是G6400

作者: xreal 时间: 2013-9-11 08:59

貌似很强，机器出货了拿3dmark测试下。。。

作者: 66666 时间: 2013-9-11 09:02

asdf567 发表于 2013-9-11 08:56
x64支持并无必要啊，暂时还用不着那些寻址

这个很难说，现在note3已经用上了3GB内存，不出意外明年旗舰android手机上4GB的可能性相当大，android系统也会相应跟进。

作者: huangpobu 时间: 2013-9-11 09:06

ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能，否则核数不变double性能的话 IPC都快赶上桌面处理器了

即便是Cortex-A15, Apple A7, 前后端宽度 OoO窗口大小都离Core还有一截，谈何IPC快赶上桌面处理器。

再退一步，跨ISA用IPC衡量性能是大忌中的大忌。麻烦少扯淡。

作者: ifu 时间: 2013-9-11 09:06

66666 发表于 2013-9-11 09:02
这个很难说，现在note3已经用上了3GB内存，不出意外明年旗舰android手机上4GB的可能性相当大，android系统 ...

按照猴机的尿性有了64bits CPU必然上 4GB...
不过手机追求大内存实在蛋痛，我现在1GB 也没觉得有啥不够用的

作者: 66666 时间: 2013-9-11 09:13

ifu 发表于 2013-9-11 09:06
按照猴机的尿性有了64bits CPU必然上 4GB...
不过手机追求大内存实在蛋痛，我现在1GB 也没觉得有啥不够用 ...

1GB哪够用，现在开机基本就要吃掉700M，开个UCweb和微信就只剩下百把M

2GB已经是最基本了。

作者: ifu 时间: 2013-9-11 09:19

huangpobu 发表于 2013-9-11 09:06
即便是Cortex-A15, Apple A7, 前后端宽度 OoO窗口大小都离Core还有一截，谈何IPC快赶上桌面处理器。

再 ...

理解力堪忧，有提A7？劝你赶紧去读书好好学习才是正道

作者: ifu 时间: 2013-9-11 09:25

66666 发表于 2013-9-11 09:13
1GB哪够用，现在开机基本就要吃掉700M，开个UCweb和微信就只剩下百把M

2GB已经是最基本了。

够了，一般也就用用微信玩玩QQ斗地主之类
我这启动开了微信还能剩 300MB

作者: xreal 时间: 2013-9-11 09:38

2g内存win7都能流畅运行了，安卓优化实在是太渣。

作者: PS5 时间: 2013-9-11 09:53
为何这次发布会对GPU部份只字未提呢？是不是GPU部份没有提升呢？

作者: 66666 时间: 2013-9-11 09:55

PS5 发表于 2013-9-11 09:53
为何这次发布会对GPU部份只字未提呢？是不是GPU部份没有提升呢？

有提到，只是笼统的说比5快一倍

作者: 66666 时间: 2013-9-11 09:58

xreal 发表于 2013-9-11 09:38
2g内存win7都能流畅运行了，安卓优化实在是太渣。

客观的说，2GB跑win7只能说做到能用，离流畅还差不少。

我开机开个QQ+chrome内存占用都上3GB了

作者: PS5 时间: 2013-9-11 10:06

66666 发表于 2013-9-11 09:55
有提到，只是笼统的说比5快一倍

只快一倍也太少了吧，有史以来首次啊，估计和PSV的GPU一样了

作者: CC9K 时间: 2013-9-11 10:19

asdf567 发表于 2013-9-11 08:56
x64支持并无必要啊，暂时还用不着那些寻址

硬件布局自然要比软件提前很多，要不然以软件转64位的速度根本来不及，PC就算到现在X64软件也不普及

作者: dennyq 时间: 2013-9-11 10:24

ifu 发表于 2013-9-11 09:06
按照猴机的尿性有了64bits CPU必然上 4GB...
不过手机追求大内存实在蛋痛，我现在1GB 也没觉得有啥不够用 ...

多任务1g严重不够用，尤其andriod系统。我gs2 常常爆内存，安装的程序还不多.

作者: slice 时间: 2013-9-11 10:27
本帖最后由 slice 于 2013-9-11 10:30 编辑

CC9K 发表于 2013-9-11 10:19
硬件布局自然要比软件提前很多，要不然以软件转64位的速度根本来不及，PC就算到现在X64软件也不普及

关键是32=>64本身能够带来什么样的提升。
例如Winrar32=>64貌似不到10%。
其他很多也性能也是SSE2，NEON之类的了。
想来想去，64位的根本意义还是在于大内存的支持。

像PS这些，64相对32位版本可能带来的性能数倍提升更多是因为大内存的支持。
如果说2G内存装64位系统装64位PS，其实，也就，呵呵。
你说QQ这些维护个64位版本，除了多占点内存，没啥意义呀。

作者: largewc 时间: 2013-9-11 10:29

66666 发表于 2013-9-11 09:58
客观的说，2GB跑win7只能说做到能用，离流畅还差不少。

我开机开个QQ+chrome内存占用都上3GB了

chrome也用了类似linux那种线程机制了，新线程会完全复制一块内存继续使用，这玩意及其消耗内存，你一个页面因为flash之类到了400m，新开一个页面开始就是400m。

ie貌似不是用这个，所以内存使用少很多，不过貌似没有chrome流畅。

现在ie11内存少的有点令人害怕，总觉得不真实。

作者: slice 时间: 2013-9-11 10:33
本帖最后由 slice 于 2013-9-11 10:38 编辑

largewc 发表于 2013-9-11 10:29
chrome也用了类似linux那种线程机制了，新线程会完全复制一块内存继续使用，这玩意及其消耗内存，你一个页 ...

速度来说，我觉得IE11页面渲染有比Chrome快的感觉。
但觉得有些问题，例如文本框会一定几率出现黑块刷新才好。
关闭高级设置里面的GPU加速就正常了。
或许是显卡驱动没有跟进某些特性(WDDM1.3)？

作者: largewc 时间: 2013-9-11 10:34

slice 发表于 2013-9-11 10:33
速度来说，我觉得IE11页面渲染有比Chrome快的感觉。
但觉得有些问题，例如文本框会一定几率出现黑块刷新 ...

我也发现了，或许是因为ie11测试还不够，反正性能11确实不错了，我已经不想用回chrome了

不过这个多谢哈，原来关闭gpu就好了，哈哈

作者: ifu 时间: 2013-9-11 10:45

PS5 发表于 2013-9-11 10:06
只快一倍也太少了吧，有史以来首次啊，估计和PSV的GPU一样了

之前4s到5也是只快一倍，GPU早就比PSV强了

作者: acqwer 时间: 2013-9-11 10:45

slice 发表于 2013-9-11 10:27
关键是32=>64本身能够带来什么样的提升。
例如Winrar32=>64貌似不到10%。
其他很多也性能也是SSE2，NEO ...

X86的32到64提升不高是因为AMD高的那个X64扩展的问题，16位应用到32位应用的提升还是非常大的

作者: ifu 时间: 2013-9-11 10:47
本帖最后由 ifu 于 2013-9-11 10:47 编辑

slice 发表于 2013-9-11 10:27
关键是32=>64本身能够带来什么样的提升。
例如Winrar32=>64貌似不到10%。
其他很多也性能也是SSE2，NEO ...

32=>64和性能提升没有必然联系

作者: largewc 时间: 2013-9-11 10:47

ifu 发表于 2013-9-11 10:45
之前4s到5也是只快一倍，GPU早就比PSV强了[sweatingbullets>

iphone5还是没有吧，ipad是超过了psv。

作者: Tempestglen 时间: 2013-9-11 10:49
提示: 作者被禁止或删除内容自动屏蔽

作者: slice 时间: 2013-9-11 10:53
本帖最后由 slice 于 2013-9-11 11:01 编辑

acqwer 发表于 2013-9-11 10:45
X86的32到64提升不高是因为AMD高的那个X64扩展的问题，16位应用到32位应用的提升还是非常大的

我倒不觉得是x64扩展的问题。
主要还是因为，32位也早已不是什么x87。
所需要的性能，早已通过SSE2之类等获得。
到64位并无本质不同。
例如什么双精度的浮点运算早就可以高效的完成。
弄一个所谓的真64位，也不见得更快。
ISA已不是决定性因素，最终还是取决于处理器的微架构。
是否可以这样子理解？

作者: ifu 时间: 2013-9-11 10:54

largewc 发表于 2013-9-11 10:47
iphone5还是没有吧，ipad是超过了psv。

ipad3就已经用上PowerVR SGX543MP4
iphone5 GPU性能和ipad3差不多

作者: Tempestglen 时间: 2013-9-11 10:54
提示: 作者被禁止或删除内容自动屏蔽

作者: largewc 时间: 2013-9-11 10:56

ifu 发表于 2013-9-11 10:54
ipad3就已经用上PowerVR SGX543MP4
iphone5 GPU性能和ipad3差不多

iphone5是略微砍版的应该是，记得比psv略差点的。

这次应该超过了

作者: PS5 时间: 2013-9-11 11:01

ifu 发表于 2013-9-11 10:45
之前4s到5也是只快一倍，GPU早就比PSV强了[sweatingbullets>

5的GPU是三核的比起PSV的四核还是差不少

作者: ifu 时间: 2013-9-11 11:02
本帖最后由 ifu 于 2013-9-11 11:03 编辑

largewc 发表于 2013-9-11 10:56
iphone5是略微砍版的应该是，记得比psv略差点的。

这次应该超过了

配置差一点但A6是 32nm PSV 45nm，A6可以跑更高的主频，所以最终性能比PSV强没啥问题
A5X是PowerVR SGX543MP4 45nm 这玩意和PSV规格更接近
A6是PowerVR SGX543MP3 32nm
但A6图形性能和A5X一样，工艺进步带来的频率进步弥补了规格差异

作者: largewc 时间: 2013-9-11 11:06

ifu 发表于 2013-9-11 11:02
配置差一点但A6是 32nm PSV 45nm，A6可以跑更高的主频，所以最终性能比PSV强没啥问题
A5X是PowerVR SGX5 ...

那里说苹果的频率更高了，找个链接看看？

psv空间更大，厚度比pad都厚多了，本身散热可提供的空间就大，sony提供一定的更高频率空间并不是没有。

作者: acqwer 时间: 2013-9-11 11:13

slice 发表于 2013-9-11 10:53
我倒不觉得是x64扩展的问题。
主要还是因为，32位也早已不是什么x87。
所需要的性能，早已通过SSE2之类 ...

X64扩展的太保守了，至少寄存器应该多加些，本来X86的寄存器就偏少。

作者: largewc 时间: 2013-9-11 11:16
本帖最后由 largewc 于 2013-9-11 11:23 编辑

acqwer 发表于 2013-9-11 11:13
X64扩展的太保守了，至少寄存器应该多加些，本来X86的寄存器就偏少。

我觉得意义不大，寄存器增加，x86不是risc。

应该x86现在都有内存重命名技术(没找到intel资料只知道全美达很早就支持这个东西了)，加上寄存器重命名，配合编译器的处理，前端寄存器数量不是什么核心的瓶颈问题。

根据我的代码测试，猜测core应该也支持内存重命名，实际就是大部分内存直接操作已经被编译器的一些优化排布，加上cpu重命名为寄存器操作了，内存实际上是延时写入的，一段时间内内存操作都是寄存器操作，实际x86可用的后端寄存器数量根本不存在问题。

作者: leangelle 时间: 2013-9-11 11:28
提示: 作者被禁止或删除内容自动屏蔽

作者: ifu 时间: 2013-9-11 11:46

largewc 发表于 2013-9-11 11:06
那里说苹果的频率更高了，找个链接看看？

psv空间更大，厚度比pad都厚多了，本身散热可提供的空间就大 ...

A6 SGX543MP3@266MHz
A5X SGX543MP4@200MHz

PSV电池塞了8Whr
ipad3电池塞了43.0Whr
sony敢设更高频率？

作者: darkangel308 时间: 2013-9-11 12:43

acqwer 发表于 2013-9-11 10:45
X86的32到64提升不高是因为AMD高的那个X64扩展的问题，16位应用到32位应用的提升还是非常大的

不是扩展的问题，而是32位已经满足大部分需求，所以64位体现不出优势，写代码的都知道，一般情况下32位整型已经够用了，需要用到64位整型的情况其实不多

作者: PS5 时间: 2013-9-11 13:53
谁能说一下这个OPENGL ES3.0有什么新东西吗？

作者: huangpobu 时间: 2013-9-11 14:13

ifu 发表于 2013-9-11 09:19
理解力堪忧，有提A7？劝你赶紧去读书好好学习才是正道

被踢了一脚就缩回去了说自己没提A7，呵呵。

用得着这么怕我吗。

作者: huangpobu 时间: 2013-9-11 14:29

ifu 发表于 2013-9-11 09:19
理解力堪忧，有提A7？劝你赶紧去读书好好学习才是正道

＂虽未见具体测评，但看A7这架势秒A15 S800坨坨的。。。大水果威武，IPC不说定还真提升30%＂

这是你的原帖，转头就声称自己没提A7，这耳光够响吧？

作者: asdf567 时间: 2013-9-11 15:13

PS5 发表于 2013-9-11 13:53
谁能说一下这个OPENGL ES3.0有什么新东西吗？

这个完全不是新东西吧

作者: PS5 时间: 2013-9-11 15:17

asdf567 发表于 2013-9-11 15:13
这个完全不是新东西吧

比ES2.0多了哪些新东西啊？

作者: ifu 时间: 2013-9-11 15:23

huangpobu 发表于 2013-9-11 14:13
被踢了一脚就缩回去了说自己没提A7，呵呵。

ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能，否则核数不变double性能的话 IPC都快赶上桌面处理器了

-------------------------------------------------------------------------------------------------------------------------------------------------
知道什么叫下一代？是A7？别在这里丢人现眼，疯狗病得治。
艹，现在计算所都招些啥破小孩实习

作者: raini 时间: 2013-9-11 15:37

ifu 发表于 2013-9-11 15:23
ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能，否则核数不变double性能的话 IP ...

我对你的专业素养和瞧不起人的姿势非常敬佩，请问你哪个单位的？

作者: huangpobu 时间: 2013-9-11 16:24

ifu 发表于 2013-9-11 15:23
ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能，否则核数不变double性能的话 IP ...

装逼被踹破还这么嚣张，反正我把两个帖子引在一起每个人都看得清清楚楚。

如果我是你就会收敛一点，不仅编译不懂，微架构也不懂，有几分能耐说几分话，记住这个教训。

作者: sim0831 时间: 2013-9-11 16:27
20nm A8肯定直上四核，又一次的double性能

作者: huangpobu 时间: 2013-9-11 16:40

ifu 发表于 2013-9-11 15:23
ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能，否则核数不变double性能的话 IP ...

我接触的老师无一不告诉我这个道理：有几分能耐说几分话。

我极少评论design，device，process的领域，OS，compiler我也很少评价他人如何，都是因为我不懂，我从不讳言这些东西我不熟（至少不如arch熟），更别提在看不懂别人东西的情况下大放阙词。

倒是以你为代表的某些人，四处充大拿，发言浑身上下都是孔，几乎我逮住一个就能喷一个，自己不懂又喜欢把话说大，不是伸着脸让人抽是什么？

作者: zhen179 时间: 2013-9-11 17:00
我绝对是弄不明白，就这样骂来骂去，到底是学术讨论，还是辩论会，还是角斗场~~~ 实在是太不像话，到头来一个个还都举牌投诉举报，造成这样的气氛，究竟该由谁来负责~~~ 我被这里的朋友痛斥为不可理喻，但我就是这样的，遇上开口闭口动不动就要骂人的，我就是不予理睬，远远地避开他~~~ 但这里的做法跟我不一样，而是迎头而上，也不想一想，这骂人谁输谁赢啊，但是这给咱们坛子却造成非常不好的影响~~~ 所以啊，我期盼着不希望看到骂人现象再这样持续下去的朋友，主动避让，再次强调，咱们在这里只说理，而不得冲着人去~~~

作者: huangpobu 时间: 2013-9-11 17:03
A7和之前的芯片性能增长确实非常快，一方面是Apple本身给力，另一方面是低功耗的处理器在性能上起点比较低，要提高是相对来说比较容易的（但也只是相对而已，实际工程难度只有做的人才知道）

ISA属于软硬件接口层，从32到64，从定性上来说有利于提高性能，但从定量上来说，影响可能很小。我以前眼界不够宽，还停留在ISA决胜的年代，后来看了今年HPCA那篇CISC vs RISC的文章就彻底放下了，ISA上能做的变化据我所知是不多了，主要是下层实现的细节和上层如何利用。

不过别说，刚开始的时候RISC是非常有优势的，伯克利分校David Patterson的组做的RISC芯片差不多真就是研究生毕业设计的样子，从研究生课程上开始着手的RISC项目，用大幅落后的工艺和主频击败了当时Intel的商用处理器。

作者: ifu 时间: 2013-9-11 17:17
本帖最后由 ifu 于 2013-9-11 17:17 编辑

huangpobu 发表于 2013-9-11 16:24
装逼被踹破还这么嚣张，反正我把两个帖子引在一起每个人都看得清清楚楚。

如果我是你就会收敛一点，不 ...

huangpobu

新手会员
帖子299积分1We用劵0 张注册时间2012-12-24最后登录2013-9-11
19#
发表于：2013-9-11 09:06:31 [离线] 发消息给贴主 |只看该作者
ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能，否则核数不变double性能的话 IPC都快赶上桌面处理器了----------------------------------------------------------------------------------------------------------------------------------

即便是Cortex-A15, Apple A7, 前后端宽度 OoO窗口大小都离Core还有一截，谈何IPC快赶上桌面处理器。

再退一步，跨ISA用IPC衡量性能是大忌中的大忌。麻烦少扯淡。

------------------------------------------------------------------------------------------------------------------
标红了，还理解不了的话只能替带你的老师默哀

作者: largewc 时间: 2013-9-11 17:18

ifu 发表于 2013-9-11 17:17
huangpobu

新手会员

你明确说吧，装高深没意义

作者: ifu 时间: 2013-9-11 17:22
本帖最后由 ifu 于 2013-9-11 17:28 编辑

largewc 发表于 2013-9-11 17:18
你明确说吧，装高深没意义

这和高深不搭界，基于一般逻辑的假设性推论。
前面都有人几个人都提了A8，可见也不是人人都如它般理解力低下

作者: largewc 时间: 2013-9-11 17:31

ifu 发表于 2013-9-11 17:22
这和高深不搭界，基于一般逻辑的假设性推论。
前面都有人几个人都提了A8，可见也不是人人都如它般理解力 ...

armv8？这玩意能有什么加强？

作者: ifu 时间: 2013-9-11 17:33

largewc 发表于 2013-9-11 17:31
armv8？这玩意能有什么加强？

不是ARMv8
仅是按照水果目前每代cpu性能翻番的趋势 yy比A7强一倍的A8

作者: largewc 时间: 2013-9-11 17:37

ifu 发表于 2013-9-11 17:33
不是ARMv8
仅是按照水果目前每代cpu性能翻番的趋势 yy比A7强一倍的A8

反正我是不信的，没任何道理可言，等真机出来再说。

作者: PS5 时间: 2013-9-11 19:36
这个ES3.0比起ES2.0多了哪些新东西呢？

作者: Tempestglen 时间: 2013-9-11 20:45
提示: 作者被禁止或删除内容自动屏蔽

作者: badchris 时间: 2013-9-11 20:57
提示: 作者被禁止或删除内容自动屏蔽

作者: Tempestglen 时间: 2013-9-11 21:03
提示: 作者被禁止或删除内容自动屏蔽

作者: huangpobu 时间: 2013-9-11 21:04

ifu 发表于 2013-9-11 17:22
这和高深不搭界，基于一般逻辑的假设性推论。
前面都有人几个人都提了A8，可见也不是人人都如它般理解力 ...

真服了你了，越来越没有下限，现在当着这么多人面造谣？

你的帖子在11楼，去前面10楼仔细翻一下，

有一个人提A8，我给你磕头，没有人提A8，你给我磕头，敢不敢赌？

作者: huangpobu 时间: 2013-9-11 21:08

ifu 发表于 2013-9-11 17:17
huangpobu

新手会员

你我之间专业实力差距太远，我姑且让你一万步，即便A8 IPC 超过 Core 10000倍，这两者之间的IPC也不具备可比性。

跨ISA比较IPC是大忌中的大忌，你当我这话是白说的？

作者: badchris 时间: 2013-9-11 21:13
提示: 作者被禁止或删除内容自动屏蔽

作者: Tempestglen 时间: 2013-9-11 21:40
提示: 作者被禁止或删除内容自动屏蔽

作者: Tempestglen 时间: 2013-9-11 21:41
提示: 作者被禁止或删除内容自动屏蔽

作者: ifu 时间: 2013-9-11 21:48

huangpobu 发表于 2013-9-11 21:04
真服了你了，越来越没有下限，现在当着这么多人面造谣？

你的帖子在11楼，去前面10楼仔细翻一下，

我67#提的前面，这都尼玛什么智商理解力？无下限

作者: ifu 时间: 2013-9-11 21:55

Tempestglen 发表于 2013-9-11 20:45
20nm时代会有3Ghz的arm，配合IPC的些许提升，单核性能再次double很有可能。
京时间7月11日消息，据科技 ...

3Ghz就算了，还是先看看A7的发热功耗

作者: badchris 时间: 2013-9-11 21:59
提示: 作者被禁止或删除内容自动屏蔽

作者: badchris 时间: 2013-9-11 22:07
提示: 作者被禁止或删除内容自动屏蔽

作者: Tempestglen 时间: 2013-9-11 23:28
提示: 作者被禁止或删除内容自动屏蔽

作者: huangpobu 时间: 2013-9-11 23:46

ifu 发表于 2013-9-11 21:48
我67#提的前面，这都尼玛什么智商理解力？无下限

好，这不重要，我就爽快直接认了你说的A8.

可是无论A8还是A80，又怎么样？

给你出几个思考题：

同级别处理器跑SPEC2006 FP，ARM阵营的IPC乘以1.5，性能都赶不上x86，请问为什么？在这种情况下对比IPC是否公平？不公平的原因在哪里？

跑SPEC2006 int, Atom要多跑差不多30%的micro-ops才能完成与SandyBridge一样的任务，请问为什么？在这种情况下对比IPC是否公平？不公平的原因在哪里？

以上这组问题有助你想明白跨ISA比较IPC有什么弊病。

SandyBridge的架构牛不牛逼？流水线最窄的地方也有4个mirco-up的宽度，但它在各大benchmark中的平均IPC只有1.4+，这说明什么？

以上这个问题有助你想明白膜拜IPC会有什么后果。

作者: raini 时间: 2013-9-11 23:52
本帖最后由 raini 于 2013-9-11 23:52 编辑

Tempestglen 发表于 2013-9-11 23:28
没用，你们这些所谓的行家以为看些文章就解决问题了？
大行家Pram说A7不是64位，还说A7主要是gpu改进，P ...

总比一个SB装专家，装预言家强！

作者: badchris 时间: 2013-9-12 00:06
提示: 作者被禁止或删除内容自动屏蔽

作者: huangpobu 时间: 2013-9-12 00:51

badchris 发表于 2013-9-12 00:06
[tongue>原来CPU区还不如显卡区的两派……人家怎么不拿Tahiti和Kepler比IPC呢，佩服佩服

哈哈，这个说得好。

我多讲一点儿八卦吧。

上世纪80年代末，90年代初，学术界工业界都崇拜IPC，想方设法提高IPC，乱序，多发射，激进的分支预测，当时多发射疯狂到什么程度，大家都假设以后会发展出15发射，20发射的怪兽CPU，还别笑，不少大佬都是这么认为的，分支预测，疯狂到什么程度，每个周期同时预测多个分支，这可是平方级的复杂度，那种技术在我出生的年代就发明出来了，可惜现在也没有一个商业处理器采用它。

到了90年代中后期，开始有一些比较有先见之明的人发现不对了。当时DEC Alpha的主架构师Richard Sites，写了一篇文章，里面透露了一个很颠覆性的结果，当时做的比较好的架构，大致是P6这样的，乱序三发射（？可能记忆有误，但是至少也有双发射），理想状况下IPC应该接近3，至少也要超过2吧，结果实测一下，0.25还不到。

追求IPC把整个业界引上了一条错误轨道，有一些人就开始反思，整个系统的瓶颈到底在哪里，IPC是否能作为衡量性能的指标。这部分以后有空写吧，睡觉了。晚安。

作者: raini 时间: 2013-9-12 10:10

huangpobu 发表于 2013-9-12 00:51
哈哈，这个说得好。

我多讲一点儿八卦吧。

嗯，多写写！我是计算机专业的，并不对硬件了解太多。了解的都是书本上学来的，或者是平时逛论坛学到的。这样的知识对于一个门外汉是很有必要的。

作者: huangpobu 时间: 2013-9-12 12:03
本帖最后由 huangpobu 于 2013-9-12 12:06 编辑

raini 发表于 2013-9-12 10:10
嗯，多写写！我是计算机专业的，并不对硬件了解太多。了解的都是书本上学来的，或者是平时逛论坛学到的。 ...

哈哈，多谢鼓励！

我前阵子在回顾90年代前后那段时间的历史，看那些大佬写的文章，特别有意思。

当时有一个比较有名气的杂志叫做《微处理器报告》，96年的时候邀请了几位大佬一起写文章，展望微处理器以后的发展方向，包括Alpha的主架构师Sites还有分支预测领域的教主级人物Yale N.Patt，Patt的实验室团队提出了很多非常有用的分支预测器设计，现在的CPU里面用的分支预测器框架基本上就是他跟他的学生弄出来的。

Sites的文章里面提及，当时DEC的发展目标是2010年做出20发射CPU，这个。。。现实怎么样，大家都知道了。当时Sites等人呼吁大家转移架构设计的重心，从关注流水线，转向关注存储系统，一级缓存，二级缓存，内存，这些。当时乱序三发射的Pentium Pro为什么测出来IPC只有0.25，访存停顿是最大元凶，他的文章结尾说，将来存储系统可能是高性能架构设计的“唯一关键因素”。

当时出来呼吁这一点的不只是Sites，95年的时候维吉尼亚大学的Win. A. Wulf和Sally A. McKee就写了一篇文章，提出“访存墙”的概念，第一次指出CPU的速度将远超过存储器。Sally A. McKee八年后写了一篇回忆文章，说当时自己跟同事谈论这个问题，都被华丽丽地无视，她的导师Win. A. Wulf鼓励她写文章发表，说大家一定会疯狂引用的，结果一发出去，确实如此，学术界和工业界都疯狂了，访存墙的概念就是这样流传出去的。

除了学术圈儿，工业界也在考虑这个问题，当时有Intel的架构师写文章透露说，Intel EPIC团队之外就有人正在考虑从乱序多发射的架构上“撤退”，转向设计多个简单的小核心并行架构，大量使用推测执行技术，容忍访存延迟。

后来存储系统这块的一个大牛Bruce Jacob写了本书，开篇回顾当时DEC Alpha的历史，说当时Sites写的文章，大多数人不以为然，受到同事反对，其他架构师一直坚持要做“更快的微处理器”，结果DEC跪了。。。。（当然，DEC跪掉肯定不仅仅是因为一个原因啦，他这么写可能也是搞笑来的）

作者: san_037 时间: 2013-9-12 12:33

huangpobu 发表于 2013-9-12 12:03
哈哈，多谢鼓励！

我前阵子在回顾90年代前后那段时间的历史，看那些大佬写的文章，特别有意思。

好文

作者: san_037 时间: 2013-9-12 12:33

huangpobu 发表于 2013-9-12 12:03
哈哈，多谢鼓励！

我前阵子在回顾90年代前后那段时间的历史，看那些大佬写的文章，特别有意思。

好文

作者: san_037 时间: 2013-9-12 12:38

huangpobu 发表于 2013-9-12 12:03
哈哈，多谢鼓励！

我前阵子在回顾90年代前后那段时间的历史，看那些大佬写的文章，特别有意思。

现在并行化技术大行其道也可以说就是因为如此吧？可以在不同的线程之间跳转掩盖掉缓存内存的延迟

作者: PRAM 时间: 2013-9-12 12:43

huangpobu 发表于 2013-9-12 00:51
哈哈，这个说得好。

我多讲一点儿八卦吧。

果粉已经代替了A饭了

作者: PRAM 时间: 2013-9-12 12:48
苹果市值两天蒸发350亿美元----http://news.mydrivers.com/1/275/275685.htm

作者: huangpobu 时间: 2013-9-12 16:05

san_037 发表于 2013-9-12 12:33
好文

哈哈，谢谢~

这块有很多八卦，我慢慢读，以后慢慢写

作者: huangpobu 时间: 2013-9-12 16:13

san_037 发表于 2013-9-12 12:38
现在并行化技术大行其道也可以说就是因为如此吧？可以在不同的线程之间跳转掩盖掉缓存内存的延迟

嗯，是的。。。

以前专注IPC的时候，大家的思路是激进的乱序多发射 + 分支预测，后来发现不对了，这条路走不下去，设计实在太复杂，试图把IPC推向极致的Pentium 4怎么死的，大家都看到了。

P4巅峰期的05年，Sun推出了SPARC T1，这个处理器是八核心，每核心四线程，核心内部只有六级流水线，设计比P4不知道简单多少，最后测出来每核心IPC居然差不了很多，就是因为T1可以在多个线程之间跳转，虽然说比单线程IPC它被P4甩开几条街，但是单核心IPC它是不差的，而且它的设计相对来说比较简单，容易继续往下推。

T1是第一个从头到尾贯彻线程级并行度而不是指令级并行度的处理器，后来大家看到甜头了，这块也就越来越多。强调并行的GPU本质上也是这样，极度简单的小核心，辅以异常强大的多线程，容忍延迟，要求带宽。

作者: PRAM 时间: 2013-9-12 16:17

huangpobu 发表于 2013-9-12 16:13
嗯，是的。。。

以前专注IPC的时候，大家的思路是激进的乱序多发射 + 分支预测，后来发现不对了，这条 ...

CORE-HASWELL 同频下，单线程性能大概提高了多少？

作者: xf-108 时间: 2013-9-12 17:08

PRAM 发表于 2013-9-12 16:17
CORE-HASWELL 同频下，单线程性能大概提高了多少？

累计下来，估计25-30%顶天吧。
bay trail的单线程大约是同频core的50%，ivb的40%，也就是说ivb的同频单线程比core最多提升了25%，haswell基本没什么长进，算他比core强30%已经很高看了。

作者: qwased 时间: 2013-9-12 17:08
本帖最后由 qwased 于 2013-9-12 17:11 编辑

huangpobu 发表于 2013-9-12 16:13
嗯，是的。。。

以前专注IPC的时候，大家的思路是激进的乱序多发射 + 分支预测，后来发现不对了，这条 ...

那为什么现在的CPU对内存性能反而不太敏感？比如sandybridge，插个1333的内存和插2133mhz的内存跑分差别在5%以内

作者: frankincense 时间: 2013-9-12 17:11

qwased 发表于 2013-9-12 17:08
那为什么现在的CPU对内存性能反而不太敏感？

对于Core2来说，瓶颈在FSB总线上

欢迎光临 POPPUR爱换 (https://we.poppur.com/)