POPPUR爱换

标题: 水果A7处理器部分资料 [打印本页]

作者: 66666    时间: 2013-9-11 07:42
标题: 水果A7处理器部分资料
本帖最后由 66666 于 2013-9-11 07:43 编辑

基于ARMv8指令集独立设计,自称是第一个64bit手机(不知道ATOM手机版是不是支持),支持LPDDR3。

die size:102mm2,10亿晶体管。从晶体管密度看应该是28nm,而非之前传闻的intel 22nm。

具体性能测试估计这2天鬼佬们就会放出来,A7的一大卖点touch id使用专门协处理器跟MOTO所谓X8概念类似,虽然A7用了powerVR6但是对于GPGPU部分基本没有提到,GPGPU在手机上基本还是处于连概念都算不上的阶段。
作者: Tempestglen    时间: 2013-9-11 07:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2013-9-11 07:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: ifu    时间: 2013-9-11 08:00
虽未见具体测评,但看A7这架势秒A15 S800坨坨的。。。大水果威武,IPC不说定还真提升30%

作者: Tempestglen    时间: 2013-9-11 08:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: frankincense    时间: 2013-9-11 08:26
Atom Z2580/Z2760都阉割了x64的支持
作者: xreal    时间: 2013-9-11 08:29
难道是台基电的28?
作者: muramasa    时间: 2013-9-11 08:35
如果die size正确的话不像是28nm啊
snb是995M cpu/1160M total 216mm2@32nm
A7如果是1000M 102mm2 那么应该是20或者22nm了
作者: ifu    时间: 2013-9-11 08:38
muramasa 发表于 2013-9-11 08:35
如果die size正确的话不像是28nm啊
snb是995M cpu/1160M total 216mm2@32nm
A7如果是1000M 102mm2 那么应 ...

应该是28nm,参考一下28nm的显卡核心晶体管密度。
至于是不是台积电就不好说了
作者: xreal    时间: 2013-9-11 08:40
intel 的话肯定是22工艺。。。
作者: ifu    时间: 2013-9-11 08:43
Tempestglen 发表于 2013-9-11 08:12
Arm v8指令集, register都double了,苹果的微架构设计能力本来 就超英国arm公版,过去的史上最强arm就是 ...

估计下代得靠double cpu核数来double性能,否则核数不变double性能的话 IPC都快赶上桌面处理器了
作者: sim0831    时间: 2013-9-11 08:51
本帖最后由 sim0831 于 2013-9-11 08:52 编辑

A7还是三星28nm
而明年A8确认就是台积电20nm了

话说今日9/11英特尔也要发布BayTrail了,到底22nm Atom支不支持x64(64bit)啊?
作者: frankincense    时间: 2013-9-11 08:53
sim0831 发表于 2013-9-11 08:51
A7还是三星28nm
而明年A8确认就是台积电20nm了

BayTrail-D/M基本都应该支持,BayTrail-T很可能支持,Merrifield就难说了
作者: 66666    时间: 2013-9-11 08:54
本帖最后由 66666 于 2013-9-11 08:56 编辑
muramasa 发表于 2013-9-11 08:35
如果die size正确的话不像是28nm啊
snb是995M cpu/1160M total 216mm2@32nm
A7如果是1000M 102mm2 那么应 ...

GK104:294mm2,35.6亿。明显就是28nm,台积电代工的可能性很大,当然三星也很有可能。
作者: asdf567    时间: 2013-9-11 08:56
frankincense 发表于 2013-9-11 08:53
BayTrail-D/M基本都应该支持,BayTrail-T很可能支持,Merrifield就难说了

x64支持并无必要啊,暂时还用不着那些寻址
作者: PRAM    时间: 2013-9-11 08:57
SLIVERMONT是完全的64B了 A7 GPU据说是G6400
作者: xreal    时间: 2013-9-11 08:59
貌似很强,机器出货了拿3dmark测试下。。。
作者: 66666    时间: 2013-9-11 09:02
asdf567 发表于 2013-9-11 08:56
x64支持并无必要啊,暂时还用不着那些寻址

这个很难说,现在note3已经用上了3GB内存,不出意外明年旗舰android手机上4GB的可能性相当大,android系统也会相应跟进。
作者: huangpobu    时间: 2013-9-11 09:06
ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能,否则核数不变double性能的话 IPC都快赶上桌面处理器了

即便是Cortex-A15, Apple A7, 前后端宽度 OoO窗口大小都离Core还有一截,谈何IPC快赶上桌面处理器。

再退一步,跨ISA用IPC衡量性能是大忌中的大忌。麻烦少扯淡。
作者: ifu    时间: 2013-9-11 09:06
66666 发表于 2013-9-11 09:02
这个很难说,现在note3已经用上了3GB内存,不出意外明年旗舰android手机上4GB的可能性相当大,android系统 ...

按照猴机的尿性有了64bits CPU必然上 4GB...
不过手机追求大内存实在蛋痛,我现在1GB 也没觉得有啥不够用的
作者: 66666    时间: 2013-9-11 09:13
ifu 发表于 2013-9-11 09:06
按照猴机的尿性有了64bits CPU必然上 4GB...
不过手机追求大内存实在蛋痛,我现在1GB 也没觉得有啥不够用 ...

1GB哪够用,现在开机基本就要吃掉700M,开个UCweb和微信就只剩下百把M

2GB已经是最基本了。
作者: ifu    时间: 2013-9-11 09:19
huangpobu 发表于 2013-9-11 09:06
即便是Cortex-A15, Apple A7, 前后端宽度 OoO窗口大小都离Core还有一截,谈何IPC快赶上桌面处理器。

再 ...

理解力堪忧,有提A7?劝你赶紧去读书好好学习才是正道
作者: ifu    时间: 2013-9-11 09:25
66666 发表于 2013-9-11 09:13
1GB哪够用,现在开机基本就要吃掉700M,开个UCweb和微信就只剩下百把M

2GB已经是最基本了。

够了,一般也就用用微信玩玩QQ斗地主之类
我这启动开了微信还能剩 300MB
作者: xreal    时间: 2013-9-11 09:38
2g内存win7都能流畅运行了,安卓优化实在是太渣。
作者: PS5    时间: 2013-9-11 09:53
为何这次发布会对GPU部份只字未提呢?是不是GPU部份没有提升呢?
作者: 66666    时间: 2013-9-11 09:55
PS5 发表于 2013-9-11 09:53
为何这次发布会对GPU部份只字未提呢?是不是GPU部份没有提升呢?

有提到,只是笼统的说比5快一倍
作者: 66666    时间: 2013-9-11 09:58
xreal 发表于 2013-9-11 09:38
2g内存win7都能流畅运行了,安卓优化实在是太渣。

客观的说,2GB跑win7只能说做到能用,离流畅还差不少。

我开机开个QQ+chrome内存占用都上3GB了
作者: PS5    时间: 2013-9-11 10:06
66666 发表于 2013-9-11 09:55
有提到,只是笼统的说比5快一倍

只快一倍也太少了吧,有史以来首次啊,估计和PSV的GPU一样了
作者: CC9K    时间: 2013-9-11 10:19
asdf567 发表于 2013-9-11 08:56
x64支持并无必要啊,暂时还用不着那些寻址

硬件布局自然要比软件提前很多,要不然以软件转64位的速度根本来不及,PC就算到现在X64软件也不普及
作者: dennyq    时间: 2013-9-11 10:24
ifu 发表于 2013-9-11 09:06
按照猴机的尿性有了64bits CPU必然上 4GB...
不过手机追求大内存实在蛋痛,我现在1GB 也没觉得有啥不够用 ...

多任务1g严重不够用,尤其andriod系统。我gs2 常常爆内存,安装的程序还不多.
作者: slice    时间: 2013-9-11 10:27
本帖最后由 slice 于 2013-9-11 10:30 编辑
CC9K 发表于 2013-9-11 10:19
硬件布局自然要比软件提前很多,要不然以软件转64位的速度根本来不及,PC就算到现在X64软件也不普及

关键是32=>64本身能够带来什么样的提升。
例如Winrar32=>64貌似不到10%。
其他很多也性能也是SSE2,NEON之类的了。
想来想去,64位的根本意义还是在于大内存的支持。

像PS这些,64相对32位版本可能带来的性能数倍提升更多是因为大内存的支持。
如果说2G内存装64位系统装64位PS,其实,也就,呵呵。
你说QQ这些维护个64位版本,除了多占点内存,没啥意义呀。


作者: largewc    时间: 2013-9-11 10:29
66666 发表于 2013-9-11 09:58
客观的说,2GB跑win7只能说做到能用,离流畅还差不少。

我开机开个QQ+chrome内存占用都上3GB了

chrome也用了类似linux那种线程机制了,新线程会完全复制一块内存继续使用,这玩意及其消耗内存,你一个页面因为flash之类到了400m,新开一个页面开始就是400m。

ie貌似不是用这个,所以内存使用少很多,不过貌似没有chrome流畅。

现在ie11内存少的有点令人害怕,总觉得不真实。
作者: slice    时间: 2013-9-11 10:33
本帖最后由 slice 于 2013-9-11 10:38 编辑
largewc 发表于 2013-9-11 10:29
chrome也用了类似linux那种线程机制了,新线程会完全复制一块内存继续使用,这玩意及其消耗内存,你一个页 ...

速度来说,我觉得IE11页面渲染有比Chrome快的感觉。
但觉得有些问题,例如文本框会一定几率出现黑块刷新才好。
关闭高级设置里面的GPU加速就正常了。
或许是显卡驱动没有跟进某些特性(WDDM1.3)?

作者: largewc    时间: 2013-9-11 10:34
slice 发表于 2013-9-11 10:33
速度来说,我觉得IE11页面渲染有比Chrome快的感觉。
但觉得有些问题,例如文本框会一定几率出现黑块刷新 ...

我也发现了,或许是因为ie11测试还不够,反正性能11确实不错了,我已经不想用回chrome了

不过这个多谢哈,原来关闭gpu就好了,哈哈
作者: ifu    时间: 2013-9-11 10:45
PS5 发表于 2013-9-11 10:06
只快一倍也太少了吧,有史以来首次啊,估计和PSV的GPU一样了

之前4s到5也是只快一倍,GPU早就比PSV强了
作者: acqwer    时间: 2013-9-11 10:45
slice 发表于 2013-9-11 10:27
关键是32=>64本身能够带来什么样的提升。
例如Winrar32=>64貌似不到10%。
其他很多也性能也是SSE2,NEO ...

X86的32到64提升不高是因为AMD高的那个X64扩展的问题,16位应用到32位应用的提升还是非常大的
作者: ifu    时间: 2013-9-11 10:47
本帖最后由 ifu 于 2013-9-11 10:47 编辑
slice 发表于 2013-9-11 10:27
关键是32=>64本身能够带来什么样的提升。
例如Winrar32=>64貌似不到10%。
其他很多也性能也是SSE2,NEO ...

32=>64和性能提升没有必然联系
作者: largewc    时间: 2013-9-11 10:47
ifu 发表于 2013-9-11 10:45
之前4s到5也是只快一倍,GPU早就比PSV强了[sweatingbullets>

iphone5还是没有吧,ipad是超过了psv。
作者: Tempestglen    时间: 2013-9-11 10:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: slice    时间: 2013-9-11 10:53
本帖最后由 slice 于 2013-9-11 11:01 编辑
acqwer 发表于 2013-9-11 10:45
X86的32到64提升不高是因为AMD高的那个X64扩展的问题,16位应用到32位应用的提升还是非常大的

我倒不觉得是x64扩展的问题。
主要还是因为,32位也早已不是什么x87。
所需要的性能,早已通过SSE2之类等获得。
到64位并无本质不同。
例如什么双精度的浮点运算早就可以高效的完成。
弄一个所谓的真64位,也不见得更快。
ISA已不是决定性因素,最终还是取决于处理器的微架构。
是否可以这样子理解?






作者: ifu    时间: 2013-9-11 10:54
largewc 发表于 2013-9-11 10:47
iphone5还是没有吧,ipad是超过了psv。

ipad3就已经用上PowerVR SGX543MP4
iphone5 GPU性能和ipad3差不多
作者: Tempestglen    时间: 2013-9-11 10:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: largewc    时间: 2013-9-11 10:56
ifu 发表于 2013-9-11 10:54
ipad3就已经用上PowerVR SGX543MP4
iphone5 GPU性能和ipad3差不多

iphone5是略微砍版的应该是,记得比psv略差点的。

这次应该超过了
作者: PS5    时间: 2013-9-11 11:01
ifu 发表于 2013-9-11 10:45
之前4s到5也是只快一倍,GPU早就比PSV强了[sweatingbullets>

5的GPU是三核的比起PSV的四核还是差不少
作者: ifu    时间: 2013-9-11 11:02
本帖最后由 ifu 于 2013-9-11 11:03 编辑
largewc 发表于 2013-9-11 10:56
iphone5是略微砍版的应该是,记得比psv略差点的。

这次应该超过了

配置差一点但A6是 32nm PSV 45nm,A6可以跑更高的主频,所以最终性能比PSV强没啥问题
A5X是PowerVR SGX543MP4  45nm 这玩意和PSV规格更接近
A6是PowerVR SGX543MP3    32nm
但A6图形性能和A5X一样,工艺进步带来的频率进步弥补了规格差异
作者: largewc    时间: 2013-9-11 11:06
ifu 发表于 2013-9-11 11:02
配置差一点但A6是 32nm PSV 45nm,A6可以跑更高的主频,所以最终性能比PSV强没啥问题
A5X是PowerVR SGX5 ...

那里说苹果的频率更高了,找个链接看看?

psv空间更大,厚度比pad都厚多了,本身散热可提供的空间就大,sony提供一定的更高频率空间并不是没有。
作者: acqwer    时间: 2013-9-11 11:13
slice 发表于 2013-9-11 10:53
我倒不觉得是x64扩展的问题。
主要还是因为,32位也早已不是什么x87。
所需要的性能,早已通过SSE2之类 ...

X64扩展的太保守了,至少寄存器应该多加些,本来X86的寄存器就偏少。
作者: largewc    时间: 2013-9-11 11:16
本帖最后由 largewc 于 2013-9-11 11:23 编辑
acqwer 发表于 2013-9-11 11:13
X64扩展的太保守了,至少寄存器应该多加些,本来X86的寄存器就偏少。

我觉得意义不大,寄存器增加,x86不是risc。


应该x86现在都有内存重命名技术(没找到intel资料只知道全美达很早就支持这个东西了),加上寄存器重命名,配合编译器的处理,前端寄存器数量不是什么核心的瓶颈问题。

根据我的代码测试,猜测core应该也支持内存重命名,实际就是大部分内存直接操作已经被编译器的一些优化排布,加上cpu重命名为寄存器操作了,内存实际上是延时写入的,一段时间内内存操作都是寄存器操作,实际x86可用的后端寄存器数量根本不存在问题。


作者: leangelle    时间: 2013-9-11 11:28
提示: 作者被禁止或删除 内容自动屏蔽
作者: ifu    时间: 2013-9-11 11:46
largewc 发表于 2013-9-11 11:06
那里说苹果的频率更高了,找个链接看看?

psv空间更大,厚度比pad都厚多了,本身散热可提供的空间就大 ...

A6 SGX543MP3@266MHz
A5X  SGX543MP4@200MHz

PSV电池塞了8Whr
ipad3电池塞了43.0Whr
sony敢设更高频率?
作者: darkangel308    时间: 2013-9-11 12:43
acqwer 发表于 2013-9-11 10:45
X86的32到64提升不高是因为AMD高的那个X64扩展的问题,16位应用到32位应用的提升还是非常大的

不是扩展的问题,而是32位已经满足大部分需求,所以64位体现不出优势,写代码的都知道,一般情况下32位整型已经够用了,需要用到64位整型的情况其实不多
作者: PS5    时间: 2013-9-11 13:53
谁能说一下这个OPENGL ES3.0有什么新东西吗?
作者: huangpobu    时间: 2013-9-11 14:13
ifu 发表于 2013-9-11 09:19
理解力堪忧,有提A7?劝你赶紧去读书好好学习才是正道

被踢了一脚就缩回去了说自己没提A7,呵呵。


用得着这么怕我吗。
作者: huangpobu    时间: 2013-9-11 14:29
ifu 发表于 2013-9-11 09:19
理解力堪忧,有提A7?劝你赶紧去读书好好学习才是正道


"虽未见具体测评,但看A7这架势秒A15 S800坨坨的。。。大水果威武,IPC不说定还真提升30%"

这是你的原帖,转头就声称自己没提A7,这耳光够响吧?

作者: asdf567    时间: 2013-9-11 15:13
PS5 发表于 2013-9-11 13:53
谁能说一下这个OPENGL ES3.0有什么新东西吗?

这个完全不是新东西吧
作者: PS5    时间: 2013-9-11 15:17
asdf567 发表于 2013-9-11 15:13
这个完全不是新东西吧

比ES2.0多了哪些新东西啊?
作者: ifu    时间: 2013-9-11 15:23
huangpobu 发表于 2013-9-11 14:13
被踢了一脚就缩回去了说自己没提A7,呵呵。

ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能,否则核数不变double性能的话 IPC都快赶上桌面处理器了

-------------------------------------------------------------------------------------------------------------------------------------------------
知道什么叫下一代?是A7?别在这里丢人现眼,疯狗病得治。
艹,现在计算所都招些啥破小孩实习
作者: raini    时间: 2013-9-11 15:37
ifu 发表于 2013-9-11 15:23
ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能,否则核数不变double性能的话 IP ...

我对你的专业素养和瞧不起人的姿势非常敬佩,请问你哪个单位的?
作者: huangpobu    时间: 2013-9-11 16:24
ifu 发表于 2013-9-11 15:23
ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能,否则核数不变double性能的话 IP ...

装逼被踹破还这么嚣张,反正我把两个帖子引在一起每个人都看得清清楚楚。

如果我是你就会收敛一点,不仅编译不懂,微架构也不懂,有几分能耐说几分话,记住这个教训。
作者: sim0831    时间: 2013-9-11 16:27
20nm A8肯定直上四核,又一次的double性能
作者: huangpobu    时间: 2013-9-11 16:40
ifu 发表于 2013-9-11 15:23
ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能,否则核数不变double性能的话 IP ...

我接触的老师无一不告诉我这个道理:有几分能耐说几分话。

我极少评论design,device,process的领域,OS,compiler我也很少评价他人如何,都是因为我不懂,我从不讳言这些东西我不熟(至少不如arch熟),更别提在看不懂别人东西的情况下大放阙词。

倒是以你为代表的某些人,四处充大拿,发言浑身上下都是孔,几乎我逮住一个就能喷一个,自己不懂又喜欢把话说大,不是伸着脸让人抽是什么?
作者: zhen179    时间: 2013-9-11 17:00
我绝对是弄不明白,就这样骂来骂去,到底是学术讨论,还是辩论会,还是角斗场~~~ 实在是太不像话,到头来一个个还都举牌投诉举报,造成这样的气氛,究竟该由谁来负责~~~ 我被这里的朋友痛斥为不可理喻,但我就是这样的,遇上开口闭口动不动就要骂人的,我就是不予理睬,远远地避开他~~~ 但这里的做法跟我不一样,而是迎头而上,也不想一想,这骂人谁输谁赢啊,但是这给咱们坛子却造成非常不好的影响~~~ 所以啊,我期盼着不希望看到骂人现象再这样持续下去的朋友,主动避让,再次强调,咱们在这里只说理,而不得冲着人去~~~
作者: huangpobu    时间: 2013-9-11 17:03
A7和之前的芯片性能增长确实非常快,一方面是Apple本身给力,另一方面是低功耗的处理器在性能上起点比较低,要提高是相对来说比较容易的(但也只是相对而已,实际工程难度只有做的人才知道)

ISA属于软硬件接口层,从32到64,从定性上来说有利于提高性能,但从定量上来说,影响可能很小。我以前眼界不够宽,还停留在ISA决胜的年代,后来看了今年HPCA那篇CISC vs RISC的文章就彻底放下了,ISA上能做的变化据我所知是不多了,主要是下层实现的细节和上层如何利用。

不过别说,刚开始的时候RISC是非常有优势的,伯克利分校David Patterson的组做的RISC芯片差不多真就是研究生毕业设计的样子,从研究生课程上开始着手的RISC项目,用大幅落后的工艺和主频击败了当时Intel的商用处理器。
作者: ifu    时间: 2013-9-11 17:17
本帖最后由 ifu 于 2013-9-11 17:17 编辑
huangpobu 发表于 2013-9-11 16:24
装逼被踹破还这么嚣张,反正我把两个帖子引在一起每个人都看得清清楚楚。

如果我是你就会收敛一点,不 ...

huangpobu

新手会员
帖子299积分1We用劵0 张注册时间2012-12-24最后登录2013-9-11
19#
发表于:2013-9-11 09:06:31 [离线] 发消息给贴主 |只看该作者
ifu 发表于 2013-9-11 08:43
估计下代得靠double cpu核数来double性能,否则核数不变double性能的话 IPC都快赶上桌面处理器了----------------------------------------------------------------------------------------------------------------------------------

即便是Cortex-A15, Apple A7, 前后端宽度 OoO窗口大小都离Core还有一截,谈何IPC快赶上桌面处理器。

再退一步,跨ISA用IPC衡量性能是大忌中的大忌。麻烦少扯淡。

------------------------------------------------------------------------------------------------------------------
标红了,还理解不了的话只能替带你的老师默哀

作者: largewc    时间: 2013-9-11 17:18
ifu 发表于 2013-9-11 17:17
huangpobu

新手会员

你明确说吧,装高深没意义
作者: ifu    时间: 2013-9-11 17:22
本帖最后由 ifu 于 2013-9-11 17:28 编辑
largewc 发表于 2013-9-11 17:18
你明确说吧,装高深没意义

这和高深不搭界,基于一般逻辑的假设性推论。
前面都有人几个人都提了A8,可见也不是人人都如它般理解力低下
作者: largewc    时间: 2013-9-11 17:31
ifu 发表于 2013-9-11 17:22
这和高深不搭界,基于一般逻辑的假设性推论。
前面都有人几个人都提了A8,可见也不是人人都如它般理解力 ...

armv8? 这玩意能有什么加强?
作者: ifu    时间: 2013-9-11 17:33
largewc 发表于 2013-9-11 17:31
armv8? 这玩意能有什么加强?

不是ARMv8
仅是按照水果目前每代cpu性能翻番的趋势 yy比A7强一倍的A8

作者: largewc    时间: 2013-9-11 17:37
ifu 发表于 2013-9-11 17:33
不是ARMv8
仅是按照水果目前每代cpu性能翻番的趋势 yy比A7强一倍的A8

反正我是不信的,没任何道理可言,等真机出来再说。
作者: PS5    时间: 2013-9-11 19:36
这个ES3.0比起ES2.0多了哪些新东西呢?
作者: Tempestglen    时间: 2013-9-11 20:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: badchris    时间: 2013-9-11 20:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2013-9-11 21:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: huangpobu    时间: 2013-9-11 21:04
ifu 发表于 2013-9-11 17:22
这和高深不搭界,基于一般逻辑的假设性推论。
前面都有人几个人都提了A8,可见也不是人人都如它般理解力 ...

真服了你了,越来越没有下限,现在当着这么多人面造谣?

你的帖子在11楼,去前面10楼仔细翻一下,


有一个人提A8,我给你磕头,没有人提A8,你给我磕头,敢不敢赌?
作者: huangpobu    时间: 2013-9-11 21:08
ifu 发表于 2013-9-11 17:17
huangpobu

新手会员

你我之间专业实力差距太远,我姑且让你一万步,即便A8 IPC 超过 Core 10000倍,这两者之间的IPC也不具备可比性。


跨ISA比较IPC是大忌中的大忌,你当我这话是白说的?
作者: badchris    时间: 2013-9-11 21:13
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2013-9-11 21:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2013-9-11 21:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: ifu    时间: 2013-9-11 21:48
huangpobu 发表于 2013-9-11 21:04
真服了你了,越来越没有下限,现在当着这么多人面造谣?

你的帖子在11楼,去前面10楼仔细翻一下,

我67#提的前面,这都尼玛什么智商理解力?无下限
作者: ifu    时间: 2013-9-11 21:55
Tempestglen 发表于 2013-9-11 20:45
20nm时代会有3Ghz的arm,配合IPC的些许提升,单核性能再次double很有可能。
京时间7月11日消息,据科技 ...

3Ghz就算了,还是先看看A7的发热功耗
作者: badchris    时间: 2013-9-11 21:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: badchris    时间: 2013-9-11 22:07
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2013-9-11 23:28
提示: 作者被禁止或删除 内容自动屏蔽
作者: huangpobu    时间: 2013-9-11 23:46
ifu 发表于 2013-9-11 21:48
我67#提的前面,这都尼玛什么智商理解力?无下限

好,这不重要,我就爽快直接认了你说的A8.

可是无论A8还是A80,又怎么样?

给你出几个思考题:

同级别处理器跑SPEC2006 FP,ARM阵营的IPC乘以1.5,性能都赶不上x86,请问为什么? 在这种情况下对比IPC是否公平?不公平的原因在哪里?

跑SPEC2006 int, Atom要多跑差不多30%的micro-ops才能完成与SandyBridge一样的任务,请问为什么?在这种情况下对比IPC是否公平?不公平的原因在哪里?

以上这组问题有助你想明白跨ISA比较IPC有什么弊病。

SandyBridge的架构牛不牛逼?流水线最窄的地方也有4个mirco-up的宽度,但它在各大benchmark中的平均IPC只有1.4+,这说明什么?

以上这个问题有助你想明白膜拜IPC会有什么后果。
作者: raini    时间: 2013-9-11 23:52
本帖最后由 raini 于 2013-9-11 23:52 编辑
Tempestglen 发表于 2013-9-11 23:28
没用,你们这些所谓的行家以为看些文章就解决问题了?
大行家Pram说A7不是64位,还说A7主要是gpu改进,P ...

总比一个SB装专家,装预言家强!
作者: badchris    时间: 2013-9-12 00:06
提示: 作者被禁止或删除 内容自动屏蔽
作者: huangpobu    时间: 2013-9-12 00:51
badchris 发表于 2013-9-12 00:06
[tongue>原来CPU区还不如显卡区的两派……人家怎么不拿Tahiti和Kepler比IPC呢,佩服佩服

哈哈,这个说得好。

我多讲一点儿八卦吧。

上世纪80年代末,90年代初,学术界工业界都崇拜IPC,想方设法提高IPC,乱序,多发射,激进的分支预测,当时多发射疯狂到什么程度,大家都假设以后会发展出15发射,20发射的怪兽CPU,还别笑,不少大佬都是这么认为的,分支预测,疯狂到什么程度,每个周期同时预测多个分支,这可是平方级的复杂度,那种技术在我出生的年代就发明出来了,可惜现在也没有一个商业处理器采用它。

到了90年代中后期,开始有一些比较有先见之明的人发现不对了。当时DEC Alpha的主架构师Richard Sites,写了一篇文章 ,里面透露了一个很颠覆性的结果,当时做的比较好的架构,大致是P6这样的,乱序三发射(?可能记忆有误,但是至少也有双发射),理想状况下IPC应该接近3,至少也要超过2吧,结果实测一下,0.25还不到。

追求IPC把整个业界引上了一条错误轨道,有一些人就开始反思,整个系统的瓶颈到底在哪里,IPC是否能作为衡量性能的指标。这部分以后有空写吧,睡觉了。晚安。
作者: raini    时间: 2013-9-12 10:10
huangpobu 发表于 2013-9-12 00:51
哈哈,这个说得好。

我多讲一点儿八卦吧。

嗯,多写写!我是计算机专业的,并不对硬件了解太多。了解的都是书本上学来的,或者是平时逛论坛学到的。这样的知识对于一个门外汉是很有必要的。
作者: huangpobu    时间: 2013-9-12 12:03
本帖最后由 huangpobu 于 2013-9-12 12:06 编辑
raini 发表于 2013-9-12 10:10
嗯,多写写!我是计算机专业的,并不对硬件了解太多。了解的都是书本上学来的,或者是平时逛论坛学到的。 ...

哈哈,多谢鼓励!

我前阵子在回顾90年代前后那段时间的历史,看那些大佬写的文章,特别有意思。

当时有一个比较有名气的杂志叫做《微处理器报告》,96年的时候邀请了几位大佬一起写文章,展望微处理器以后的发展方向,包括Alpha的主架构师Sites还有分支预测领域的教主级人物Yale N.Patt,Patt的实验室团队提出了很多非常有用的分支预测器设计,现在的CPU里面用的分支预测器框架基本上就是他跟他的学生弄出来的。

Sites的文章里面提及,当时DEC的发展目标是2010年做出20发射CPU,这个。。。现实怎么样,大家都知道了。当时Sites等人呼吁大家转移架构设计的重心,从关注流水线,转向关注存储系统,一级缓存,二级缓存,内存,这些。当时乱序三发射的Pentium Pro为什么测出来IPC只有0.25,访存停顿是最大元凶,他的文章结尾说,将来存储系统可能是高性能架构设计的“唯一关键因素”。

当时出来呼吁这一点的不只是Sites,95年的时候维吉尼亚大学的Win. A. Wulf和Sally A. McKee就写了一篇文章,提出“访存墙”的概念,第一次指出CPU的速度将远超过存储器。Sally A. McKee八年后写了一篇回忆文章,说当时自己跟同事谈论这个问题,都被华丽丽地无视,她的导师Win. A. Wulf鼓励她写文章发表,说大家一定会疯狂引用的,结果一发出去,确实如此,学术界和工业界都疯狂了,访存墙的概念就是这样流传出去的。

除了学术圈儿,工业界也在考虑这个问题,当时有Intel的架构师写文章透露说,Intel EPIC团队之外就有人正在考虑从乱序多发射的架构上“撤退”,转向设计多个简单的小核心并行架构,大量使用推测执行技术,容忍访存延迟。

后来存储系统这块的一个大牛Bruce Jacob写了本书,开篇回顾当时DEC Alpha的历史,说当时Sites写的文章,大多数人不以为然,受到同事反对,其他架构师一直坚持要做“更快的微处理器”,结果DEC跪了。。。。(当然,DEC跪掉肯定不仅仅是因为一个原因啦,他这么写可能也是搞笑来的)
作者: san_037    时间: 2013-9-12 12:33
huangpobu 发表于 2013-9-12 12:03
哈哈,多谢鼓励!

我前阵子在回顾90年代前后那段时间的历史,看那些大佬写的文章,特别有意思。

好文
作者: san_037    时间: 2013-9-12 12:33
huangpobu 发表于 2013-9-12 12:03
哈哈,多谢鼓励!

我前阵子在回顾90年代前后那段时间的历史,看那些大佬写的文章,特别有意思。

好文
作者: san_037    时间: 2013-9-12 12:38
huangpobu 发表于 2013-9-12 12:03
哈哈,多谢鼓励!

我前阵子在回顾90年代前后那段时间的历史,看那些大佬写的文章,特别有意思。

现在并行化技术大行其道也可以说就是因为如此吧?可以在不同的线程之间跳转掩盖掉缓存内存的延迟
作者: PRAM    时间: 2013-9-12 12:43
huangpobu 发表于 2013-9-12 00:51
哈哈,这个说得好。

我多讲一点儿八卦吧。

果粉已经代替了A饭了
作者: PRAM    时间: 2013-9-12 12:48
苹果市值两天蒸发350亿美元----http://news.mydrivers.com/1/275/275685.htm
作者: huangpobu    时间: 2013-9-12 16:05
san_037 发表于 2013-9-12 12:33
好文

哈哈,谢谢~

这块有很多八卦,我慢慢读,以后慢慢写
作者: huangpobu    时间: 2013-9-12 16:13
san_037 发表于 2013-9-12 12:38
现在并行化技术大行其道也可以说就是因为如此吧?可以在不同的线程之间跳转掩盖掉缓存内存的延迟

嗯,是的。。。

以前专注IPC的时候,大家的思路是激进的乱序多发射 + 分支预测,后来发现不对了,这条路走不下去,设计实在太复杂,试图把IPC推向极致的Pentium 4怎么死的,大家都看到了。

P4巅峰期的05年,Sun推出了SPARC T1,这个处理器是八核心,每核心四线程,核心内部只有六级流水线,设计比P4不知道简单多少,最后测出来每核心IPC居然差不了很多,就是因为T1可以在多个线程之间跳转,虽然说比单线程IPC它被P4甩开几条街,但是单核心IPC它是不差的,而且它的设计相对来说比较简单,容易继续往下推。

T1是第一个从头到尾贯彻线程级并行度而不是指令级并行度的处理器,后来大家看到甜头了,这块也就越来越多。强调并行的GPU本质上也是这样,极度简单的小核心,辅以异常强大的多线程,容忍延迟,要求带宽。
作者: PRAM    时间: 2013-9-12 16:17
huangpobu 发表于 2013-9-12 16:13
嗯,是的。。。

以前专注IPC的时候,大家的思路是激进的乱序多发射 + 分支预测,后来发现不对了,这条 ...

CORE-HASWELL 同频下,单线程性能 大概提高了多少?
作者: xf-108    时间: 2013-9-12 17:08
PRAM 发表于 2013-9-12 16:17
CORE-HASWELL 同频下,单线程性能 大概提高了多少?

累计下来,估计25-30%顶天吧。
bay trail的单线程大约是同频core的50%,ivb的40%,也就是说ivb的同频单线程比core最多提升了25%,haswell基本没什么长进,算他比core强30%已经很高看了。
作者: qwased    时间: 2013-9-12 17:08
本帖最后由 qwased 于 2013-9-12 17:11 编辑
huangpobu 发表于 2013-9-12 16:13
嗯,是的。。。

以前专注IPC的时候,大家的思路是激进的乱序多发射 + 分支预测,后来发现不对了,这条 ...

那为什么现在的CPU对内存性能反而不太敏感?比如sandybridge,插个1333的内存和插2133mhz的内存跑分差别在5%以内

作者: frankincense    时间: 2013-9-12 17:11
qwased 发表于 2013-9-12 17:08
那为什么现在的CPU对内存性能反而不太敏感?

对于Core2来说,瓶颈在FSB总线上




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4