POPPUR爱换

标题: A6这种功耗不变单线程性能提升2.X倍的情况X86连想都不敢想吧? [打印本页]

作者: CC9K    时间: 2012-9-24 22:25
标题: A6这种功耗不变单线程性能提升2.X倍的情况X86连想都不敢想吧?
不纠结各种测试单线程还是多线程,和不同平台的比较

就自己和自己比,相比上代,A6综合性能提升2.X倍是既成事实,并且iPhone的电池容量并没有增加,续航表现一如既往,说明A6的功耗相比上代不会有太大变化

作者: zhdick    时间: 2012-9-24 22:37
PD和酷睿?
作者: Tempestglen    时间: 2012-9-24 22:38
提示: 作者被禁止或删除 内容自动屏蔽
作者: CC9K    时间: 2012-9-24 22:40
本帖最后由 CC9K 于 2012-9-24 22:45 编辑

没说同频啊

频率提升,同时保持功耗也是人家本事

很多人不是说ARM功耗低是因为性能低下?要是性能一上来功耗就跟着狂涨?


作者: Tempestglen    时间: 2012-9-24 22:47
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2012-9-24 23:02
Tempestglen 发表于 2012-9-24 22:38
比A5(Cortex A9)提升了顶多60%吧,没有100%那么夸张。毕竟A6比A5的频率高了25%甚至50%。

至于ip5功耗, ...

Atom就算功耗无限制也不能跑到3G,为啥呢?
就说时钟信号分布的拓扑结构就不行。
而单单的时钟信号分布,往往就要消耗20%甚至更多的电力

作者: raini    时间: 2012-9-24 23:03
两人一唱一和,好精彩呀!
作者: itany    时间: 2012-9-24 23:05
本帖最后由 itany 于 2012-9-24 23:12 编辑
Tempestglen 发表于 2012-9-24 22:47
那倒是。A6的出现让安卓阵营大吃一惊了,难怪郭台铭说ip5会让三星g3难堪。A6的内存带宽还有提升空间,仅仅 ...

如果能推倒Silvermont,那Arm快点出8核心把,AMD家的Opteron得团灭
单核心同频,Silvermont比AMD家的Steamroller要快一些

之前Atom是基本采用库和自动布线等,基本没进行优化(Intel有几个人蛋疼做的玩具而已)
而Intel之所以能推平AMD,很大原因就是不惜工本对主要电路进行人工设计。
看看Arm面对Intel认真搞出来的新Atom吧

作者: Tempestglen    时间: 2012-9-24 23:07
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2012-9-24 23:13
本帖最后由 itany 于 2012-9-24 23:14 编辑
Tempestglen 发表于 2012-9-24 23:07
台积电把cortex A9操到3.1Ghz无压力。arm早就声称可以到2.5-3Ghz. 你atom不能,不代表arm不能。

那么就必须大大牺牲性能功耗比

如果可以双核心3G为啥要搞四核心1.xG呢?显然前者面积少,成本低啊

作者: raini    时间: 2012-9-24 23:13
Tempestglen 发表于 2012-9-24 23:07
台积电把cortex A9操到3.1Ghz无压力。arm早就声称可以到2.5-3Ghz. 你atom不能,不代表arm不能。

哇。。。好大的口气呀!真不知道T神哪来的信心
作者: Tempestglen    时间: 2012-9-24 23:17
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2012-9-24 23:20
提示: 作者被禁止或删除 内容自动屏蔽
作者: Cherbim    时间: 2012-9-24 23:20
提示: 作者被禁止或删除 内容自动屏蔽
作者: raini    时间: 2012-9-24 23:22
Tempestglen 发表于 2012-9-24 23:07
台积电把cortex A9操到3.1Ghz无压力。arm早就声称可以到2.5-3Ghz. 你atom不能,不代表arm不能。

哇。。。好大的口气呀!真不知道T神哪来的信心
作者: raini    时间: 2012-9-24 23:23
Tempestglen 发表于 2012-9-24 23:20
这是我第三次贴3Ghz的证据了,如果你懂汉语的话,先抽出功夫看看新闻再来喷。
http://news.mydrivers. ...

我至少不像你,满嘴喷东西!
作者: FENG950    时间: 2012-9-24 23:24
同频486是386两倍有多
作者: itany    时间: 2012-9-24 23:26
Tempestglen 发表于 2012-9-24 23:17
乱序执行的Silvermont还没测试数据,你就这么肯定? 再说推土机也不是啥了不起的,苹果A6现在就可以和同频 ...

有什么不敢肯定的。
当年Bulldozer出来之前一帮人在吹,我就说单线程性能肯定衰退,还不信,结果怎么样?
CPU的微架构在那摆着呢。

Arm也一样。3发射乱序同频部分应用能战平甚至打赢顺序双发射Atom是正常的,更何况现在的Atom只是几个蛋疼的玩出来的东西。但是现在Arm乱序也用了,3发射也用了,还有啥底牌呢?Atom这底牌可是多着呢,因为Atom的微架构已经没法再烂了 只是靠制程在战斗而已

当年AMD Athlon64搞个集成内存控制器,就来嘲笑Intel。殊不知集成内存控制器容易,然而在没集成内存控制器的情况下就像Core 2那样跑出低延迟是困难的。等到Intel也集成了内存控制器之后,AMD内存性能立刻被轰成渣了。

作者: Tempestglen    时间: 2012-9-24 23:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2012-9-24 23:26
Tempestglen 发表于 2012-9-24 23:20
这是我第三次贴3Ghz的证据了,如果你懂汉语的话,先抽出功夫看看新闻再来喷。
http://news.mydrivers. ...

AMD 8G+也很常见。可是还是渣的本质
作者: itany    时间: 2012-9-24 23:29
Arm的底牌已经出光了,Athlon和Phenom就是前车之鉴
而Atom现在自是P4而已,底牌还都扣着呢
作者: raini    时间: 2012-9-24 23:30
Tempestglen 发表于 2012-9-24 23:26
我说事都是带证据带推理的,有图,有链接,你可以说我证据不可靠,或者逻辑推理有漏洞,但是你不能说我信 ...

无视我,还会我贴干啥?
带证据推理?哈哈,要是你那些假如,如果能信的话。。。
说自己是个程序员,还年薪20w,却连个基本的常识都没有!

作者: Tempestglen    时间: 2012-9-24 23:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2012-9-25 00:08
Tempestglen 发表于 2012-9-24 23:40
高通设计cpu技术水平就是二流货,自家研发微架构的krait弄成三发射也那个臭德行,javascript还不如标准 ...

呦呦呦,性能又随口就来了。
等同Android平台或者Windows平台测试结果出来之后再吹吧。

至于说乱序和顺序的关系,请您自己看看Arm从顺序到乱序增加了多少功耗?
实际上这种增加是有限的。
我之前说过,Silverthorne从奔腾以来开发最拙劣的处理器,因为几乎没有进行开发。性能也好,节能也好,都是优化出来的。没有优化,必然差劲。反正是明年,我们走着瞧吧。

你举的粒子,Sandy Bridge和Ivy Bridge,都是经过良好优化的,体现的主要是制程的影响。而Atom还要体现电路优化的影响。
另外,桌面处理器工作在右边,手机的Atom可是工作在左边。


如果A15真的能和您老想的一样,那么2012年将是您欢乐的最后一年。
如果A15不如您老想的,那么您最好也抓紧时间欢乐~

作者: CC9K    时间: 2012-9-25 00:39
本帖最后由 CC9K 于 2012-9-25 00:43 编辑

其实A6和高通的S4以及NV的丹佛也开始说明,有更多的厂商力量参与到ARM的研发中来,这才是最X86最危险的地方。A9也好、A15也好,都只是ARM自己的一个范例架构,未来有更多的芯片,凝结不同厂商的智慧,按照需求去订制不同的架构

反观INTEL,服务器、桌面、移动,看起来很多芯片,实际就那么两个X86架构,但其实谁都明白适合服务器的芯片,未必能适合玩游戏,适合上网本的也未必适合手机,有些地方需要强大的浮点而有些地方根本用不到,只是因为研发上没有精力去单独设计新的架构,每年耗费下去数十亿,却连自己ATOM都没法很好的照顾好

ARM播撒的种子正在四处生根发芽,工控领域有自己的芯片,今后可能手机与平板,都会使用不同的微架构,服务器上也会有自己衍生出的微架构,每一处都是按需求定制的不同芯片,INTEL拿什么来抗衡呢?
作者: itany    时间: 2012-9-25 01:10
本帖最后由 itany 于 2012-9-25 01:11 编辑
CC9K 发表于 2012-9-25 00:39
其实A6和高通的S4以及NV的丹佛也开始说明,有更多的厂商力量参与到ARM的研发中来,这才是最X86最危险的地方 ...

高通和NV的失败已经说明了Arm模式进入了衰退期
市场只有集中才能产生优质产品。Arm厂商互相倾轧,本来就是走OpenGL在电脑游戏上覆灭的老路。
20多个部门联合管理是管不好食品安全的。Arm也一样。

游戏和服务器重要的都是ALU,完全可以用相同的核心,只不过在频率、核心数量上进行权衡。

作者: itany    时间: 2012-9-25 01:15
至于说苹果,那是因为他整机超额利润掩盖了CPU的严重亏损罢了。
这种内部补贴模式,早晚会完蛋的。
就好比当年苹果电脑一旦价格正常化,就必须一脚踢开Power处理器一样。
作者: nqhjl    时间: 2012-9-25 01:43
提示: 作者被禁止或删除 内容自动屏蔽
作者: nqhjl    时间: 2012-9-25 01:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: lptt3    时间: 2012-9-25 02:07
假如设计水平一致,那么arm的理论性能应该会比x86要高一点。。。

从理论上来说,所有的工位都要消耗能量,都要产生延迟。。。arm因为没有复杂解码器这个工位,所以整体工位效率必然比x86要高一些。能量消耗也要少“一些”。第二个,x86的指令是不等长的,l1-l3的步骤控制必然比等长指令的arm要复杂,而工位复杂性越高,必然导致消耗更多的能量。延迟在这里大多数情况下应该考虑部件的效率作为计算依据,作为等长指令的risc应该能更接近理论效率,效率高一些所以整体延迟必然也会低一些。

intel的优势在于无敌的工艺。但是我相当怀疑14nm之后的事情。。。
作者: divx001    时间: 2012-9-25 06:52
本帖最后由 divx001 于 2012-9-25 06:56 编辑

据说目前NV和三星都在A15上被ARM坑的不轻(双核A15跑1.5G功耗已经超越1.4G 四核A9),TI更是光打雷不下雨。

从绝对性能功耗比来说目前所有ARM设备都是屎的现实没有改变,包括那个什么A6
作者: frankincense    时间: 2012-9-25 08:08
T神吹A15到现在已经两年了,想象中的能血洗酷睿的2.5G A15到现在影都没见
至于ARM三大信众(T神称)中:
英伟达完全没公布A15的Tegra计划
三星号称Exynos5将在今年第二季度大批量出货,但到现在还没见到一款设备计划用这个最高频率只有2G的A15双核
德仪的OMAP5同样声称今年出货,但到现在依然影都没有
作者: Tempestglen    时间: 2012-9-25 08:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2012-9-25 08:29
提示: 作者被禁止或删除 内容自动屏蔽
作者: eternal0    时间: 2012-9-25 08:29
Tempestglen 发表于 2012-9-25 08:22
arm A9从发布到在手机上使用,3年时间。A15从发布,才2年时间。你们根本不懂arm的时间表。

你除了会一拖再拖转移话题还会什么呢?

WIndowsRT?你愿意在24-27吋屏上去用Metro界面?而且还是强制性的?


作者: Tempestglen    时间: 2012-9-25 08:35
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2012-9-25 08:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: eternal0    时间: 2012-9-25 08:39
Tempestglen 发表于 2012-9-25 08:35
拖什么拖?前面某人不是讽刺我“2年了,A15还没有出来”吗?

苹果的A6,比arm A15更加强大,已经开卖4 ...

你敢说这世界上有多少人会在台式PC上用触摸屏吗?

作者: Tempestglen    时间: 2012-9-25 08:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: divx001    时间: 2012-9-25 08:47
双核A15跑2.5G的话功耗跟1.8G双核ATOM也差不了多少了

上平板估计真的要放主动散热装置
作者: eternal0    时间: 2012-9-25 08:48
本帖最后由 eternal0 于 2012-9-25 08:51 编辑
Tempestglen 发表于 2012-9-25 08:42
你在转移话题,触摸和arm有什么必然联系?
我买个27寸的非触摸屏,安装metro界面,不行吗?我在机箱里, ...

那就请你去pcbeta问问,看看有多少人台式机装了win8愿意去用那个破烂Metro。

x86可以自行选择是用Metro还是经典Windows界面,而ARM没得选。

另外,你觉得用ARM主机能比G530+H61省多少钱?别忘了存储、外设部分你可是一分钱都省不了的。

作者: Tempestglen    时间: 2012-9-25 09:07
提示: 作者被禁止或删除 内容自动屏蔽
作者: Tempestglen    时间: 2012-9-25 09:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: divx001    时间: 2012-9-25 09:14
windowsRT微软也是主打平板,ARM上桌面根本毫无优势。顶多也就是+平板电视搞一些智能终端而已。而这种用途用android一样也能满足,并不需要windowsRT
作者: raini    时间: 2012-9-25 09:23
lptt3 发表于 2012-9-25 02:07
假如设计水平一致,那么arm的理论性能应该会比x86要高一点。。。

从理论上来说,所有的工位都要消耗能量 ...

只考虑电路上的复杂性,是不是也太过片面了!
x86在指令方面要比arm复杂,但是对于x86而言,一条指令能完成的事,arm却要用多条指令。这样算,从完成一个算法的角度来说,arm应该也没省到多少了!


作者: eternal0    时间: 2012-9-25 09:44
Tempestglen 发表于 2012-9-25 09:12
另外,你觉得用ARM主机能比G530+H61省多少钱?别忘了存储、外设部分你可是一分钱都省不了的。
////
...

电费基本可以无视。

咱这平时听音乐,对噪音很敏感,G530配静音散热器也是OK的。反倒是如果换了ARM将面临没有声卡驱动的窘境,而现有的播放器和插件也无法使用,为了降低这么点噪音(其实差距很小),而舍弃兼容性实在是太不值了。

46楼说的很对:
arm进入桌面,x86进入移动终端,差不多一样的困难。
但是却总有些别有用心的人整天吹来吹去。


作者: divx001    时间: 2012-9-25 09:50
raini 发表于 2012-9-25 09:23
只考虑电路上的复杂性,是不是也太过片面了!
x86在指令方面要比arm复杂,但是对于x86而言,一条指令能完 ...

就算是IBM的power7也不见得在单线程上干的过intel,所谓RISC效率更高早就是一句扯淡的空屁。




作者: frankincense    时间: 2012-9-25 10:03
yysqu 发表于 2012-9-25 09:33
arm进入桌面,x86进入移动终端,差不多一样的困难。
这些厂家为啥非要干自己不擅长的事情[sweatingbullets ...

x86是想进入移动终端领域而且已经在做ARM倒是想进入服务器而不是桌面,也就T神在不断幻想2.5G A15四核桌面而已

作者: 飞鸟真    时间: 2012-9-25 11:42
divx001 发表于 2012-9-25 09:14
windowsRT微软也是主打平板,ARM上桌面根本毫无优势。顶多也就是+平板电视搞一些智能终端而已。而这种用途用 ...

别急,等arm64位纷纷出现后,别说正式win8

windows server 有arm版都没商量。


作者: itany    时间: 2012-9-25 11:54
lptt3 发表于 2012-9-25 02:07
假如设计水平一致,那么arm的理论性能应该会比x86要高一点。。。

从理论上来说,所有的工位都要消耗能量 ...

没这回事
早年认为x86前端耗电比较厉害,可是,解码在CPU整个耗电里边所占的比例,并不大,甚至说,还是比较小的。
从Sandy Bridge开始,增加了一个微操作缓存,在循环之类的时候可以关闭前端的解码器,省多少功耗么?其实也没很多。

x86指令当年是为了减少程序大小,但是,现在起到的好处就是节省带宽。
降低带宽是可以节能的。

现在再搬出来经典的RISC优势那一套,已经过时了!

作者: itany    时间: 2012-9-25 11:56
Tempestglen 发表于 2012-9-25 09:12
另外,你觉得用ARM主机能比G530+H61省多少钱?别忘了存储、外设部分你可是一分钱都省不了的。
////
...

之前都说了Arm提高频率之后甚至比x86还费电

将性能的时候就2.5、3G的说事,讲功耗就手机上
难道Atom就不能无风扇了。
搞笑

作者: 飞鸟真    时间: 2012-9-25 11:59
itany 发表于 2012-9-25 11:54
没这回事
早年认为x86前端耗电比较厉害,可是,解码在CPU整个耗电里边所占的比例,并不大,甚至说,还是 ...

求解码耗电不大和消耗资源不多的资料

x86越快解码工作量压力越大
等intel决心抛弃x86后再谈risc优势论过时吧



作者: lptt3    时间: 2012-9-25 12:05
raini 发表于 2012-9-25 09:23
只考虑电路上的复杂性,是不是也太过片面了!
x86在指令方面要比arm复杂,但是对于x86而言,一条指令能完 ...

你说的这个,我已经想过。并不存在x86一条指令能完成的arm需要更多指令的问题。因为x86内部管线也是risc化的。解码器是x86最大的拖累。这个影响是很复杂的,所以我用了整体效率来评判。第二个,x86的寄存器也是个拖累,因为老旧的isa定义,需要大量的寄存器改名工位的工作。a=b+c,e=f+g是这两条指令,x86需要做两次寄存器重命名,但是risc的结构估计只是需要单纯的增加寄存器就行了,或者说risc的结构需要的寄存器改名工作量比较少。。。假如x86微risc内核的寄存器跟arm一样多。这两者的理论功耗一样,那么多出的寄存器改名工作量是要消耗能量和产生延迟的(或者说不产生延迟但频率难以提高)。
作者: lptt3    时间: 2012-9-25 12:14
itany 发表于 2012-9-25 11:54
没这回事
早年认为x86前端耗电比较厉害,可是,解码在CPU整个耗电里边所占的比例,并不大,甚至说,还是 ...

你说的那些并不从根本上解决问题,而且工位的开关动作本身也产生开销。你口说无凭的说不大,我认为刚好相反,前端包括cache,cache本身就是功耗大户。

取指带宽主要看cache,所以带宽一般情况下并不会成为问题。提高也相对容易。

作者: Tempestglen    时间: 2012-9-25 12:20
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2012-9-25 12:22
飞鸟真 发表于 2012-9-25 11:59
求解码耗电不大和消耗资源不多的资料

x86越快解码工作量压力越大

事实上Intel决心抛弃的是arm
作者: Tempestglen    时间: 2012-9-25 12:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2012-9-25 12:26
Tempestglen 发表于 2012-9-25 12:20
1)我可没说手机可以上2.5Ghz.我谈手机的时候是指1.5Ghz及以下的arm。我谈2.5Ghz四核的时候是指笔记本、台 ...

真搞笑,您看到2.5G的arm实际装机使用了?
我是在谈未来,atom和arm的未来。
您非要谈未来的arm和现在的atom。本身就是怕得很么。因为arm没有未来。

未来atom可以实现10倍的性能和1/10的功耗,arm如何实现?

作者: itany    时间: 2012-9-25 12:29
Tempestglen 发表于 2012-9-25 12:26
intel当年抛弃arm的原因是发现搞arm不赚钱,是"钱"的因素而不是"技术"上的因素促使intel作出了决定。 ...

Intel迄今为止是Arm最大的授权用户,Intel的各种芯片里边用到Arm的地方多了。
Intel对Arm的了解是入木三分的。Intel认为Arm在平板、手机等上边没前途是经过严肃研判的。并非单单一个Arm不赚钱。反过来说,如果连钱都赚不了,那Arm谈何发展?

作者: Tempestglen    时间: 2012-9-25 12:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2012-9-25 12:34
本帖最后由 itany 于 2012-9-25 12:38 编辑
Tempestglen 发表于 2012-9-25 12:32
现在的A6不是虐了现在的atom了吗? 现在vs现在

未来?未来intel不就是在制造工艺上继续领先台积电、三星 ...

A6在相同操作系统下虐了Atom么?
相反,Atom在Windows下到处虐Arm

Intel的NTV能让Atom每核心的功耗降低到20-50mW,功耗能降低到1/10;乱序+重新设计的前端+执行单元能让Atom单线程性能增加到2倍以上,加上4核心,性能能增加到现在的10倍
这都是已经展示,可以逐步投入应用甚至已经可以应用的。
您鸵鸟能鸵鸟到明后年?

作者: Tempestglen    时间: 2012-9-25 12:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: lptt3    时间: 2012-9-25 12:42
其实一直以来x86之所以能独霸pc市场是因为,软件的数量和延续性使然。相反的安腾是risc结构intel生产,但是因为没有软件支持所以不成气候。但现在arm不一样,arm上有大量软件可以使用,最关键的是微软的加入,office系列使用人数远远超过其他任何软件。假如在arm上可以办公,那么其实很多人并不在意它不是x86。
作者: Tempestglen    时间: 2012-9-25 12:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: raini    时间: 2012-9-25 12:52
跟T神谈未来的Atom,他会跟你谈未来的Atom和现在的i5,i7比较!所以永远是赶不上T神的逻辑的。
作者: itany    时间: 2012-9-25 13:00
Tempestglen 发表于 2012-9-25 12:36
如果连钱都赚不了,那Arm谈何发展?
/////////
这就是你不懂arm商业模式了,arm最大的优势并不在 ...

真搞笑,高通不靠卖芯片赚钱靠什么?靠开发套件么?
三星最根本的是制造,之后是设计,什么Galaxy之流和笔记本一样,都是为了卖芯片才搞的。
至于现在出货量大的Andoid手机商,基本没有自己搞芯片的;华为要搞也是买核心授权,而不是自己研发。

真正为了卖手机搞芯片那也就是水果家这样卖天价机的。
你说水果可以花几亿去研发,是可以。但是有这个必要么?有这个钱省下不好么。
如果水果商要自己研发,可以把VIA买来自己做x86,为何不?因为水果商对Intel很满意。
而为啥Arm要自己低效率的去搞,那是因为对Arm实在不满意,而当时Intel的芯片又没办法装在手机上。

您说商业模式,难道水果一个手机卖到别家的两到三倍就是合理和稳固的?
水果的价格,和当年的Mac一样,肯定要崩塌的。
而没有这种超额毛利率养着,水果的所谓自足研发必然会会灰飞烟灭,水果必将投入Intel的怀抱,从手机到平板再到笔记本、台式机和服务器。

作者: itany    时间: 2012-9-25 13:07
Tempestglen 发表于 2012-9-25 12:45
是谁在玩鸵鸟?javascript在安卓4.0和ios5之间表现相差很大吗?苹果永远不会把A6拿给别人用,于是atom粉可 ...

呵呵,Atom频率高不了,和i5、i7有啥冲突?

倒是您了,要表现Arm阵营强大,就把Krait和Exynos等等都拉上;然后被踢爆性能一坨屎,就进行切割,把这一帮都踢开,专心说测试根本不公允的A6.

作者: itany    时间: 2012-9-25 13:16
lptt3 发表于 2012-9-25 12:05
你说的这个,我已经想过。并不存在x86一条指令能完成的arm需要更多指令的问题。因为x86内部管线也是risc化 ...

x64的程序可见的通用寄存器一点都不比arm少。
难道arm就不用进行寄存器换名么?不换名怎么跑3发射,10来级流水线?有几个现代处理器不需要进行寄存器换名的?

作者: lptt3    时间: 2012-9-25 13:18
本帖最后由 lptt3 于 2012-9-25 13:20 编辑
itany 发表于 2012-9-25 13:16
x64的程序可见的通用寄存器一点都不比arm少。
难道arm就不用进行寄存器换名么?不换名怎么跑3发射,10来 ...


我并没有研究过arm的isa,假如如你所说可见寄存器不比arm少,那么这部分的功耗效率就是一样。只有前端的区别。
作者: eternal0    时间: 2012-9-25 13:20
lptt3 发表于 2012-9-25 12:42
其实一直以来x86之所以能独霸pc市场是因为,软件的数量和延续性使然。相反的安腾是risc结构intel生产,但是 ...

独霸桌面市场的并不单纯是x86,而是x86+Windows。

ARM软件并不算多,而且都是手机、平板的,外加这几个操作系统完全不兼容。

ARM那贫弱的单核性能跑Office本身就很要命,ARM版Office还是阉割版。如果Windows RT设备不能做到足够便宜,那就没有任何优势。


作者: itany    时间: 2012-9-25 13:22
lptt3 发表于 2012-9-25 13:18
我并没有研究过arm的isa,假如如你所说,那么这部分的功耗效率就是一样。只有前端的区别。

前端该进行的东西Arm比x86一样不少。
我之前也说了,很早以前CPU前端是很简单的,带宽也不大,这时候指令解码所占的比例是比较大的,有所谓的RISC优势。
但是现在前端解码所占的比重很小,不存咋什么RISC优势了。带宽也不是白来的。

作者: lptt3    时间: 2012-9-25 13:23
eternal0 发表于 2012-9-25 13:20
独霸桌面市场的并不单纯是x86,而是x86+Windows。

ARM软件并不算多,而且都是手机、平板的,外加这几个 ...

目前情况是这样,但是未来是不断发展前进的,arm做成高功耗处理器也是可以的。从理论上来说,假如设计水平一样,工艺一样,那么arm的纯risc结构单线程效率会高一点点。
作者: daniel_k    时间: 2012-9-25 13:26
Tempestglen 发表于 2012-9-24 23:07
台积电把cortex A9操到3.1Ghz无压力。arm早就声称可以到2.5-3Ghz. 你atom不能,不代表arm不能。

我认为把可以调整的arm 软核和不可调整的atom 固核比有失偏颇,如果atom对频率优化并重新编译流片的话应该也可以做到————当然,现在的情况是atom不能而arm能,但我要表达的是软核与固核,可比性不大
作者: itany    时间: 2012-9-25 13:30
lptt3 发表于 2012-9-25 13:23
目前情况是这样,但是未来是不断发展前进的,arm做成高功耗处理器也是可以的。从理论上来说,假如设计水平 ...

认为RISC有优势,就和认为并行总线比串行总线快,都是上世纪的思维了
作者: daniel_k    时间: 2012-9-25 13:36
飞鸟真 发表于 2012-9-25 11:59
求解码耗电不大和消耗资源不多的资料

x86越快解码工作量压力越大

RISC确实存在linux一样的问题,发行版多、优化少,相对已经十分成熟的X86真的没什么优势好讲的,尤其是win平台上微软与intel这么多年的合作。
PS:X86的确是越快,解码工作量越大,所以才产生了并行发射多解码这种结构,就目前的酷睿来说,解码已经很暴力了,所以酷睿功耗是没办法做到arm那么低的。

作者: lptt3    时间: 2012-9-25 13:38
itany 发表于 2012-9-25 13:22
前端该进行的东西Arm比x86一样不少。
我之前也说了,很早以前CPU前端是很简单的,带宽也不大,这时候指令 ...

我认为正好相反。

首先你说的那些循环缓存,还有btb等,并不是x86才能实现的设计。包括ht的双份寄存器,btb,循环缓存,都是risc能够实现的。而且这些技术至今为止都没有利用在arm上边。未来假如有必要是完全可以加上的。

第二x86解码器一刻都不能闲置下来,特别是在带ht的处理器上。而且本身x86解码器必须应对复杂指令,arm的isa就没有这个需求。你把这个需求简单的归为带宽需求显然是混淆概念,纯玩嘴炮而不是想讨论什么。x86的复杂指令需要更多的解码周期,否则intel的3+1结构中的1是哪来干嘛的?而arm中就没有必要留个“1”这种东西。我们抛开其他的不说,一个“3+1”的解码工位效率肯定比一个“4”的低。这完全不是高带宽可以避免的。

我们可以举例,有4个简单指令,那么3+1的解码器需要两个周期。而4的只需要一个周期。再举例假如接连两个复杂指令,那么需要的是2 x 复杂解码器的工作周期。而4的没有这个情况。所以才有整体效率上要高一些的结论。

现在前端的带宽都不是问题的情况下,x86依然会有上述问题。何来带宽决定论?

作者: the_god_of_pig    时间: 2012-9-25 14:10
怎么不敢想?LZ太无知了,A6显得强是因为A5弱爆了,和当年P4=>core2一回事


作者: the_god_of_pig    时间: 2012-9-25 14:24
Tempestglen 发表于 2012-9-25 12:45
是谁在玩鸵鸟?javascript在安卓4.0和ios5之间表现相差很大吗?苹果永远不会把A6拿给别人用,于是atom粉可 ...

javascript在安卓4.0和ios5之间表现相差很大吗?

先别扯ios 和 安卓,就安卓4.1 4.0差别大不大?15%算不算大?更不必说两种不同系统的可比性,况且拿ios那种专门优化的系统和开放的安卓比效能本来就是智力问题

[attach]2035850[/attach]

作者: 飞鸟真    时间: 2012-9-25 14:29
itany 发表于 2012-9-25 12:22
事实上Intel决心抛弃的是arm

那叫卖掉相关业务,他们并不能也没办法抛弃arm,实际上intel想过抛弃x86,就是用ia64

ia64 intel和hp一起研发几十年,耗费资源难以估量
巨大的失败让intel从偏执狂变成了缩头龟

最可悲的是intel后来发现还是x86窝窝舒服就不想挪窝了,intel离开x86除了晶体管产能方面就一直一事无成了




作者: 飞鸟真    时间: 2012-9-25 14:33
divx001 发表于 2012-9-25 06:52
据说目前NV和三星都在A15上被ARM坑的不轻(双核A15跑1.5G功耗已经超越1.4G 四核A9),TI更是光打雷不下雨。 ...

nv被坑啥,如果a15不佳也是arm的问题,老黄早偷着乐开花了,那会让nv更显得卓尔不群

因为nv未来是押宝丹佛计划和另一个服务器计划,从tegra5开始,肯定的说就会改用丹佛cpu


作者: itany    时间: 2012-9-25 14:36
飞鸟真 发表于 2012-9-25 14:29
那叫卖掉相关业务,他们并不能也没办法抛弃arm,实际上intel想过抛弃x86,就是用ia64

ia64 intel和hp一 ...

IA64本来就是借鉴了RISC的思路, 只不过是MIMD的RISC罢了。
IA64的性能不尽如人意,只能说明一点,那就是RISC没有优势。正和诸多RISC走向末路一样,arm只是回光返照而已。

同样的,你说Intel变成缩头乌龟,实际上你敢说Xeon Phy和x86、x64是一个体系架构的?
Intel一直在进取。
同样的,如果说缩头乌龟,那么Arm才是缩头乌龟。

作者: 飞鸟真    时间: 2012-9-25 14:37
lptt3 发表于 2012-9-25 12:42
其实一直以来x86之所以能独霸pc市场是因为,软件的数量和延续性使然。相反的安腾是risc结构intel生产,但是 ...

ia64不是risc,是一种过于依靠软件编译器的超长指令架构
市场的失败也怪不到软件兼容,还没进入桌面就失败了
它没法提供足以成功的理论性能

ia64设计思想太天真才造成了杯具



作者: itany    时间: 2012-9-25 14:45
lptt3 发表于 2012-9-25 13:38
我认为正好相反。

首先你说的那些循环缓存,还有btb等,并不是x86才能实现的设计。包括ht的双份寄存器 ...

您有没有想过这个复杂解码器相对与分支预测所需要的功耗,完全是小小巫见大巫?
您有没有想过,本来x86一个指令就能解决的问题,Arm要几个指令,需要多少额外的带宽和译码资源呢?
通过编译器优化,复杂解码器完全可以基本处于空闲状态么

您说的x86译码器一直在工作,完全是错误的。
因为通过微操作缓存,Intel宣称Sandy Bridge的命中率是比较高的,(没记错是70%以上),这意味着前端实际上70%的时间都是闲着的。

另外,如果译码器决定了功耗,那么Intel完全可以把指令集换成Arm的,剩下用Sandy Bridge的架构,这样功耗和Arm相当,速度快得多,那岂不是一统江湖了?

作者: Tempestglen    时间: 2012-9-25 14:46
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2012-9-25 14:48
本帖最后由 itany 于 2012-9-25 14:53 编辑
飞鸟真 发表于 2012-9-25 14:37
ia64不是risc,是一种过于依靠软件编译器的超长指令架构
市场的失败也怪不到软件兼容,还没进入桌面就失 ...

呵,超长指令集只是把RISC指令进行打包执行而已
我早就说过,VLIW只是一种MIMD而已,指令还是RISC指令罢了。
你以为我的Itany从哪来的?我就是安腾的粉丝。IA64我不清楚么?

Power、MIPS、SPARC…… 这个完蛋的名单上,还要加上一个Arm。
从体系结构上看,丝毫看不出Arm相比MIPS有啥太高明的地方


作者: lptt3    时间: 2012-9-25 14:50
本帖最后由 lptt3 于 2012-9-25 15:08 编辑
itany 发表于 2012-9-25 14:45
您有没有想过这个复杂解码器相对与分支预测所需要的功耗,完全是小小巫见大巫?
您有没有想过,本来x86一 ...


。。。完全不知道你在说什么。。。

。。。哎呀~就如你空口白话的70%命中率,但高达30%的未命中率将要清洗管线重新解码。这部分开销不用计算?cache高达95%的命中率又怎么样?从新取指的延迟是cpu最大的损耗。70%也好意思说了啊?重新取指那么解码器的负担将是150%
,而150%的情况下3+1比4又要低一些。你能胡搅蛮缠什么,我顺着你玩就可以了。

循环缓存和btb这种技术并不是什么x86才能独有的技术。

作者: Tempestglen    时间: 2012-9-25 14:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2012-9-25 15:07
回 飞鸟真 :
本来微操作缓存就是对应于循环的,要么就是持续的命中,要么就是持续的不命中要前端供应,难道还需要解释么?本来Netburst年代就很清楚的事儿,怎么搞的这么恶心?
作者: itany    时间: 2012-9-25 15:10
本帖最后由 itany 于 2012-9-25 15:21 编辑
lptt3 发表于 2012-9-25 14:50
。。。完全不知道你在说什么。。。

。。。哎呀~就如你空口白话的70%飞命中率,但高达30%的未命中率将 ...

没说什么,你可以把这些都加上,就像AMD可以把这些都加上,然后做出渣一样
如果您认为Arm是指令集优势的话,那么何不让AMD把Bulldozer换了前端解码器,改Arm指令集把Intel推平呢?

另外微操作缓存没有命中需要清空管线?这不是搞笑呢么?
微操作缓存没命中的时候就当没有微操作缓存呗,Nehalem怎么过日子的Sandy Bridge照着过不就得了。

是的,正如你所言,Arm也要做分值预测,指令预读吧?所以,x86耗的电,arm照样要消耗。相同功能的程序,x86指令少,做到相同命中率所需的BTB单元就少,难道不省电?

作者: lptt3    时间: 2012-9-25 15:11
本帖最后由 lptt3 于 2012-9-25 15:26 编辑
itany 发表于 2012-9-25 15:10
没说什么,你可以把这些都加上,就像AMD可以把这些都加上,然后做出渣一样
如果您认为Arm是指令集优势的 ...


其实你说的sb改成arm,那确实是可以的,没有了3+1解码器,那么sb内部不能是微risc的4路嘛?

循环中的跳转总是一个方向?假如出现未命中,那么循环中的最后未命中时刻的计算结果如何保证是正确的?可以用这个结果计算下一步?

Nehalem和sb两相比较,由于sb还是有循环缓存投机所以在循环时性能较高,但未命中此时sb的解码器负担肯定比Nehalem更高。

况且这不是什么x86独有的技术,总之你不用洗,arm就不用洗。你洗arm也洗。3+1和4比还是效率要差一些。你能怎么地。

作者: CC9K    时间: 2012-9-25 15:14
真正为了卖手机搞芯片那也就是水果家这样卖天价机的。
你说水果可以花几亿去研发,是可以。但是有这个必要么?有这个钱省下不好么。
如果水果商要自己研发,可以把VIA买来自己做x86,为何不?因为水果商对Intel很满意。
而为啥Arm要自己低效率的去搞,那是因为对Arm实在不满意,而当时Intel的芯片又没办法装在手机上。
苹果一年的研发成本支出只有十几亿,其中大部分还用在系统和软件上面

研发ARM芯片有A9、A15架构打好的基础,不需要花费多少钱

按AnandTech的报道,苹果为开发A6的总投资是5亿美元,其中4亿是收购芯片公司Pa Semi和Intrinsity的费用,研发花费了1亿

作者: itany    时间: 2012-9-25 15:26
本帖最后由 itany 于 2012-9-25 15:27 编辑
lptt3 发表于 2012-9-25 15:11
其实你说的sb改成arm,那确实是可以的,没有了3+1解码器,那么sb内部不能是微risc的4路嘛?

循环中的 ...

退出循环必然导致微操作缓存里边内容失效,和分支是不是准确预测到循环结束都啥关系?预测到循环要结束就开始取指、解码就行了呗。

你要搞清楚的是,本来执行循环的时候是需要前端取指、解码反复运行的,现在有了微操作缓存,就不用反复运行了。就是这么个作用。和怎么分支预测、怎么推测执行,错了怎么清流水线没关系


作者: 飞鸟真    时间: 2012-9-25 15:27
本帖最后由 飞鸟真 于 2012-9-25 15:31 编辑
itany 发表于 2012-9-25 15:07
回 飞鸟真 :
本来微操作缓存就是对应于循环的,要么就是持续的命中,要么就是持续的不命中要前端供应,难 ...

解码器是x86非常复杂部分,和后面的执行单元数量和工作内容工作量都不相同。
就像你给人家剥半天瓜子人家可能一口吃了
只有以上都相同时才能得出70%命中等于70%空闲的结论

intel还没蠢到设计一种占优资源庞大的电路,在核心高速工作时,70%时间里都偷懒的芯片
更不会傻的去拼命加强它


作者: divx001    时间: 2012-9-25 15:32
本帖最后由 divx001 于 2012-9-25 15:32 编辑
飞鸟真 发表于 2012-9-25 14:33
nv被坑啥,如果a15不佳也是arm的问题,老黄早偷着乐开花了,那会让nv更显得卓尔不群

因为nv未来是押宝 ...

丹佛构架本来并不是为手机这种超低功耗设计,如果A15构架被验证是个类似P4那样失败的构架对NV和三星这样的厂商打击是非常巨大的,试想一下手机这种更新极其快速的产品1年甚至1年半都没有新SOC会是啥结果?

未来如何我们无法预测,但是眼前的事就是A15已经很有失败的味道了


作者: itany    时间: 2012-9-25 15:32
本帖最后由 itany 于 2012-9-25 15:35 编辑
飞鸟真 发表于 2012-9-25 15:27
解码器是x86非常复杂部分,和后面的执行单元数量和工作内容工作量都不相同。
就像你给人家剥半天瓜子人家 ...

本来Krait三个解码器,后边4个执行单元,数量也不相同。
至于说工作内容,Krait也是乱序推测执行的,哪能相同呢?工作量也不同啊。
照你说的,Arm的解码器是x86非常复杂部分,和x86也一样

如果说70%时间都偷懒,那么L1缓存的命中率还可以达到80%多呢,L2缓存是不是在偷懒呢?
把L2缓存去了?
Sandy Bridge的L2缓存命中率在95%以上(具体值忘了),难道L3缓存就没用了?搞笑吧?

作者: lptt3    时间: 2012-9-25 15:33
itany 发表于 2012-9-25 15:26
退出循环必然导致微操作缓存里边内容失效,和分支是不是准确预测到循环结束都啥关系?
你要搞清楚的是, ...

循环缓存并不是什么x86独有的,也从来没有什么解码器反复工作的情况,是你在意淫,本来循环中的指令是在btb中派发的。根本就没有什么反复工作的事情。循环缓存只是intel为了改进最后一跳总是出错而设计的。只是避免了最后一跳出错而已。。。

而解码器不工作,你循环后吃什么?70%的程序工作时间是循环才有70%的解码器不工作这个 可能。程序70%是循环?你太搞了。。。

作者: 飞鸟真    时间: 2012-9-25 15:36
divx001 发表于 2012-9-25 15:32
丹佛构架本来并不是为手机这种超低功耗设计,如果A15构架被验证是个类似P4那样失败的构架对NV和三星这样的 ...

丹佛计划其实变过好几次,不然不会这么漫长了。
现在看是移动和高性能两条腿走路,无需太担心。
另外说a15不成功也许对,但现在就断言失败尚早。


作者: itany    时间: 2012-9-25 15:42
本帖最后由 itany 于 2012-9-25 15:44 编辑
lptt3 发表于 2012-9-25 15:33
循环缓存并不是什么x86独有的,也从来没有什么解码器反复工作的情况,是你在意淫,本来循环中的指令是在b ...

您知道BTB里边存的是啥不?亲~
BTB里边存的是以地址方式表示的历史记录。知道地址,取值解码能省下啥?啥都省不下。
您是别人教的还是自己学的?

说循环后吃什么就搞笑了。
循环结束的时候再开呗

作者: lptt3    时间: 2012-9-25 15:50
本帖最后由 lptt3 于 2012-9-25 15:56 编辑
itany 发表于 2012-9-25 15:42
您知道BTB里边存的是啥不?亲~
BTB里边存的是以地址方式表示的历史记录。知道地址,取值解码能省下啥?啥 ...




开嘛亲?开就有3+1比4要低效的问题哦亲。。。

而且循环缓存本身的容量只有28个指令,超出了这个范围你不用解码你吃什么。。。

作者: itany    时间: 2012-9-25 15:57
lptt3 发表于 2012-9-25 15:50
开嘛亲?开就有3+1比4要低效的问题哦亲。。。

我说的是Sandy Bridge的BTB,Arm也一样。
Sandy Bridge的BTB据说有8K项,微操作缓存有1.5K项,BTB缓存指令?
您用自己的脑子想想,别再丢人。





欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4