POPPUR爱换

标题: 高手们没人讨论最近“推土机”的公开资料么? [打印本页]

作者: shu0202    时间: 2010-11-12 23:17
标题: 高手们没人讨论最近“推土机”的公开资料么?
难道这里的高手们眼睛里只有Intel的SB了吗?
[attach]1424412[/attach]

先来分析一下这张图,“推土机”每模块两个整数运算器共用浮点运算器,和K10传统的核心相比每核心指令发射由三增加到四,浮点运算器设计上的改变也是显而易见的,这样的变化对性能有什么样的影响?另外似乎是每核心整数运算单元缩减了1/3,但是以模块算又增加了1/3,指令发射数却增加了5/3,和K10的双核比较应该也是各有长短……但是面积上相当有优势。

[attach]1424425[/attach]

这是服务器芯片性能对比参照,看样子是50%的提升,不知道对桌面有没有参考意义?


作者: potomac    时间: 2010-11-12 23:23
提示: 作者被禁止或删除 内容自动屏蔽
作者: ck7    时间: 2010-11-13 00:20
板凳,等会看
作者: amd```fans    时间: 2010-11-13 07:57
坐地板,等amd高手来说
作者: zzzlcy    时间: 2010-11-13 09:22
偶也来看看,听听高手们的说法……
作者: tcgg1983    时间: 2010-11-13 09:39
等高手言论 膜拜A神
作者: fonynu    时间: 2010-11-13 09:58
天顶星技术,尔等凡人怎敢轻易论断
作者: openlock    时间: 2010-11-13 10:54
看不懂,坐等高手解答
作者: zhangkk    时间: 2010-11-13 10:57
过几个月再讨论也不迟阿
作者: elisha    时间: 2010-11-13 11:29
SNB也没什么人讨论啊

只看架构能估出性能的都是神人
作者: 6892872    时间: 2010-11-13 12:29
看架构就能说的出来性能的人一般都在AMD开发芯片中
作者: malgerz    时间: 2010-11-13 12:31
有什么好讨论的?不就那个鸟样,AMD就是扶不起的阿抖
作者: 本人.拉登    时间: 2010-11-13 12:35
跑pi能过q6600吗?
作者: kinno    时间: 2010-11-13 14:19
面积,面积,在最近几年amd被intel打压的狠的时期,很多af找不到反击点,但是从hd5那里发现,amd核心面积很有优势,于是近一年来,amd不再比拼性能,开始算起面积了
作者: ITANIUM2    时间: 2010-11-13 17:19
不管它说啥都没人敢信啊,A家的信用前几年败的太厉害

在巴顿时代我还是个坚定的A饭...
作者: itany    时间: 2010-11-13 17:53
楼主,你光看到前端宽度从3变成4,没看到是从单个核心专用变成两个核心共用么?
作者: the_god_of_pig    时间: 2010-11-13 18:19
还没出来怎么讨论
作者: nom8393    时间: 2010-11-13 18:22
本帖最后由 nom8393 于 2010-11-13 18:22 编辑

又没有测试结果,难道性能要靠YY么?
作者: xf-108    时间: 2010-11-13 19:04
itany 发表于 2010-11-13 17:53
楼主,你光看到前端宽度从3变成4,没看到是从单个核心专用变成两个核心共用么?

单模块四发射,杯具啊。

继续一模块打一核心吧,不要被反秒了。

作者: 食人鲛    时间: 2010-11-13 19:29
如不能兼容AM3接口主板,那就是很失败的一代。
作者: 深谷白云    时间: 2010-11-13 20:07
怎么我看到的是integer issues per cycle是4?
作者: xf-108    时间: 2010-11-13 20:51
nom8393 发表于 2010-11-13 18:22
又没有测试结果,难道性能要靠YY么?

性能提升预想PPT出了不少了吧?人家可是PPT专业户。
一会儿比骂你酷儿提升50%,一会儿又是比骂你酷儿提升77%……
PPT的升级速度那叫一个快……

作者: heng66    时间: 2010-11-13 20:54
出来了直接看评测好了, 学不来显卡区那边都是YY未来的东西。
作者: itany    时间: 2010-11-13 21:04
深谷白云 发表于 2010-11-13 20:07
怎么我看到的是integer issues per cycle是4?

说的是一个模组,两个核心
作者: 深谷白云    时间: 2010-11-13 21:11
本帖最后由 深谷白云 于 2010-11-13 21:12 编辑
itany 发表于 2010-11-13 21:04
说的是一个模组,两个核心


那是256-bit  AVX吧?

作者: itany    时间: 2010-11-13 21:16
深谷白云 发表于 2010-11-13 21:11
那是256-bit  AVX吧?

神马256bit AVX,Bulldozer有256bit运算单元吗
作者: 深谷白云    时间: 2010-11-13 21:21
itany 发表于 2010-11-13 21:16
神马256bit AVX,Bulldozer有256bit运算单元吗

这个我懒得跟你争论了,既然是看着图片说那就以图片为依据吧
作者: xf-108    时间: 2010-11-13 21:29
深谷白云 发表于 2010-11-13 21:21
这个我懒得跟你争论了,既然是看着图片说那就以图片为依据吧

两个128bit加一起不等于256bit……
按照AMD官方说法,那应该叫胶水。

作者: 深谷白云    时间: 2010-11-13 21:33
本帖最后由 深谷白云 于 2010-11-13 21:33 编辑
xf-108 发表于 2010-11-13 21:29
两个128bit加一起不等于256bit……
按照AMD官方说法,那应该叫胶水。


这图片是fans自己做的?不算官方的?

作者: xf-108    时间: 2010-11-13 21:35
深谷白云 发表于 2010-11-13 21:33
这图片是fans自己做的?不算官方的?

PPT专业户说的很清楚了啊,两个128bit加起来总共256bit,按照农企胶水定律,这就是胶水啊。
至于胶水算不算256bt,这个你得问PPT专业户啊。

作者: frankincense    时间: 2010-11-13 21:38
xf-108 发表于 2010-11-13 19:04
单模块四发射,杯具啊。

继续一模块打一核心吧,不要被反秒了。

实际上就变成模块VS核心(Intel),核心(AMD)VS线程
作者: 深谷白云    时间: 2010-11-13 21:40
xf-108 发表于 2010-11-13 21:35
PPT专业户说的很清楚了啊,两个128bit加起来总共256bit,按照农企胶水定律,这就是胶水啊。
至于胶水算不 ...

也就是这张图片是fans做的所以做不得准?所以上面写的256-bit AVX不是AMD的说法?
作者: xf-108    时间: 2010-11-13 21:41
frankincense 发表于 2010-11-13 21:38
实际上就变成模块VS核心(Intel),核心(AMD)VS线程

执行资源上一个模块还是有优势的8:6。发射数打平4:4。
作者: frankincense    时间: 2010-11-13 22:36
xf-108 发表于 2010-11-13 21:41
执行资源上一个模块还是有优势的8:6。发射数打平4:4。

单论执行单元AMD从来都没落后过只是效率很成问题

作者: xf-108    时间: 2010-11-13 22:47
frankincense 发表于 2010-11-13 22:36
单论执行单元AMD从来都没落后过只是效率很成问题

总不能一模块被一核心秒了吧?
作者: xf-108    时间: 2010-11-13 22:51
本帖最后由 xf-108 于 2010-11-13 22:51 编辑
深谷白云 发表于 2010-11-13 21:40
也就是这张图片是fans做的所以做不得准?所以上面写的256-bit AVX不是AMD的说法?


两个128bit单元加起来可以做一部分的256bit单元功能。而不是有256bit单元。农企粉明白否?
作者: jackied203    时间: 2010-11-13 23:14
AM3上不了 没打算再用AMD 系统响应之类都比不过I
作者: Jason21    时间: 2010-11-13 23:26
没有样品、没有测试,让人怎么讨论了,SNB跑测试都有一年了
作者: ekphone    时间: 2010-11-14 07:12
本帖最后由 ekphone 于 2010-11-14 08:50 编辑

回复 深谷白云 的帖子

天使长居然有闲心和这些民用技术高人们扯了,这又不是雷达航电论坛
作者: potomac    时间: 2010-11-14 10:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: potomac    时间: 2010-11-14 10:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: spinup    时间: 2010-11-14 10:28

snb和bd其实都爆了不少了。双方其实都有一些匪夷所思的设计。

先说说这个avx256。snb号称支持avx256,但其实它的浮点/向量单元是基本沿用nehalem的128位单元----------snb根本没有256位向量单元。
不得不说intel的工程师很有创意。按他们的说法,在运行avx256指令时候补充另外128位向量的是snb的整型单元很明显avx256指令这时候要拆解成两条128位微操作,一条通过浮点单元执行,另一条通过整型单元执行。也就是说早期的avx256应该是很弱的,否则整型单元与浮点单元的延迟很可能差距很大,不能匹配。

bd其实倒是比较实在,比较暴力的解决办法。在一个模组中一个avx256同样拆解成两个128位操作,但是在两个128位向量单元里运行(更有可能是两个128位操作在128位单元里先后执行,最后综合一下)

同样运行avx256,snb一个核心可能整型浮点资源全部占据----对于单一进程来说问题不大,因为向量运算时候整型运算单元很可能是空闲的。而bd一个模组则只有浮点单元全占,两个整型单元空闲,另一个进程只要不使用浮点单元就是完全无阻碍的。

另外是bd核心号称4发射---2alu2agu。而k7/k8/k10号称3发射,但是3(alu+agu)。两者孰强孰弱现在还不好说-----k8虽然理论上有3个agu,却不是完整的存取单元,需要其他单元配合工作---这实际上是个省料方案,某些情况下很可能成了瓶颈。intel一直是存取单元独立,其并行能力对比大家都看得到。
作者: 深谷白云    时间: 2010-11-14 11:06
ekphone 发表于 2010-11-14 07:12
回复 深谷白云 的帖子

天使长居然有闲心和这些民用技术高人们扯了,这又不是雷达航电论坛

你是奶猫吗?
作者: bigpao007    时间: 2010-11-14 11:16
不得不说一下,

神马的 共享啥啥 的啊, 神马的 这运算器,那运算器啊,  

CPU 界 不过就是一直在改变 固定逻辑单元跟可变成逻辑单元的比例及数量罢了。

AMD 不是计算业界的领导者,

盲目的 把 以前固定单元做成可编程单元, 这样做 等于是在赌一把,

天知道以后有多少软件会针对AMD的来进行优化,

不过有一点,这次的AMD 在跟着IBM 在走, 相信在FWQ领域应该比较有优势(相对K8而言),

消费级就算了,

从 几大PC 厂商对推土机的态度就知道。

作者: PRAM    时间: 2010-11-14 12:03
spinup 发表于 2010-11-14 10:28

snb和bd其实都爆了不少了。双方其实都有一些匪夷所思的设计。


作者: PRAM    时间: 2010-11-14 12:05
基本沿用nehalem的128位单元----------snb根本没有256位向量单元。-------------某人怎么解释?

作者: PRAM    时间: 2010-11-14 12:14
本帖最后由 PRAM 于 2010-11-14 12:23 编辑

生产成本低(有IBM当后台),产品先进的AMD(领先INTEL 5年)怎么这么惨------- file:///D:/Program%20Files/Tencent/QQ/Users/529380356/Image/`6BM`5`X9%@27)I4$)J1F2D.jpg
作者: PRAM    时间: 2010-11-14 12:15
本帖最后由 PRAM 于 2010-11-14 12:18 编辑

下一代永动机什么时候启动?

作者: PRAM    时间: 2010-11-14 12:34

作者: PRAM    时间: 2010-11-14 12:34

作者: spinup    时间: 2010-11-14 12:48

nehalem

sandybridge

作者: kinno    时间: 2010-11-14 14:28
达人出现
作者: the_god_of_pig    时间: 2010-11-14 15:20
某人想挖陷阱,但是陷了谁就不知道了
作者: PRAM    时间: 2010-11-14 16:18
本帖最后由 PRAM 于 2010-11-14 16:19 编辑

amd  2007年YY旧闻--------------毫無意外的,AMD預定公佈的效能測試,就是之前說過的「SPEC CPU 2006的整數浮點輸出率個別領先21%和50%」,比較基準是兩顆時脈2.6GHz的Opteron 2272SE和兩顆2.66GHz的Xeon DP x5355
作者: jonjonchen    时间: 2010-11-14 16:30
我只关心AM3+的主板啥时候出来
作者: itany    时间: 2010-11-15 20:54
深谷白云 发表于 2010-11-13 21:40
也就是这张图片是fans做的所以做不得准?所以上面写的256-bit AVX不是AMD的说法?

那是说AVX是256位的,执行还是拆成128来执行
就好比P4当年就只有64bit执行单元,128bit SSE要拆开成两个周期执行一样

作者: itany    时间: 2010-11-15 21:06
spinup 发表于 2010-11-14 12:48
nehalem

sandybridge

嘉兰大大,这个说的只是AVX的执行单元复用了SSE单元和整数单元的电路,并没有别的含义啊
实际上每个发射口每周期只能发射一条微指令,只不过之前有一部分电路是闲着的,现在给用起来了而已。
这种复用没可能降低吞吐能力,即便是在超线程的情况下。





欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4