POPPUR爱换

标题: 高手们没人讨论最近“推土机”的公开资料么？ [打印本页]

作者: shu0202 时间: 2010-11-12 23:17
标题: 高手们没人讨论最近“推土机”的公开资料么？
难道这里的高手们眼睛里只有Intel的SB了吗？
[attach]1424412[/attach]

先来分析一下这张图，“推土机”每模块两个整数运算器共用浮点运算器，和K10传统的核心相比每核心指令发射由三增加到四，浮点运算器设计上的改变也是显而易见的，这样的变化对性能有什么样的影响？另外似乎是每核心整数运算单元缩减了1/3，但是以模块算又增加了1/3，指令发射数却增加了5/3，和K10的双核比较应该也是各有长短……但是面积上相当有优势。

[attach]1424425[/attach]

这是服务器芯片性能对比参照，看样子是50%的提升，不知道对桌面有没有参考意义？

作者: potomac 时间: 2010-11-12 23:23
提示: 作者被禁止或删除内容自动屏蔽

作者: ck7 时间: 2010-11-13 00:20
板凳，等会看

作者: amd```fans 时间: 2010-11-13 07:57
坐地板，等amd高手来说

作者: zzzlcy 时间: 2010-11-13 09:22
偶也来看看，听听高手们的说法……

作者: tcgg1983 时间: 2010-11-13 09:39

等高手言论膜拜A神

作者: fonynu 时间: 2010-11-13 09:58
天顶星技术，尔等凡人怎敢轻易论断

作者: openlock 时间: 2010-11-13 10:54
看不懂，坐等高手解答

作者: zhangkk 时间: 2010-11-13 10:57
过几个月再讨论也不迟阿

作者: elisha 时间: 2010-11-13 11:29
SNB也没什么人讨论啊

只看架构能估出性能的都是神人

作者: 6892872 时间: 2010-11-13 12:29
看架构就能说的出来性能的人一般都在AMD开发芯片中

作者: malgerz 时间: 2010-11-13 12:31
有什么好讨论的？不就那个鸟样，AMD就是扶不起的阿抖

作者: 本人．拉登 时间: 2010-11-13 12:35
跑pi能过q6600吗?

作者: kinno 时间: 2010-11-13 14:19
面积，面积，在最近几年amd被intel打压的狠的时期，很多af找不到反击点，但是从hd5那里发现，amd核心面积很有优势，于是近一年来，amd不再比拼性能，开始算起面积了

作者: ITANIUM2 时间: 2010-11-13 17:19
不管它说啥都没人敢信啊，A家的信用前几年败的太厉害

在巴顿时代我还是个坚定的A饭...

作者: itany 时间: 2010-11-13 17:53
楼主，你光看到前端宽度从3变成4，没看到是从单个核心专用变成两个核心共用么？

作者: the_god_of_pig 时间: 2010-11-13 18:19
还没出来怎么讨论

作者: nom8393 时间: 2010-11-13 18:22
本帖最后由 nom8393 于 2010-11-13 18:22 编辑

又没有测试结果，难道性能要靠YY么？

作者: xf-108 时间: 2010-11-13 19:04

itany 发表于 2010-11-13 17:53
楼主，你光看到前端宽度从3变成4，没看到是从单个核心专用变成两个核心共用么？

单模块四发射，杯具啊。

继续一模块打一核心吧，不要被反秒了。

作者: 食人鲛 时间: 2010-11-13 19:29
如不能兼容AM3接口主板，那就是很失败的一代。

作者: 深谷白云 时间: 2010-11-13 20:07
怎么我看到的是integer issues per cycle是4？

作者: xf-108 时间: 2010-11-13 20:51

nom8393 发表于 2010-11-13 18:22
又没有测试结果，难道性能要靠YY么？

性能提升预想PPT出了不少了吧？人家可是PPT专业户。
一会儿比骂你酷儿提升50%，一会儿又是比骂你酷儿提升77%……
PPT的升级速度那叫一个快……

作者: heng66 时间: 2010-11-13 20:54
出来了直接看评测好了，学不来显卡区那边都是YY未来的东西。

作者: itany 时间: 2010-11-13 21:04

深谷白云发表于 2010-11-13 20:07
怎么我看到的是integer issues per cycle是4？

说的是一个模组，两个核心

作者: 深谷白云 时间: 2010-11-13 21:11
本帖最后由深谷白云于 2010-11-13 21:12 编辑

itany 发表于 2010-11-13 21:04
说的是一个模组，两个核心

那是256-bit AVX吧？

作者: itany 时间: 2010-11-13 21:16

深谷白云发表于 2010-11-13 21:11
那是256-bit AVX吧？

神马256bit AVX，Bulldozer有256bit运算单元吗

作者: 深谷白云 时间: 2010-11-13 21:21

itany 发表于 2010-11-13 21:16
神马256bit AVX，Bulldozer有256bit运算单元吗

这个我懒得跟你争论了，既然是看着图片说那就以图片为依据吧

作者: xf-108 时间: 2010-11-13 21:29

深谷白云发表于 2010-11-13 21:21
这个我懒得跟你争论了，既然是看着图片说那就以图片为依据吧

两个128bit加一起不等于256bit……
按照AMD官方说法，那应该叫胶水。

作者: 深谷白云 时间: 2010-11-13 21:33
本帖最后由深谷白云于 2010-11-13 21:33 编辑

xf-108 发表于 2010-11-13 21:29
两个128bit加一起不等于256bit……
按照AMD官方说法，那应该叫胶水。

这图片是fans自己做的？不算官方的？

作者: xf-108 时间: 2010-11-13 21:35

深谷白云发表于 2010-11-13 21:33
这图片是fans自己做的？不算官方的？

PPT专业户说的很清楚了啊，两个128bit加起来总共256bit，按照农企胶水定律，这就是胶水啊。
至于胶水算不算256bt，这个你得问PPT专业户啊。

作者: frankincense 时间: 2010-11-13 21:38

xf-108 发表于 2010-11-13 19:04
单模块四发射，杯具啊。

继续一模块打一核心吧，不要被反秒了。

实际上就变成模块VS核心(Intel)，核心(AMD)VS线程

作者: 深谷白云 时间: 2010-11-13 21:40

xf-108 发表于 2010-11-13 21:35
PPT专业户说的很清楚了啊，两个128bit加起来总共256bit，按照农企胶水定律，这就是胶水啊。
至于胶水算不 ...

也就是这张图片是fans做的所以做不得准？所以上面写的256-bit AVX不是AMD的说法？

作者: xf-108 时间: 2010-11-13 21:41

frankincense 发表于 2010-11-13 21:38
实际上就变成模块VS核心(Intel)，核心(AMD)VS线程

执行资源上一个模块还是有优势的8:6。发射数打平4:4。

作者: frankincense 时间: 2010-11-13 22:36

xf-108 发表于 2010-11-13 21:41
执行资源上一个模块还是有优势的8:6。发射数打平4:4。

单论执行单元AMD从来都没落后过只是效率很成问题

作者: xf-108 时间: 2010-11-13 22:47

frankincense 发表于 2010-11-13 22:36
单论执行单元AMD从来都没落后过只是效率很成问题

总不能一模块被一核心秒了吧？

作者: xf-108 时间: 2010-11-13 22:51
本帖最后由 xf-108 于 2010-11-13 22:51 编辑

深谷白云发表于 2010-11-13 21:40
也就是这张图片是fans做的所以做不得准？所以上面写的256-bit AVX不是AMD的说法？

两个128bit单元加起来可以做一部分的256bit单元功能。而不是有256bit单元。农企粉明白否？

作者: jackied203 时间: 2010-11-13 23:14
AM3上不了没打算再用AMD 系统响应之类都比不过I

作者: Jason21 时间: 2010-11-13 23:26
没有样品、没有测试，让人怎么讨论了，SNB跑测试都有一年了

作者: ekphone 时间: 2010-11-14 07:12
本帖最后由 ekphone 于 2010-11-14 08:50 编辑

回复深谷白云的帖子

天使长居然有闲心和这些民用技术高人们扯了，这又不是雷达航电论坛

作者: potomac 时间: 2010-11-14 10:11
提示: 作者被禁止或删除内容自动屏蔽

作者: potomac 时间: 2010-11-14 10:26
提示: 作者被禁止或删除内容自动屏蔽

作者: spinup 时间: 2010-11-14 10:28

snb和bd其实都爆了不少了。双方其实都有一些匪夷所思的设计。

先说说这个avx256。snb号称支持avx256，但其实它的浮点/向量单元是基本沿用nehalem的128位单元----------snb根本没有256位向量单元。
不得不说intel的工程师很有创意。按他们的说法，在运行avx256指令时候补充另外128位向量的是snb的整型单元

很明显avx256指令这时候要拆解成两条128位微操作，一条通过浮点单元执行，另一条通过整型单元执行。也就是说早期的avx256应该是很弱的，否则整型单元与浮点单元的延迟很可能差距很大，不能匹配。

bd其实倒是比较实在，比较暴力的解决办法。在一个模组中一个avx256同样拆解成两个128位操作，但是在两个128位向量单元里运行（更有可能是两个128位操作在128位单元里先后执行，最后综合一下）

同样运行avx256，snb一个核心可能整型浮点资源全部占据----对于单一进程来说问题不大，因为向量运算时候整型运算单元很可能是空闲的。而bd一个模组则只有浮点单元全占，两个整型单元空闲，另一个进程只要不使用浮点单元就是完全无阻碍的。

另外是bd核心号称4发射---2alu2agu。而k7/k8/k10号称3发射，但是3（alu+agu）。两者孰强孰弱现在还不好说-----k8虽然理论上有3个agu，却不是完整的存取单元，需要其他单元配合工作---这实际上是个省料方案，某些情况下很可能成了瓶颈。intel一直是存取单元独立，其并行能力对比大家都看得到。

作者: 深谷白云 时间: 2010-11-14 11:06

ekphone 发表于 2010-11-14 07:12
回复深谷白云的帖子

天使长居然有闲心和这些民用技术高人们扯了，这又不是雷达航电论坛

你是奶猫吗？

作者: bigpao007 时间: 2010-11-14 11:16
不得不说一下，

神马的共享啥啥的啊，神马的这运算器，那运算器啊，

CPU 界不过就是一直在改变固定逻辑单元跟可变成逻辑单元的比例及数量罢了。

AMD 不是计算业界的领导者，

盲目的把以前固定单元做成可编程单元，这样做等于是在赌一把，

天知道以后有多少软件会针对AMD的来进行优化，

不过有一点，这次的AMD 在跟着IBM 在走，相信在FWQ领域应该比较有优势（相对K8而言），

消费级就算了，

从几大PC 厂商对推土机的态度就知道。

作者: PRAM 时间: 2010-11-14 12:03

spinup 发表于 2010-11-14 10:28

snb和bd其实都爆了不少了。双方其实都有一些匪夷所思的设计。

作者: PRAM 时间: 2010-11-14 12:05
基本沿用nehalem的128位单元----------snb根本没有256位向量单元。-------------某人怎么解释？

作者: PRAM 时间: 2010-11-14 12:14
本帖最后由 PRAM 于 2010-11-14 12:23 编辑

生产成本低(有IBM当后台），产品先进的AMD（领先INTEL 5年）怎么这么惨------- file:///D:/Program%20Files/Tencent/QQ/Users/529380356/Image/`6BM`5`X9%@27)I4$)J1F2D.jpg

作者: PRAM 时间: 2010-11-14 12:15
本帖最后由 PRAM 于 2010-11-14 12:18 编辑

下一代永动机什么时候启动？

作者: PRAM 时间: 2010-11-14 12:34

作者: spinup 时间: 2010-11-14 12:48

nehalem

sandybridge

作者: kinno 时间: 2010-11-14 14:28
达人出现

作者: the_god_of_pig 时间: 2010-11-14 15:20
某人想挖陷阱，但是陷了谁就不知道了

作者: PRAM 时间: 2010-11-14 16:18
本帖最后由 PRAM 于 2010-11-14 16:19 编辑

amd 2007年YY旧闻--------------毫無意外的，AMD預定公佈的效能測試，就是之前說過的「SPEC CPU 2006的整數浮點輸出率個別領先21%和50%」，比較基準是兩顆時脈2.6GHz的Opteron 2272SE和兩顆2.66GHz的Xeon DP x5355

作者: jonjonchen 时间: 2010-11-14 16:30
我只关心AM3＋的主板啥时候出来

作者: itany 时间: 2010-11-15 20:54

深谷白云发表于 2010-11-13 21:40
也就是这张图片是fans做的所以做不得准？所以上面写的256-bit AVX不是AMD的说法？

那是说AVX是256位的，执行还是拆成128来执行
就好比P4当年就只有64bit执行单元，128bit SSE要拆开成两个周期执行一样

作者: itany 时间: 2010-11-15 21:06

spinup 发表于 2010-11-14 12:48
nehalem

sandybridge

嘉兰大大，这个说的只是AVX的执行单元复用了SSE单元和整数单元的电路，并没有别的含义啊
实际上每个发射口每周期只能发射一条微指令，只不过之前有一部分电路是闲着的，现在给用起来了而已。
这种复用没可能降低吞吐能力，即便是在超线程的情况下。

欢迎光临 POPPUR爱换 (https://we.poppur.com/)