POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
123
返回列表 发新帖
楼主: shu0202
打印 上一主题 下一主题

高手们没人讨论最近“推土机”的公开资料么?

[复制链接]
potomac 该用户已被删除
41#
发表于 2010-11-14 10:26 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

42#
发表于 2010-11-14 10:28 | 只看该作者

snb和bd其实都爆了不少了。双方其实都有一些匪夷所思的设计。

先说说这个avx256。snb号称支持avx256,但其实它的浮点/向量单元是基本沿用nehalem的128位单元----------snb根本没有256位向量单元。
不得不说intel的工程师很有创意。按他们的说法,在运行avx256指令时候补充另外128位向量的是snb的整型单元很明显avx256指令这时候要拆解成两条128位微操作,一条通过浮点单元执行,另一条通过整型单元执行。也就是说早期的avx256应该是很弱的,否则整型单元与浮点单元的延迟很可能差距很大,不能匹配。

bd其实倒是比较实在,比较暴力的解决办法。在一个模组中一个avx256同样拆解成两个128位操作,但是在两个128位向量单元里运行(更有可能是两个128位操作在128位单元里先后执行,最后综合一下)

同样运行avx256,snb一个核心可能整型浮点资源全部占据----对于单一进程来说问题不大,因为向量运算时候整型运算单元很可能是空闲的。而bd一个模组则只有浮点单元全占,两个整型单元空闲,另一个进程只要不使用浮点单元就是完全无阻碍的。

另外是bd核心号称4发射---2alu2agu。而k7/k8/k10号称3发射,但是3(alu+agu)。两者孰强孰弱现在还不好说-----k8虽然理论上有3个agu,却不是完整的存取单元,需要其他单元配合工作---这实际上是个省料方案,某些情况下很可能成了瓶颈。intel一直是存取单元独立,其并行能力对比大家都看得到。
回复 支持 反对

使用道具 举报

43#
发表于 2010-11-14 11:06 | 只看该作者
ekphone 发表于 2010-11-14 07:12
回复 深谷白云 的帖子

天使长居然有闲心和这些民用技术高人们扯了,这又不是雷达航电论坛

你是奶猫吗?
回复 支持 反对

使用道具 举报

44#
发表于 2010-11-14 11:16 | 只看该作者
不得不说一下,

神马的 共享啥啥 的啊, 神马的 这运算器,那运算器啊,  

CPU 界 不过就是一直在改变 固定逻辑单元跟可变成逻辑单元的比例及数量罢了。

AMD 不是计算业界的领导者,

盲目的 把 以前固定单元做成可编程单元, 这样做 等于是在赌一把,

天知道以后有多少软件会针对AMD的来进行优化,

不过有一点,这次的AMD 在跟着IBM 在走, 相信在FWQ领域应该比较有优势(相对K8而言),

消费级就算了,

从 几大PC 厂商对推土机的态度就知道。
回复 支持 反对

使用道具 举报

45#
发表于 2010-11-14 12:03 | 只看该作者
spinup 发表于 2010-11-14 10:28

snb和bd其实都爆了不少了。双方其实都有一些匪夷所思的设计。

回复 支持 反对

使用道具 举报

46#
发表于 2010-11-14 12:05 | 只看该作者
基本沿用nehalem的128位单元----------snb根本没有256位向量单元。-------------某人怎么解释?
回复 支持 反对

使用道具 举报

47#
发表于 2010-11-14 12:14 | 只看该作者
本帖最后由 PRAM 于 2010-11-14 12:23 编辑

生产成本低(有IBM当后台),产品先进的AMD(领先INTEL 5年)怎么这么惨------- file:///D:/Program%20Files/Tencent/QQ/Users/529380356/Image/`6BM`5`X9%@27)I4$)J1F2D.jpg
回复 支持 反对

使用道具 举报

48#
发表于 2010-11-14 12:15 | 只看该作者
本帖最后由 PRAM 于 2010-11-14 12:18 编辑

下一代永动机什么时候启动?
回复 支持 反对

使用道具 举报

49#
发表于 2010-11-14 12:34 | 只看该作者
回复 支持 反对

使用道具 举报

50#
发表于 2010-11-14 12:34 | 只看该作者
回复 支持 反对

使用道具 举报

51#
发表于 2010-11-14 12:48 | 只看该作者

nehalem

sandybridge
回复 支持 反对

使用道具 举报

52#
发表于 2010-11-14 14:28 | 只看该作者
达人出现
回复 支持 反对

使用道具 举报

53#
发表于 2010-11-14 15:20 | 只看该作者
某人想挖陷阱,但是陷了谁就不知道了
回复 支持 反对

使用道具 举报

54#
发表于 2010-11-14 16:18 | 只看该作者
本帖最后由 PRAM 于 2010-11-14 16:19 编辑

amd  2007年YY旧闻--------------毫無意外的,AMD預定公佈的效能測試,就是之前說過的「SPEC CPU 2006的整數浮點輸出率個別領先21%和50%」,比較基準是兩顆時脈2.6GHz的Opteron 2272SE和兩顆2.66GHz的Xeon DP x5355
回复 支持 反对

使用道具 举报

55#
发表于 2010-11-14 16:30 | 只看该作者
我只关心AM3+的主板啥时候出来
回复 支持 反对

使用道具 举报

56#
发表于 2010-11-15 20:54 | 只看该作者
深谷白云 发表于 2010-11-13 21:40
也就是这张图片是fans做的所以做不得准?所以上面写的256-bit AVX不是AMD的说法?

那是说AVX是256位的,执行还是拆成128来执行
就好比P4当年就只有64bit执行单元,128bit SSE要拆开成两个周期执行一样
回复 支持 反对

使用道具 举报

57#
发表于 2010-11-15 21:06 | 只看该作者
spinup 发表于 2010-11-14 12:48
nehalem

sandybridge

嘉兰大大,这个说的只是AVX的执行单元复用了SSE单元和整数单元的电路,并没有别的含义啊
实际上每个发射口每周期只能发射一条微指令,只不过之前有一部分电路是闲着的,现在给用起来了而已。
这种复用没可能降低吞吐能力,即便是在超线程的情况下。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-27 06:09

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表