POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 2525|回复: 6
打印 上一主题 下一主题

【转】D6970架构改变 新高端GPU Cayman简析【硬派网】

[复制链接]
跳转到指定楼层
1#
发表于 2010-11-2 11:17 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 love571437 于 2010-11-2 12:09 编辑

看不到图的直接:http://www.inpai.com.cn/doc/hard/137168.htm


第1页:高端GPU Cayman采用新架构


    AMD计划于11月推出的新款GPU「Radeon HD 6900(Cayman)」在GPU架构上将会发生改变。此产品属于AMD公司新系列GPU「Northern Islands」中的发烧级GPU。Northern Islands(北岛)中第一款性能级GPU「Radeon HD 6800(Barts)」与之前推出的「Radeon HD 5870(Cypress)」采用了基本相同的架构,但是Cayman则有所不同。




那么这次AMD为什么会在高端Cayman上采用新架构,而在Barts上依然使用以前的旧架构设计呢?上周在台北市内召开的技术峰会「AMD Technology Forum and Exhibit (AMD TFE)」上,AMD公司高层Eric Demers先生(GPG Chief Technology Officer, AMD)就有关Cayman进行了说明:“从风险管理的观点来看,新架构GPU的开发当面对核心尺寸和日程时均是十分危险的。如果核心尺寸过大,那么今后就有可能会影响到计划。因此新架构在高端发烧GPU上更适用。”

    说到原因的话,主要是由于发烧级GPU在成本上具有一定的灵活性。这样就算出现了成本提升,在产品价格上也有平衡的空间。而对于产品线上定位更低的价值级、性能级以及入门级等GPU产品上,由于产品本身价格就低,因此可以调整的空间就不大。因此这也是为什么AMD会在Cayman上采用新架构的第一个理由。




TSMC工艺路线图

    第二个理由就是此次计划在时间上非常紧。由于TSMC取消推出了32nm工艺,而当前的40nm工艺又不能跳过,因此远期产品计划的变更会随着时间的变化而越来越难。至于Cayman的推出日期,基本上会确定在圣诞期间,也就是11月底至12月这段时间。

    Eric Demers表示,如果不能够按照计划及时推出新产品,那么在200美元级显卡市场上AMD将可能会落在对手后面(估计是指GTX460系列),因此Barts,也就是Radeon HD 6800必须更早推出;而Cayman不用那么急,有时间采用新架构。另外就是由于工艺上仍然是使用TSMC 40nm工艺,因此Cayman架构变化的结果就是核心尺寸将会变大,而成本提升的可能性也会很高。

==============================================================================
Cayman核心构成分析

    在微架构方面的变化,主要是AMD GPU 基本处理单元VLIW(Very Long Instruction Word)处理器的构成,同时几何管线的容许量也得到了强化,但是仍不是架构根本性的变化。另外对于Cypress处理器的构成,AMD在介绍双精度浮点运算时曾介绍道:“Radeon HD 6900也就是Cayman,将会很好支持双精度浮点运算,其性能比率将会高于Radeon HD 5870。此次GPU内部发生了改变,Radeon HD 6800对单精度运算和双精度运算的比率是5分之一,而Radeon HD 6900则为4分之一。因此即使Radeon HD 6800拥有同样的流处理器数量,Radeon HD 6900的双精度运算性能也可以提升20%。”

    之前的Radeon HD 5800架构,在一个流处理核心中内置有5个单精度浮点(FP)运算单元,每个时间周期循环可以进行一次双精度浮点运算。因此,双精度/单精度比率为5分之一。那么Radeon HD 6900变成了4分之一,这意味核心构造出现了变化,这个具有重要的意义。




RV770 VLIW处理器

    AMD GPU自Radeon HD 2900(R600)以来就基本上保持着相同的构造,运算单元由「线程处理器(Thread Processor)」以及「VLIW处理器」组成。而VLIW处理器则由4个单精度FP MAD和1个单精度FP SFU组成。各个运算单元能够执行各自的指令。




SIMD发出VLIW指令

    VLIW处理器总共能够执行6条指令(5运算指令+1控制流量指令),AMD架构中长VLIW指令在编译程序时会包含6个指令。

==============================================================================
性能/核心效率与架构改进

    目前AMD GPU VLIW构成被分成了更多的块,而SIMD的各个运算单元也可以执行个别的指令。4-way MAD SIMD单元通过VLIW中的4个MAD单元进行了重组,同时**单元也兼有MAD功能。这样,能够在一个时钟周期最高实现5条指令运算的VLIW处理器就这样诞生了。

    这似乎意味着AMD的图形架构开始向更加的通用性方面发展。Demers先生在推出Radeon HD 5870的时候曾表示,将保持VLIW处理器的构成,并且会朝这个方面发展。在图形处理多的时候,这种构造将能够充分发挥Vec4 VLIW的效率。但是在非图形应用中,也会出现性能难以发挥的现像。




AMD/NVIDIA对比图



Radeon HD 6800概要

    虽然目前还并不十分清楚Cayman的微架构,不过通过其VLIW单元能够支持5条指令来看,与之前的GPU架构显然不同。由于AMD架构是以VLIW处理器为基本,因此其性能/核心效率比要优于NVIDIA架构。除了运算单元以下,指令控制部分的硬件限制也会更少一些。比如AMD架构中80个运算单元每个时钟循环会发出一条VLIW指令,而NVIDIA的GF100有36个运算单元则每2个时钟运行一次,发出2个不同的指令。




GPU核心尺寸变化图



GPU处理器数量对比

    如果AMD采用小核心设计,灵活性会相对高些,但是指令发出的上限会受到限制。由于Cayman仍然使用的是当前的40nm工艺,因此晶体管数量提升的空间有限。如果不想采用NVIDIA公司的大核心方案,那么AMD除非进行一场彻底的变革。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
 楼主| 发表于 2010-11-2 11:27 | 只看该作者
WHY?
我怕图片的网链不好用,大家可能看不见图,就把图片保存下来,又用附件上传,为什么只有最后一张看得见啊,是单张图片不超过100K,还是所有图片加一块不许超过100K?
真闹心,
回复 支持 反对

使用道具 举报

3#
发表于 2010-11-2 11:32 | 只看该作者
图片全挂,换图床吧,tu.6.cn算了
回复 支持 反对

使用道具 举报

头像被屏蔽
4#
发表于 2010-11-2 11:39 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
5#
发表于 2010-11-2 11:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

6#
发表于 2010-11-2 11:49 | 只看该作者
LZ的帖子图片都有点问题,换个图床吧
回复 支持 反对

使用道具 举报

7#
发表于 2010-11-2 15:38 | 只看该作者
价格合适点,回到48时代的性价比,我就重回A卡。。。。68系列的价格和性能,让人很伤心。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-12 14:01

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表