AMD 下一代 GPU 架构 Evergreen 讨论专贴

Edison · 发表于 2009-4-17 09:32

现在 AMD 的 RV790 已经上市，各类测试报告也已经在各网站发表，对其体系架构现在大家基本上是明了了，不过到目前为止，尚未有任何关于 AMD 下一代体系架构的消息出现。

为了方便大家讨论 RV790 的下一代架构（RV8XX ？），特别建立此讨论串，本主题的讨论风格将如同之前 Larrabee 讨论主题，所有讨论将以技术分析展开，需要提醒大家的是，我们这里讨论的是 RV790 的真正下一代架构，而不是基于 RV790 的工艺改进版。由于没有任何相关的资料，因此本主题中的大量讨论都是猜测性质，请勿依此为准。

为了大家的讨论更加集中，我在这里为大家提供几个相关的话题。

1、 R700 体系架构中，你觉得最主要的特色是什么呢？最好能有一些专业的测试数据来辅证。
2、 R700 体系架构中，最主要的问题是什么呢？下一代架构是否会延续这个架构的基本框架做优化呢？
3、下一代架构中你认为会在在那些方面作出改进？ DX11？动态分支性能？双精度性能？AA性能/算法？Tessellation？等等。
4、你想到与之相关的技术分析、预测。

这个讨论串会作长期保留，请大家在讨论的时候互相尊重，大致的要求如下：

1、请不要把其他网站的新闻照抄过来，如果你需要大家关注其内容，只需要把链接提供，照搬的内容我们会予以删除。
2、与上面或者其他网友提供的信息重复或者重叠的内容请不要再引用。
3、请注意网络礼节。

关于 NVIDIA 的下一代体系架构讨论，我们已有另外专门的讨论串。

参考：

AMD R700 指令集架构文档下载：
http://developer.amd.com/gpu_ass ... et_Architecture.pdf

AMD R600 指令集架构文档下载：
www.x.org/docs/AMD/r600isa.pdf

末世纪阿卡 · 发表于 2009-4-17 17:16

再以增加流处理器数量的方法来提高性能的方法并不可取～～

如何在效率上进行更合理优化的利用，应该是R800系列的一个重点，或许AMD下一代架构显卡会比较靠近NVIDIA现在的一些思路！

考虑到微软的态度，在DX11以及抗锯齿性能上，AMD显卡我依然看好！

gz_easy · 发表于 2009-4-17 18:05

增加晶体管/shader是必然的，也是最直接提升性能的方式之一；DX10->DX11称不上革命，所以预计AMD下一代GPU会延续上一代架构基础上改进。

greatarchon · 发表于 2009-4-18 14:46

RV8xx应该是R600架构的终结，增加SP是无可避免的，但是相信会对利用率进行优化，同时在40nm制程下更好的控制功耗，现在的rv770/790晶体管密度过大导致功耗猛增啊

Asuka · 发表于 2009-4-18 16:06

其实根本不用预测了，现在看来R8XX几乎就是一定的东西

我说几个关键词：

1. Tessellation；Tessellation这个将是DX11在游戏方面的代表技术，个人认为也将是未来游戏画面突破的保证。在从sm2.0到sm4.0，3D游戏把效果提升全部押宝到无限增长的shader需求上以后，Tessellation把突破口重新正本清源，回到多边形上来，这个是正道

2. Compute Shader；微软总是慢半拍，也总是恰到好处。GPGPU应用现在漫天飞，该是老大出来统一江湖的时候了

3. multi-theading；前面两个都是特性方面的改变，这个才是给整个架构输血的心脏。shader要做到“不仅是shader”，Graphics Processing Units 要成为General-Purpose Units，本质上都必须依赖multi-theading架构的精进。R8XX必然在multi-theading方面做出改变或者说重大革新，个人认为R8XX除了每个thread的reg file必须符合DX11标准外，应该在active thread select等方面也做了改进，细节就不得而知了

4. SIMD、每平方毫米性能、每晶体管性能；毫无疑问，R800会在这条路上坚持走下去，已经看到曙光了。DX11会在一个方面提供强力的支持，那就是多GPU和多线程渲染的支持方面。如果能某种程度上共享frame buffer，那么G71首先提出的“性能+性能=旗舰”的模式就会越发被发扬光大

5. A-buffer之类的，目前看不到有什么端倪

另外想到的，以后再补充

zhongxiameng · 发表于 2009-4-20 12:42

增加流处理数量还是可以的，因为现在核心面积并不大

ic.expert · 发表于 2009-4-20 19:31

A-buffer是什么，Accumulate-buffer？这个不是HW实现的吧？需要你用GS编程才能实现。

TS只能子分到64，还需要更强大的TS，足以支撑Micro-polygon的。

Multi-threading并不是为了通用，主要是为了OS的3D界面和3D图标做准备，这个微软从03年的时候就已经开始干了。

我觉得从CS Arch角度来说，要理解AMD R600开始的GPU Arch，首先要理解Stanford的Imagine和StreamC.......

Eji · 发表于 2009-4-20 20:03

本帖最后由 Eji 于 2009-4-21 15:00 编辑

A-buffer指的應該是 alpha buffer，有透明度編排的話可以做到半透明物件的無序render。
個人覺得multi-threading rendering和shader內的latency hiding thread是兩回事。
Tessellation基本上是為了無縫LOD。

RV770/790的規模增長算是非常讓人激賞的，讓人大開眼界：可惜效率面並沒有數字上那般的重大革新。
所以會讓人覺得與其說是RV770讓人激賞，不如說是R600讓人徹底失望，就像當年NV40才實現對NV30的期望一般....

話說我比較好奇的是，從RV770到G8x，這兩邊都採用了Shader Processor Unit與Texture Unit綑包的設計哲學....
這讓我開始思考Larabee的"每16core的processor rings"是不是應該視為類似R6x0/Rx0與G8x系列的「一個SM」般的存在。
畢竟另外有個叫做XLing的第二層外層環來連接processor ring。

比方說，GT200是10個24sp的SM，RV770/790是10個有16unit的SIMD unit，雙方都有以這個單位為基礎放了10個Texture unit。
所以即使unit數量不同，基本上都是10個xxx，各自和10組texture unit捆綁在一起，然後crossbr與texture cache系統是在這些unit的外側。

ic.expert · 发表于 2009-4-20 21:40

DX11 Multi-threading 和 Shader Unit内部的多线程不是一回事。前者主要是针对Graphics Pipeline Context的中断和切换，为了实现多个COntext分享Graphics Card。后者是为了隐藏Latency。

ic.expert · 发表于 2009-4-20 22:08

这个Abuffer就是传说中的那个乱续访问的Rendertarget，好像叫什么UVA ？

其实，利用K-buffer我们早就可以做到对于带有Alpha的Fragment进行OOO（Out-of-order）的操作了。最大可以做到16层。就是目前PS内还不能Index Rendertarget，不然这个数量还可以乘以8，足够任何的场景了。不过如果真的OOO了，理论上还需要保存每个Fragment的Depth Value，以便Post-processing时候使用。

Mia · 发表于 2009-4-21 22:01

下一代应该是 CPU集成GPU吧喉喉以后就没有显卡了喉喉

300181bai · 发表于 2009-4-21 22:08

下一代应该是 CPU集成GPU吧喉喉以后就没有显卡了喉喉
Mia 发表于 2009-4-21 22:01

恩正解呀呵呵

Edison · 发表于 2009-4-21 22:47

下一代应该是 CPU集成GPU吧喉喉以后就没有显卡了喉喉
Mia 发表于 2009-4-21 22:01

这里讨论的是 gpu，不是谁集成谁的问题。

毫无疑问，我们会看到 R8XX-like 的集成产品，不过这样产品应该是和现在同类产品的定位类似，只是针对入门低端的用户，不适合热衷型的游戏玩家。

万里乌云 · 发表于 2009-4-23 18:07

顶顶好贴。。。。。。。

AF_X_IF · 发表于 2009-4-24 07:47

8XX系列的改动多半不会比7XX比6XX更大，支持DX11，酌情增加SP是基本盘，其他的东西都是看着办的。

back · 发表于 2009-4-24 09:53

个人认为8xx系列相对7xx系列来说最大的着眼点应该是侧重于架构的效率提升和功耗的降低
基本的架构思路应该和7xx不会有太大的改变
但是性能效率的提升会是最主要的比如动态分支性能、双精度性能、AA性能/算法效率等等
还有就是在功耗上（其实是我个人的期望了）一定要降低尽量的降低呀

原子汉 · 发表于 2009-4-25 11:31

4:1架构貌似利用率并不是很高（参见2900XT）
R800架构个人认为增加Shader和晶体管数几乎是必然的
但是通用计算不好说,很可能微软会推出自家的通用计算计算体系和OpenCL竞争
希望微软能推出新的DXVA规范和相关配套的编码器
要不调硬解真能把人整死(和VobSob不兼容,)

Edison · 发表于 2009-4-25 12:07

这是今天 ati-forum.de 放出来的消息，未经证实

http://news.ati-forum.de/index.p ... ationen-aufgetaucht

只看该作者 · 发表于 2009-5-2 16:17

提示: 作者被禁止或删除内容自动屏蔽

Edison · 发表于 2009-5-11 10:34

刚刚发布的 R6XX/R7XX 编程指南：

http://www.x.org/docs/AMD/R6xx_R7xx_3D.pdf

帐号		自动登录	找回密码
密码			注册

potomac 该用户已被删除	19^# 发表于 2009-5-2 16:17 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
potomac 该用户已被删除
	回复支持反对使用道具举报显身卡

AMD 下一代 GPU 架构 Evergreen 讨论专贴

浏览过的版块