POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 22456|回复: 116
打印 上一主题 下一主题

AMD 下一代 GPU 架构 Evergreen 讨论专贴

 关闭 [复制链接]
跳转到指定楼层
1#
发表于 2009-4-17 09:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
现在 AMD 的 RV790 已经上市,各类测试报告也已经在各网站发表,对其体系架构现在大家基本上是明了了,不过到目前为止,尚未有任何关于 AMD 下一代体系架构的消息出现。

为了方便大家讨论 RV790 的下一代架构 (RV8XX ?),特别建立此讨论串,本主题的讨论风格将如同之前 Larrabee 讨论主题,所有讨论将以技术分析展开,需要提醒大家的是,我们这里讨论的是 RV790 的真正下一代架构,而不是基于 RV790 的工艺改进版。由于没有任何相关的资料,因此本主题中的大量讨论都是猜测性质,请勿依此为准。

为了大家的讨论更加集中,我在这里为大家提供几个相关的话题。


1、 R700 体系架构中,你觉得最主要的特色是什么呢?最好能有一些专业的测试数据来辅证。
2、 R700 体系架构中,最主要的问题是什么呢?下一代架构是否会延续这个架构的基本框架做优化呢?
3、 下一代架构中你认为会在在那些方面作出改进? DX11?动态分支性能?双精度性能?AA性能/算法?Tessellation?等等。
4、 你想到与之相关的技术分析、预测。



这个讨论串会作长期保留,请大家在讨论的时候互相尊重,大致的要求如下:

1、请不要把其他网站的新闻照抄过来,如果你需要大家关注其内容,只需要把链接提供,照搬的内容我们会予以删除。
2、与上面或者其他网友提供的信息重复或者重叠的内容请不要再引用。
3、请注意网络礼节。



关于 NVIDIA 的下一代体系架构讨论,我们已有另外专门的讨论串。

参考:

AMD R700 指令集架构文档下载:
http://developer.amd.com/gpu_ass ... et_Architecture.pdf

AMD R600 指令集架构文档下载:
www.x.org/docs/AMD/r600isa.pdf
2#
发表于 2009-4-17 17:16 | 只看该作者
再以增加流处理器数量的方法来提高性能的方法并不可取~~

如何在效率上进行更合理优化的利用,应该是R800系列的一个重点,或许AMD下一代架构显卡会比较靠近NVIDIA现在的一些思路!

考虑到微软的态度,在DX11以及抗锯齿性能上,AMD显卡我依然看好!
回复 支持 反对

使用道具 举报

3#
发表于 2009-4-17 18:05 | 只看该作者
增加晶体管/shader是必然的,也是最直接提升性能的方式之一;DX10->DX11称不上革命,所以预计AMD下一代GPU会延续上一代架构基础上改进。
回复 支持 反对

使用道具 举报

4#
发表于 2009-4-18 14:46 | 只看该作者
RV8xx应该是R600架构的终结,增加SP是无可避免的,但是相信会对利用率进行优化,同时在40nm制程下更好的控制功耗,现在的rv770/790晶体管密度过大导致功耗猛增啊
回复 支持 反对

使用道具 举报

5#
发表于 2009-4-18 16:06 | 只看该作者
其实根本不用预测了,现在看来R8XX几乎就是一定的东西

我说几个关键词:

1. Tessellation;Tessellation这个将是DX11在游戏方面的代表技术,个人认为也将是未来游戏画面突破的保证。在从sm2.0到sm4.0,3D游戏把效果提升全部押宝到无限增长的shader需求上以后,Tessellation把突破口重新正本清源,回到多边形上来,这个是正道

2. Compute Shader;微软总是慢半拍,也总是恰到好处。GPGPU应用现在漫天飞,该是老大出来统一江湖的时候了

3. multi-theading;前面两个都是特性方面的改变,这个才是给整个架构输血的心脏。shader要做到“不仅是shader”,Graphics  Processing Units 要成为General-Purpose Units,本质上都必须依赖multi-theading架构的精进。R8XX必然在multi-theading方面做出改变或者说重大革新,个人认为R8XX除了每个thread的reg file必须符合DX11标准外,应该在active thread select等方面也做了改进,细节就不得而知了

4. SIMD、每平方毫米性能、每晶体管性能;毫无疑问,R800会在这条路上坚持走下去,已经看到曙光了。DX11会在一个方面提供强力的支持,那就是多GPU和多线程渲染的支持方面。如果能某种程度上共享frame buffer,那么G71首先提出的“性能+性能=旗舰”的模式就会越发被发扬光大

5. A-buffer之类的,目前看不到有什么端倪

另外想到的,以后再补充
回复 支持 反对

使用道具 举报

6#
发表于 2009-4-20 12:42 | 只看该作者
增加流处理数量还是可以的,因为现在核心面积并不大
回复 支持 反对

使用道具 举报

7#
发表于 2009-4-20 19:31 | 只看该作者
A-buffer是什么,Accumulate-buffer?这个不是HW实现的吧?需要你用GS编程才能实现。

TS只能子分到64,还需要更强大的TS,足以支撑Micro-polygon的。

Multi-threading并不是为了通用,主要是为了OS的3D界面和3D图标做准备,这个微软从03年的时候就已经开始干了。

我觉得从CS Arch角度来说,要理解AMD R600开始的GPU Arch,首先要理解Stanford的Imagine和StreamC.......
回复 支持 反对

使用道具 举报

8#
发表于 2009-4-20 20:03 | 只看该作者
本帖最后由 Eji 于 2009-4-21 15:00 编辑

A-buffer指的應該是 alpha buffer,有透明度編排的話可以做到半透明物件的無序render。
個人覺得multi-threading rendering和shader內的latency hiding thread是兩回事。
Tessellation基本上是為了無縫LOD。

RV770/790的規模增長算是非常讓人激賞的,讓人大開眼界:可惜效率面並沒有數字上那般的重大革新。
所以會讓人覺得與其說是RV770讓人激賞,不如說是R600讓人徹底失望,就像當年NV40才實現對NV30的期望一般....

話說我比較好奇的是,從RV770到G8x,這兩邊都採用了Shader Processor Unit與Texture Unit綑包的設計哲學....
這讓我開始思考Larabee的"每16core的processor rings"是不是應該視為類似R6x0/Rx0與G8x系列的「一個SM」般的存在。
畢竟另外有個叫做XLing的第二層外層環來連接processor ring。

比方說,GT200是10個24sp的SM,RV770/790是10個有16unit的SIMD unit,雙方都有以這個單位為基礎放了10個Texture unit。
所以即使unit數量不同,基本上都是10個xxx,各自和10組texture unit捆綁在一起,然後crossbr與texture cache系統是在這些unit的外側。
回复 支持 反对

使用道具 举报

9#
发表于 2009-4-20 21:40 | 只看该作者
DX11 Multi-threading 和 Shader Unit内部的多线程不是一回事。前者主要是针对Graphics Pipeline Context的中断和切换,为了实现多个COntext分享Graphics Card。后者是为了隐藏Latency。
回复 支持 反对

使用道具 举报

10#
发表于 2009-4-20 22:08 | 只看该作者
这个Abuffer就是传说中的那个乱续访问的Rendertarget,好像叫什么UVA ?

其实,利用K-buffer我们早就可以做到对于带有Alpha的Fragment进行OOO(Out-of-order)的操作了。最大可以做到16层。就是目前PS内还不能Index Rendertarget,不然这个数量还可以乘以8,足够任何的场景了。不过如果真的OOO了,理论上还需要保存每个Fragment的Depth Value,以便Post-processing时候使用。
回复 支持 反对

使用道具 举报

11#
发表于 2009-4-21 22:01 | 只看该作者
下一代 应该是 CPU集成GPU吧 喉喉  以后就没有显卡了  喉喉
回复 支持 反对

使用道具 举报

12#
发表于 2009-4-21 22:08 | 只看该作者
下一代 应该是 CPU集成GPU吧 喉喉  以后就没有显卡了  喉喉
Mia 发表于 2009-4-21 22:01



恩 正解呀  呵呵
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2009-4-21 22:47 | 只看该作者
下一代 应该是 CPU集成GPU吧 喉喉  以后就没有显卡了  喉喉
Mia 发表于 2009-4-21 22:01


这里讨论的是 gpu,不是谁集成谁的问题。

毫无疑问,我们会看到 R8XX-like 的集成产品,不过这样产品应该是和现在同类产品的定位类似,只是针对入门低端的用户,不适合热衷型的游戏玩家。
回复 支持 反对

使用道具 举报

14#
发表于 2009-4-23 18:07 | 只看该作者
顶顶好贴。。。。。。。
回复 支持 反对

使用道具 举报

15#
发表于 2009-4-24 07:47 | 只看该作者
8XX系列的改动多半不会比7XX比6XX更大,支持DX11,酌情增加SP是基本盘,其他的东西都是看着办的。
回复 支持 反对

使用道具 举报

16#
发表于 2009-4-24 09:53 | 只看该作者
个人认为8xx系列相对7xx系列来说最大的着眼点应该是侧重于架构的效率提升和功耗的降低
基本的架构思路应该和7xx不会有太大的改变
但是性能效率的提升会是最主要的 比如动态分支性能、双精度性能、AA性能/算法效率等等
还有就是在功耗上 (其实是我个人的期望了)一定要降低 尽量的降低呀
回复 支持 反对

使用道具 举报

17#
发表于 2009-4-25 11:31 | 只看该作者
4:1架构貌似利用率并不是很高(参见2900XT)
R800架构个人认为增加Shader和晶体管数几乎是必然的
但是通用计算不好说,很可能微软会推出自家的通用计算计算体系和OpenCL竞争
希望微软能推出新的DXVA规范和相关配套的编码器
要不调硬解真能把人整死(和VobSob不兼容,)
回复 支持 反对

使用道具 举报

18#
 楼主| 发表于 2009-4-25 12:07 | 只看该作者
这是今天 ati-forum.de 放出来的消息,未经证实

http://news.ati-forum.de/index.p ... ationen-aufgetaucht

回复 支持 反对

使用道具 举报

potomac 该用户已被删除
19#
发表于 2009-5-2 16:17 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

20#
 楼主| 发表于 2009-5-11 10:34 | 只看该作者
刚刚发布的 R6XX/R7XX 编程指南:

http://www.x.org/docs/AMD/R6xx_R7xx_3D.pdf
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-28 20:38

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表