POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 59803|回复: 293
打印 上一主题 下一主题

NVIDIA 下一代架构"Fermi" 猜测、讨论专题

 关闭 [复制链接]
跳转到指定楼层
1#
发表于 2008-7-17 21:42 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
现在 NVIDIA 的 GT200 (别号 G100、Tesla 10 等)已经上市,各类测试报告也已经在各网站发表,对其体系架构现在大家基本上是明了了,不过到目前为止,尚未有任何关于 NVIDIA 下一代体系架构的消息出现。

为了方便大家讨论 GT200 的下一代架构 (Fermi),特别建立此讨论串,本主题的讨论风格将如同之前 Larrabee 讨论主题,所有讨论将以技术分析展开,需要提醒大家的是,我们这里讨论的是GT200的真正下一代架构,而不是基于GT200的工艺改进版。由于没有任何相关的资料,因此本主题中的大量讨论都是猜测性质,请勿依此为准。

为了大家的讨论更加集中,我在这里为大家提供几个相关的话题。

1、 GT200 体系架构中,你觉得最主要的特色是什么呢?最好能有一些专业的测试数据来辅证。
2、 GT200 体系架构中,最主要的问题是什么呢?下一代架构是否会延续这个架构的基本框架做优化呢?
3、 下一代架构中你认为会在在那些方面作出改进? DX11?动态分支性能?双精度性能?AA性能/算法?Tessellation?等等。
4、 你想到与之相关的技术分析、预测。



这个讨论串会作长期保留,请大家在讨论的时候互相尊重,大致的要求如下:
1、请不要把其他网站的新闻照抄过来,如果你需要大家关注其内容,只需要把链接提供,照搬的内容我们会予以删除。
2、与上面或者其他网友提供的信息重复或者重叠的内容请不要再引用。
3、请注意网络礼节。


关于 AMD 的下一代体系架构讨论,我们有另外专门的讨论串。

与 GT200 相关的参考连接:

GPUbench 1.2.1测试结果
GTX280: http://www.pcinlife.com/article_photo/gt200/gtx280_177.26/index.html

9800GTX 177.26: http://www.pcinlife.com/article_photo/gt200/9800gtx_177.26/index.html

Rightmark 2.0 Pro测试结果:
http://www.pcinlife.com/article/graphics/2008-07-13/1215942095d535_6.html



之前展开的 Larrabee 讨论串:http://we.pcinlife.com/viewthrea ... 26amp%3Btypeid%3D62
2#
发表于 2008-7-17 22:16 | 只看该作者
不厚道的占掉沙发,改天再来详细回复 {blush:]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2008-7-18 22:12 | 只看该作者
这是 gtx280+177.26 的 GPUbench 1.2.1 ps30 branch 成绩:



9800GTX+177.26 的 GPUbench 1.2.1 ps30 branch 成绩:


抽取其中 4x4 block 的来直接对比:



从结果看,GT200 在这个测试中的 sweet point 是在 15% 的 fragment 需要进行处理的情况下可以达到比 g92 理论 shader 差距更大的性能测距,而在这之后,似乎因为各个 TPC 内 texture fetch 能力相对较弱而会出现比理论值差距低大约 10%。

如果 GT200 的 3SM per 8TF 策略维持下去,最好想办法提升每个 TPC 的 TF 性能,例如单周期 fp32 fetch (unfilter-ed 的就可以了)。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

4#
发表于 2008-7-19 12:58 | 只看该作者
哦哦~~加多点Tf就是喇。
回复 支持 反对

使用道具 举报

5#
发表于 2008-7-21 19:57 | 只看该作者
怎么做成图表,我只有一组数据
回复 支持 反对

使用道具 举报

6#
发表于 2008-7-21 20:05 | 只看该作者
现在讨论有点早,我想需要看DX11有哪些吃重的设定和针对DX10性能做出的改进。个人以为继续维持标量体系不够明智,在工艺落后对手的情况下,继续用低运算密度的代价换取灵活性的做法不太行得通。
回复 支持 反对

使用道具 举报

7#
发表于 2008-7-21 20:10 | 只看该作者
应该不会再走怪物芯片的路线勒吧,该反思反思勒
回复 支持 反对

使用道具 举报

8#
发表于 2008-7-21 20:20 | 只看该作者
我只关心NV的显卡什么时候全面支持光线追踪。。。
回复 支持 反对

使用道具 举报

头像被屏蔽
9#
发表于 2008-7-21 20:27 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

10#
发表于 2008-7-21 21:23 | 只看该作者
从G80=》G200来看,这个架构靠纯扩充运算资源与带来的性能提升不成比例
回复 支持 反对

使用道具 举报

11#
发表于 2008-7-21 21:27 | 只看该作者
{biggrin:] 不是说DX11有OOO的么?
回复 支持 反对

使用道具 举报

头像被屏蔽
12#
发表于 2008-7-21 21:27 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

13#
发表于 2008-7-21 21:36 | 只看该作者
感觉GT200还是想暴力撑过这一代,真正的进步在GT300。
基本上,以双倍摩尔速度来运行,只能这样。

2代革命一次,中间加一次暴力。
回复 支持 反对

使用道具 举报

14#
发表于 2008-7-21 21:44 | 只看该作者
在HW支持DX11的基础上Shader规模继续扩容。
AA性能会有极大改进/增强。
也许会类似AMD弄个内部显存带宽数倍于外部显存带宽。
增加片上缓存容量。应用eDRAM?
回复 支持 反对

使用道具 举报

15#
发表于 2008-7-21 22:16 | 只看该作者
原帖由 天下18 于 2008-7-21 21:27 发表


对比RV770和G92,GDDR3版本对比,RV770都占不到便宜。GT200拿来比什么?另一个成面的东西,不单纯是一块GPU了。
你能告诉我什么东西是GTX200能干而G92不能干的,而导致GTX200晶体管数量剧增,性能却增加少的可怜.[rolleyes>

[ 本帖最后由 shieldfeng 于 2008-7-21 22:18 编辑 ]
回复 支持 反对

使用道具 举报

16#
 楼主| 发表于 2008-7-21 22:26 | 只看该作者
原帖由 shieldfeng 于 2008-7-21 22:16 发表
你能告诉我什么东西是GTX200能干而G92不能干的,而导致GTX200晶体管数量剧增,性能却增加少的可怜.


双精度运算、atomic function、Read/Write Combin、warp vote等都是g9x实现不了的。

如果以Crysis 1680x1050 4aa 16af为例,gt200的性能大约是9800gtx的1.6倍。
回复 支持 反对

使用道具 举报

17#
发表于 2008-7-21 22:31 | 只看该作者
原帖由 Edison 于 2008/7/21 22:26 发表


双精度运算、atomic function、Read/Write Combin、warp vote等都是g9x实现不了的。

如果以Crysis 1680x1050 4aa 16af为例,gt200的性能大约是9800gtx的1.6倍。


MS这些东西对现在的游戏性能提升不大,不过对CUDA倒是很有帮助……
回复 支持 反对

使用道具 举报

18#
 楼主| 发表于 2008-7-21 22:33 | 只看该作者
原帖由 harleylg 于 2008-7-21 22:31 发表
MS这些东西对现在的游戏性能提升不大,不过对CUDA倒是很有帮助……

CUDA也可以用于游戏加速,例如物理、AI。
回复 支持 反对

使用道具 举报

19#
发表于 2008-7-21 22:35 | 只看该作者
那是8800 U?的多少倍?
回复 支持 反对

使用道具 举报

头像被屏蔽
20#
发表于 2008-7-21 22:42 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-28 23:53

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表