NVIDIA 下一代架构"Fermi" 猜测、讨论专题

Edison · 发表于 2008-7-17 21:42

现在 NVIDIA 的 GT200 （别号 G100、Tesla 10 等）已经上市，各类测试报告也已经在各网站发表，对其体系架构现在大家基本上是明了了，不过到目前为止，尚未有任何关于 NVIDIA 下一代体系架构的消息出现。

为了方便大家讨论 GT200 的下一代架构（Fermi），特别建立此讨论串，本主题的讨论风格将如同之前 Larrabee 讨论主题，所有讨论将以技术分析展开，需要提醒大家的是，我们这里讨论的是GT200的真正下一代架构，而不是基于GT200的工艺改进版。由于没有任何相关的资料，因此本主题中的大量讨论都是猜测性质，请勿依此为准。

为了大家的讨论更加集中，我在这里为大家提供几个相关的话题。

1、 GT200 体系架构中，你觉得最主要的特色是什么呢？最好能有一些专业的测试数据来辅证。
2、 GT200 体系架构中，最主要的问题是什么呢？下一代架构是否会延续这个架构的基本框架做优化呢？
3、下一代架构中你认为会在在那些方面作出改进？ DX11？动态分支性能？双精度性能？AA性能/算法？Tessellation？等等。
4、你想到与之相关的技术分析、预测。

这个讨论串会作长期保留，请大家在讨论的时候互相尊重，大致的要求如下：

1、请不要把其他网站的新闻照抄过来，如果你需要大家关注其内容，只需要把链接提供，照搬的内容我们会予以删除。
2、与上面或者其他网友提供的信息重复或者重叠的内容请不要再引用。
3、请注意网络礼节。

关于 AMD 的下一代体系架构讨论，我们有另外专门的讨论串。

与 GT200 相关的参考连接：

GPUbench 1.2.1测试结果
GTX280: http://www.pcinlife.com/article_photo/gt200/gtx280_177.26/index.html

9800GTX 177.26: http://www.pcinlife.com/article_photo/gt200/9800gtx_177.26/index.html

Rightmark 2.0 Pro测试结果：
http://www.pcinlife.com/article/graphics/2008-07-13/1215942095d535_6.html

之前展开的 Larrabee 讨论串：http://we.pcinlife.com/viewthrea ... 26amp%3Btypeid%3D62

Asuka · 发表于 2008-7-17 22:16

不厚道的占掉沙发，改天再来详细回复 {blush:]

Edison · 发表于 2008-7-18 22:12

这是 gtx280+177.26 的 GPUbench 1.2.1 ps30 branch 成绩：

9800GTX+177.26 的 GPUbench 1.2.1 ps30 branch 成绩：

抽取其中 4x4 block 的来直接对比：

从结果看，GT200 在这个测试中的 sweet point 是在 15% 的 fragment 需要进行处理的情况下可以达到比 g92 理论 shader 差距更大的性能测距，而在这之后，似乎因为各个 TPC 内 texture fetch 能力相对较弱而会出现比理论值差距低大约 10%。

如果 GT200 的 3SM per 8TF 策略维持下去，最好想办法提升每个 TPC 的 TF 性能，例如单周期 fp32 fetch （unfilter-ed 的就可以了）。

feel囝 · 发表于 2008-7-19 12:58

哦哦~~加多点Tf就是喇。

jocover · 发表于 2008-7-21 19:57

怎么做成图表，我只有一组数据

shu0202 · 发表于 2008-7-21 20:05

现在讨论有点早，我想需要看DX11有哪些吃重的设定和针对DX10性能做出的改进。个人以为继续维持标量体系不够明智，在工艺落后对手的情况下，继续用低运算密度的代价换取灵活性的做法不太行得通。

Azl2 · 发表于 2008-7-21 20:10

应该不会再走怪物芯片的路线勒吧，该反思反思勒

insect2006 · 发表于 2008-7-21 20:20

我只关心NV的显卡什么时候全面支持光线追踪。。。

天下18 · 发表于 2008-7-21 20:27

提示: 作者被禁止或删除内容自动屏蔽

bfg9000 · 发表于 2008-7-21 21:23

从G80=》G200来看，这个架构靠纯扩充运算资源与带来的性能提升不成比例

aeondxf · 发表于 2008-7-21 21:27

{biggrin:] 不是说DX11有OOO的么？

天下18 · 发表于 2008-7-21 21:27

提示: 作者被禁止或删除内容自动屏蔽

D65 · 发表于 2008-7-21 21:36

感觉GT200还是想暴力撑过这一代，真正的进步在GT300。
基本上，以双倍摩尔速度来运行，只能这样。

2代革命一次，中间加一次暴力。

gz_easy · 发表于 2008-7-21 21:44

在HW支持DX11的基础上Shader规模继续扩容。
AA性能会有极大改进/增强。
也许会类似AMD弄个内部显存带宽数倍于外部显存带宽。
增加片上缓存容量。应用eDRAM?

shieldfeng · 发表于 2008-7-21 22:16

原帖由 天下18 于 2008-7-21 21:27 发表

对比RV770和G92，GDDR3版本对比，RV770都占不到便宜。GT200拿来比什么？另一个成面的东西，不单纯是一块GPU了。

你能告诉我什么东西是GTX200能干而G92不能干的,而导致GTX200晶体管数量剧增,性能却增加少的可怜.[rolleyes>

[ 本帖最后由 shieldfeng 于 2008-7-21 22:18 编辑 ]

Edison · 发表于 2008-7-21 22:26

原帖由 shieldfeng 于 2008-7-21 22:16 发表
你能告诉我什么东西是GTX200能干而G92不能干的,而导致GTX200晶体管数量剧增,性能却增加少的可怜.

双精度运算、atomic function、Read/Write Combin、warp vote等都是g9x实现不了的。

如果以Crysis 1680x1050 4aa 16af为例，gt200的性能大约是9800gtx的1.6倍。

harleylg · 发表于 2008-7-21 22:31

原帖由 Edison 于 2008/7/21 22:26 发表

双精度运算、atomic function、Read/Write Combin、warp vote等都是g9x实现不了的。

如果以Crysis 1680x1050 4aa 16af为例，gt200的性能大约是9800gtx的1.6倍。

MS这些东西对现在的游戏性能提升不大，不过对CUDA倒是很有帮助……

Edison · 发表于 2008-7-21 22:33

原帖由 harleylg 于 2008-7-21 22:31 发表
MS这些东西对现在的游戏性能提升不大，不过对CUDA倒是很有帮助……

CUDA也可以用于游戏加速，例如物理、AI。

okyes · 发表于 2008-7-21 22:35

那是8800 U？的多少倍？

天下18 · 发表于 2008-7-21 22:42

提示: 作者被禁止或删除内容自动屏蔽

帐号		自动登录	找回密码
密码			注册

天下18 天下18 当前离线积分 24 IP卡狗仔卡头像被屏蔽	9^# 发表于 2008-7-21 20:27 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
天下18 天下18 当前离线积分 24 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

天下18 天下18 当前离线积分 24 IP卡狗仔卡头像被屏蔽	12^# 发表于 2008-7-21 21:27 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
天下18 天下18 当前离线积分 24 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

天下18 天下18 当前离线积分 24 IP卡狗仔卡头像被屏蔽	20^# 发表于 2008-7-21 22:42 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
天下18 天下18 当前离线积分 24 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

NVIDIA 下一代架构"Fermi" 猜测、讨论专题

本帖子中包含更多资源

本帖子中包含更多资源

浏览过的版块