POPPUR爱换

标题: GF100和GT200的底层性能对比测试 [打印本页]

作者: Asuka 时间: 2010-3-30 11:47
标题: GF100和GT200的底层性能对比测试
http://www.hardware.fr/articles/787-5/dossier-nvidia-geforce-gtx-480.html

[attach]1247840[/attach]
纹理性能。480对比285，唯一有提升的是D32F格式，这应该跟firter的设计有关。RV870相比RV770是直接×2，因为TMU×2，这些都是双线性过滤下的成绩

[attach]1247841[/attach]
这是像素填充率。没有blending的时候，RV870的FP10是全速的。4×FP32下，瓶颈在于纹理存取架构的带宽（cache、framebuffer）

[attach]1247842[/attach]
z-fill。这个项目测试的是ROP性能，4张卡的表现都比较接近大家的期望。RV770、RV870应该有mini sample，只在MSAA的时候起作用

[attach]1247843[/attach]
分支性能。RV770、RV870的bantch size都是32pixel，也就是一个wavefront，这也是线程操作的最小单位，和白皮书里写的基本一致。GF100似乎和GT200有些不同，NV没有公布新的CUDA手册，不清楚是驱动原因导致的异常，还是GF100的warp有变化

作者: topfox 时间: 2010-3-30 12:22
提示: 作者被禁止或删除内容自动屏蔽

作者: dimer 时间: 2010-3-30 12:28
A卡的800sp、1600sp，量放在那里，不是吃干饭的

作者: Asuka 时间: 2010-3-30 12:30
本帖最后由 Asuka 于 2010-3-30 12:31 编辑

继续：

[attach]1247904[/attach]
这个是比较纯粹的多边形填充率。因为频率类似，RV870相比RV770没有太多改善。GF100领先GT200很多倍，每周期生成的多边形数超过3个。这不单是增加几何引擎的效果，setup应该也有重大变化

[attach]1247905[/attach]
开启tessellation后的多边形填充率，这个项目没什么悬念

[attach]1247906[/attach]
高级着色器效果。越往下越复杂。GF100的优势比较明显，目前用到这些效果的游戏不多

作者: goodayoo 时间: 2010-3-30 12:47
本帖最后由 goodayoo 于 2010-3-30 13:01 编辑

NV现在很茫然，想用GF100在游戏市场和专业市场上通吃，这是不现实的。

在游戏市场上，NV曾经是很成功的，当年的GF7系列就以非常少的晶体管实现和ATI X1000系列相同的效率，GF8系列除了发热量大之外，其它都很好。

但现在，由于intel的压力，NV感觉到要么就做CPU，要么就被收购，而它又没有X86的授权，就想在GPU通用计算上找出一个路子。它的想法相当简单，GPU的运算能力是CPU的100倍以上，如果软件都运行在GPU平台，那么CPU将变得可有可无。

Wintel的成功在于平台的开放性，Windows下的软件至少从数量上是比苹果的OS X和Linux要多很多，X86虽然构架落后，但胜在普及。CUDA想复制intel的成功基本上很难，这个世界只相信强者，就像QQ，现在腾讯想在什么领域内发展估计都不会失败，因为人气摆在那里。

CUDA不会是NV的救命草，VIA才是，收购VIA后实现GPU和CPU双路发展才是正道。

作者: mindfury 时间: 2010-3-30 13:11
本帖最后由 mindfury 于 2010-3-30 13:12 编辑

不过5870的ROP性能的确比较低下，这一点从RV770到现在也没有太大的改善
magicalz 发表于 2010-3-30 11:55

仅仅是理论值不行而已，实际游戏中AA性能很高效。

作者: 380 时间: 2010-3-30 13:14
提示: 作者被禁止或删除内容自动屏蔽

作者: mindfury 时间: 2010-3-30 13:23

回复 mindfury

相对于GF100确实不算高效了，AA性能比nv高那是G200时代了，目前绝大多数项目，48 ...
我是来围观的发表于 2010-3-30 13:13

PCI的测试数据汇总：
http://www.pcinlife.com/article_ ... lts_games/total.png
DX9,1920X1200从4xAA-8xAA，GTX480相对于5870的领先优势缩小了7%
DX10,1920X1200从4xAA-8xAA，GTX480相对于5870的领先优势扩大了5%
DX11,1920X1200从4xAA-8xAA，GTX480相对于5870的领先优势缩小了5%

作者: stcshy_3 时间: 2010-3-30 13:23
提示: 作者被禁止或删除内容自动屏蔽

作者: Asuka 时间: 2010-3-30 13:24

NV现在很茫然，想用GF100在游戏市场和专业市场上通吃，这是不现实的。

在游戏市场上，NV曾经是很成功的，当年的GF7系列就以非常少的晶体管实现和ATI X1000系列相同的效率，GF8系列除了发热量大之外，其它都很好。

但现在，由于intel的压力，NV感觉到要么就做CPU，要么就被收购，而它又没有X86的授权，就想在GPU通用计算上找出一个路子。它的想法相当简单，GPU的运算能力是CPU的100倍以上，如果软件都运行在GPU平台，那么CPU将变得可有可无。

Wintel的成功在于平台的开放性，Windows下的软件至少从数量上是比苹果的OS X和Linux要多很多，X86虽然构架落后，但胜在普及。CUDA想复制intel的成功基本上很难，这个世界只相信强者，就像QQ，现在腾讯想在什么领域内发展估计都不会失败，因为人气摆在那里。

CUDA不会是NV的救命草，VIA才是，收购VIA后实现GPU和CPU双路发展才是正道。
goodayoo 发表于 2010-3-30 12:47

Fermi并没有放弃游戏，按照这些底层测试的性能对比，GF100很明显是放弃了填充了填充率指标，把资源专注于高级着色器、复杂计算、DX11

作者: mindfury 时间: 2010-3-30 13:25
只不过是芯片面积太大，放不下128个tmu罢了。

作者: 苯苯小哥 时间: 2010-3-30 13:30

GF104的ROP是GF100的多少？比较看好GF104 AA击败285

作者: xreal 时间: 2010-3-30 13:30

老黄赞助个御用游戏先

作者: Asuka 时间: 2010-3-30 13:32
本帖最后由 Asuka 于 2010-3-30 13:35 编辑

hardware.fr给出的分辨率/性能参考比值：

[attach]1247969[/attach]

[attach]1247970[/attach]

[attach]1247971[/attach]

应该说，和前面的理论测试结果是比较符合的

GTX480相比GTX285在游戏性能尤其是极端环境下的进步非常大

GF100相比GT200，更加适应高分辨率、高倍抗锯齿、复杂着色器效果与复杂计算混合的环境

作者: Asuka 时间: 2010-3-30 13:48
那个抗锯齿测试应该是z-only的，如果加入stencil项目，填充率会有变化

作者: pharaohs1024 时间: 2010-3-30 14:43
提示: 作者被禁止或删除内容自动屏蔽

作者: NewCastle 时间: 2010-3-30 18:13
看了测试才知道，RV870不只是tessellation输，复杂shader和分支也输不少啊

作者: kmark 时间: 2010-3-30 18:31
其实NV是不是再把费米细分一下，把那些杂七杂八的通用计算等一些分离成二个版本，一个版本只是游戏，高端的有通用计算等一些东西，这样各取所需，可以降低成本把游戏卡价格降下来。估计在三五年内，普通游戏玩家并不需要所谓通用计算，只要玩游戏足够快，显卡足够便宜。如果去除那些附加功能，降低了设计难度与制造成本，显卡降一千下来，另一个版本全功能的多一千，想想470卖1800就有点吸引了。

作者: Demonhunter 时间: 2010-3-30 18:38
本帖最后由 Demonhunter 于 2010-3-30 18:41 编辑

费米的架构肯定很有前瞻性，毕竟对手是R600挖了两代潜力的产品，也差不多到头了

问题在于：DX11游戏是否能够普及？现在不像当时DX9对DX8时代了，一个API升级就能翻身。现在单机游戏研发缓慢，关键是游戏性远远不如以前。再吃资源，画面再好，不好玩，也是白搭。相比NV极力推广的2033，EA的BC2要受欢迎的多，注册用户已经接近100万了

另一个问题就是工艺，这代功耗以及发热，远远限制了费米性能的发挥，估计要下代才能解决

而留给北岛的时间也够了，下代显卡大战才有看头

作者: Demonhunter 时间: 2010-3-30 18:39

其实NV是不是再把费米细分一下，把那些杂七杂八的通用计算等一些分离成二个版本，一个版本只是游戏，高端的 ...
kmark 发表于 2010-3-30 18:31

估计很难，何况对手就走的这条路，完全游戏卡，性价比还不错，功耗发热能够控制，所以买的人多。

不要老是说2033这种游戏，没意思的。大部分人玩的引擎，都是几年前的，RTS不是也拿COH做测试么，游戏不好玩，光吃资源有什么用，谁会为了一个游戏性很烂的游戏去升级费米？？？

作者: los_parrot 时间: 2010-3-30 18:48
LIano不出意外将集成性能超过rv740的图形核心(支持dx11),基本宣判所有低端卡的死刑.

没有低端市场,nV将不会有足够的收入来维持现在的研发投入.

当然amd悲剧了几十年了,这次的绝佳翻身机会不见得能把握住.

作者: 西把拉古 时间: 2010-3-30 18:52

其实NV是不是再把费米细分一下，把那些杂七杂八的通用计算等一些分离成二个版本，一个版本只是游戏，高端的 ...
kmark 发表于 2010-3-30 18:31

要不你再想想？像你说的这么做，基本就把自己给逼进死胡同了。

作者: Sirlion 时间: 2010-3-30 19:11
费米要在复杂渲染下就可以体现高于rv870很多的性能

毕竟现在这种复杂应用不多，果然生不逢时，不过算是一条路定下了

作者: G81 时间: 2010-3-30 22:39
gf100的晶体管到底有多少是用于游戏的？

作者: los_parrot 时间: 2010-3-30 23:26
r600构架也很先进啊,但是r600本身悲剧,后果是ATi被收购.

fermi构架先进,但是480/470绝对不能说是一个好的产品,留给nV的时间不多了.

intel的larrebee只听见楼梯响,amd的fusion却快要来了.最后干掉独立显卡的,很可能就是amd了.

作者: 32nm 时间: 2010-4-1 22:02
很不理解，为什么NV要减少GF100的TMU？

作者: 32nm 时间: 2010-4-1 22:18

Fermi并没有放弃游戏，按照这些底层测试的性能对比，GF100很明显是放弃了填充了填充率指标，把资源专注 ...
Asuka 发表于 2010-3-30 13:24

fermi不能放弃像素填充率和纹理填充率啊，这个可是游戏画面帧频的基础啊

作者: luanchuifeng 时间: 2010-4-1 22:59
GTX480很尴尬 DX11的能力比对手强很多但问题是真正的DX11游戏面世的时候480一样扛不住比如地铁2003 单张480一样悲剧反观5870 虽然dx11的能力很差但是目前根本没有几个游戏是用到所有dx11特效的它的性能弱势没有体现出来反而在大部分dx10和dx9的游戏里表现上佳我觉得AMD在这波较量中稍占优势

建议现在买卡的朋友要么等改进版的费米要么用5870凑合现在的GTX480实在是没什么买的价值

作者: feel囝 时间: 2010-4-1 23:27

很不理解，为什么NV要减少GF100的TMU？
32nm 发表于 2010-4-1 22:02

魚與熊掌的問題罷了.
目前工藝就那樣,不可能什麽都擺進去.
至於nv這次豪賭結果怎樣,以後就知道了

作者: 80301070 时间: 2010-4-2 02:49
提示: 作者被禁止或删除内容自动屏蔽

作者: zhser 时间: 2010-4-2 08:42
家用主机不升级，DX10,DX11....都没什么意思。

作者: R620 时间: 2010-4-2 10:02
填充率太低了，三角形还不错

作者: 以前的密码没了 时间: 2010-4-2 14:17
三角形性能好，国内虚拟业的最爱了。

作者: eDRAM 时间: 2010-4-2 16:33

家用主机不升级，DX10,DX11....都没什么意思。
zhser 发表于 2010-4-2 08:42

说的对，家用主机不升级，在好的显卡也白搭

作者: eDRAM 时间: 2010-4-2 17:03
如果单纯做为游戏卡的话，FERMI应该到不了30亿晶体管，用在游戏方面的最多也就24亿左右

作者: feel囝 时间: 2010-4-2 17:38
感覺好像有點奇怪.
gf100這代,rop到底是做什麽的???

作者: Edison 时间: 2010-4-2 17:51

感覺好像有點奇怪.
gf100這代,rop到底是做什麽的???
feel囝发表于 2010-4-2 17:38

按照 NVIDIA 的说法，这个和 ROP 无关，而是 SM 那里只能每个周期输出两个像素，15 个 SM 也就是 30 个像素，所以虽然有 48 ROP，但是填充率充其量也就是 21 Gpixels/s 的水平，ROP 数量在这里起的只是提升 8x MSAA 时候的处理能力。

作者: feel囝 时间: 2010-4-2 18:17
重新看了下架構圖,Raster Engine里面包括Edge Setup、Rasterizer和Z-Cull
但是rop几乎没多少说明.
以我之前的理解,光棚化和z轴相关的如剔除之类都是rop做的吧.
难道rop只做alpha/色彩混合?

作者: 0阿诺0 时间: 2010-4-2 18:38
gf100的晶体管到底有多少是用于游戏的?

作者: Edison 时间: 2010-4-2 19:18

gf100的晶体管到底有多少是用于游戏的?
0阿诺0 发表于 2010-4-2 18:38

这说法其实意义不是很大，例如 Larrabee，就可以说是近乎 100% 用于游戏。

作者: 晨之晖 时间: 2010-4-2 19:23
NV塞了太多超前的概念进去，结果是一塌糊涂

作者: 西北狼人 时间: 2010-4-2 20:27
精品文章，值得一读。

作者: PS5 时间: 2010-4-6 11:12
强烈要求NV增加GF100的纹理单元

作者: linkto 时间: 2010-4-6 12:02
提示: 作者被禁止或删除内容自动屏蔽

作者: Edison 时间: 2010-4-6 12:05

有没有 geometric shader 效率的比较？我想把部分 vertex shader 的运算放到 geometric shader 上。
linkto 发表于 2010-4-6 12:02

http://www.pcinlife.com/article/ ... 69573687d844_4.html

作者: linminlm 时间: 2010-4-6 14:15
现在制程不都是越来越先进么，奇怪怎么功耗越来越大。。

作者: 32nm 时间: 2010-4-10 12:36
纹理/像素填充率比R870低那么多，希望费米2能弥补这个差距

作者: gzeasy2006 时间: 2010-4-11 21:10

这说法其实意义不是很大，例如 Larrabee，就可以说是近乎 100% 用于游戏。
Edison 发表于 2010-4-2 19:18

那什么样的说法意义才大？抛去用于GPGPU的部分晶体管来说，到底有多少晶体管是用于纯3D的呢？

作者: gzeasy2006 时间: 2010-4-11 22:01

现在制程不都是越来越先进么，奇怪怎么功耗越来越大。。
linminlm 发表于 2010-4-6 14:15

如果叫intel给fermi代工你就不会这么说了

作者: skywalker_hao 时间: 2010-4-11 22:33

现在制程不都是越来越先进么，奇怪怎么功耗越来越大。。
linminlm 发表于 2010-4-6 14:15

2003年以后，制程也就是能多塞晶体管了，成本，性能，功耗，要兼得越来越难了

作者: eDRAM 时间: 2010-4-12 15:54

2003年以后，制程也就是能多塞晶体管了，成本，性能，功耗，要兼得越来越难了
skywalker_hao 发表于 2010-4-11 22:33

主要是硅片这种材料快接近极限了，可能换用碳纳米管会好些

作者: R620 时间: 2010-4-13 12:06

费米的架构肯定很有前瞻性，毕竟对手是R600挖了两代潜力的产品，也差不多到头了

问题在于：DX11游戏是否 ...
Demonhunter 发表于 2010-3-30 18:38

crysis2可以发挥出费米的实力

作者: G81 时间: 2010-4-14 11:03
感觉fermi是向工艺妥协的产物，还有很多新技术没加进去，主要是没空间了，28nm or 20nm快点到来吧~

欢迎光临 POPPUR爱换 (https://we.poppur.com/)