POPPUR爱换

标题: GF100和GT200的底层性能对比测试 [打印本页]

作者: Asuka    时间: 2010-3-30 11:47
标题: GF100和GT200的底层性能对比测试
http://www.hardware.fr/articles/787-5/dossier-nvidia-geforce-gtx-480.html

[attach]1247840[/attach]
纹理性能。480对比285,唯一有提升的是D32F格式,这应该跟firter的设计有关。RV870相比RV770是直接×2,因为TMU×2,这些都是双线性过滤下的成绩

[attach]1247841[/attach]
这是像素填充率。没有blending的时候,RV870的FP10是全速的。4×FP32下,瓶颈在于纹理存取架构的带宽(cache、framebuffer)

[attach]1247842[/attach]
z-fill。这个项目测试的是ROP性能,4张卡的表现都比较接近大家的期望。RV770、RV870应该有mini sample,只在MSAA的时候起作用

[attach]1247843[/attach]
分支性能。RV770、RV870的bantch size都是32pixel,也就是一个wavefront,这也是线程操作的最小单位,和白皮书里写的基本一致。GF100似乎和GT200有些不同,NV没有公布新的CUDA手册,不清楚是驱动原因导致的异常,还是GF100的warp有变化
作者: topfox    时间: 2010-3-30 12:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: dimer    时间: 2010-3-30 12:28
A卡的800sp、1600sp,量放在那里,不是吃干饭的
作者: Asuka    时间: 2010-3-30 12:30
本帖最后由 Asuka 于 2010-3-30 12:31 编辑

继续:

[attach]1247904[/attach]
这个是比较纯粹的多边形填充率。因为频率类似,RV870相比RV770没有太多改善。GF100领先GT200很多倍,每周期生成的多边形数超过3个。这不单是增加几何引擎的效果,setup应该也有重大变化

[attach]1247905[/attach]
开启tessellation后的多边形填充率,这个项目没什么悬念

[attach]1247906[/attach]
高级着色器效果。越往下越复杂。GF100的优势比较明显,目前用到这些效果的游戏不多
作者: goodayoo    时间: 2010-3-30 12:47
本帖最后由 goodayoo 于 2010-3-30 13:01 编辑

NV现在很茫然,想用GF100在游戏市场和专业市场上通吃,这是不现实的。

在游戏市场上,NV曾经是很成功的,当年的GF7系列就以非常少的晶体管实现和ATI X1000系列相同的效率,GF8系列除了发热量大之外,其它都很好。

但现在,由于intel的压力,NV感觉到要么就做CPU,要么就被收购,而它又没有X86的授权,就想在GPU通用计算上找出一个路子。它的想法相当简单,GPU的运算能力是CPU的100倍以上,如果软件都运行在GPU平台,那么CPU将变得可有可无。

Wintel的成功在于平台的开放性,Windows下的软件至少从数量上是比苹果的OS X和Linux要多很多,X86虽然构架落后,但胜在普及。CUDA想复制intel的成功基本上很难,这个世界只相信强者,就像QQ,现在腾讯想在什么领域内发展估计都不会失败,因为人气摆在那里。

CUDA不会是NV的救命草,VIA才是,收购VIA后实现GPU和CPU双路发展才是正道。
作者: mindfury    时间: 2010-3-30 13:11
本帖最后由 mindfury 于 2010-3-30 13:12 编辑
不过5870的ROP性能的确比较低下,这一点从RV770到现在也没有太大的改善
magicalz 发表于 2010-3-30 11:55

仅仅是理论值不行而已,实际游戏中AA性能很高效。
作者: 380    时间: 2010-3-30 13:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: mindfury    时间: 2010-3-30 13:23
回复  mindfury


    相对于GF100确实不算高效了,AA性能比nv高那是G200时代了,目前绝大多数项目,48 ...
我是来围观的 发表于 2010-3-30 13:13

PCI的测试数据汇总:
http://www.pcinlife.com/article_ ... lts_games/total.png
DX9,1920X1200从4xAA-8xAA,GTX480相对于5870的领先优势缩小了7%
DX10,1920X1200从4xAA-8xAA,GTX480相对于5870的领先优势扩大了5%
DX11,1920X1200从4xAA-8xAA,GTX480相对于5870的领先优势缩小了5%
作者: stcshy_3    时间: 2010-3-30 13:23
提示: 作者被禁止或删除 内容自动屏蔽
作者: Asuka    时间: 2010-3-30 13:24
NV现在很茫然,想用GF100在游戏市场和专业市场上通吃,这是不现实的。

在游戏市场上,NV曾经是很成功的,当年的GF7系列就以非常少的晶体管实现和ATI X1000系列相同的效率,GF8系列除了发热量大之外,其它都很好。

但现在,由于intel的压力,NV感觉到要么就做CPU,要么就被收购,而它又没有X86的授权,就想在GPU通用计算上找出一个路子。它的想法相当简单,GPU的运算能力是CPU的100倍以上,如果软件都运行在GPU平台,那么CPU将变得可有可无。

Wintel的成功在于平台的开放性,Windows下的软件至少从数量上是比苹果的OS X和Linux要多很多,X86虽然构架落后,但胜在普及。CUDA想复制intel的成功基本上很难,这个世界只相信强者,就像QQ,现在腾讯想在什么领域内发展估计都不会失败,因为人气摆在那里。

CUDA不会是NV的救命草,VIA才是,收购VIA后实现GPU和CPU双路发展才是正道。
goodayoo 发表于 2010-3-30 12:47


Fermi并没有放弃游戏,按照这些底层测试的性能对比,GF100很明显是放弃了填充了填充率指标,把资源专注于高级着色器、复杂计算、DX11
作者: mindfury    时间: 2010-3-30 13:25
只不过是芯片面积太大,放不下128个tmu罢了。
作者: 苯苯小哥    时间: 2010-3-30 13:30


GF104的ROP是GF100的多少? 比较看好GF104 AA击败285
作者: xreal    时间: 2010-3-30 13:30
老黄赞助个御用游戏先
作者: Asuka    时间: 2010-3-30 13:32
本帖最后由 Asuka 于 2010-3-30 13:35 编辑

hardware.fr给出的分辨率/性能 参考比值:

[attach]1247969[/attach]

[attach]1247970[/attach]

[attach]1247971[/attach]

应该说,和前面的理论测试结果是比较符合的

GTX480相比GTX285在游戏性能尤其是极端环境下的进步非常大

GF100相比GT200,更加适应高分辨率、高倍抗锯齿、复杂着色器效果与复杂计算混合的环境
作者: Asuka    时间: 2010-3-30 13:48
那个抗锯齿测试应该是z-only的,如果加入stencil项目,填充率会有变化
作者: pharaohs1024    时间: 2010-3-30 14:43
提示: 作者被禁止或删除 内容自动屏蔽
作者: NewCastle    时间: 2010-3-30 18:13
看了测试才知道,RV870不只是tessellation输,复杂shader和分支也输不少啊
作者: kmark    时间: 2010-3-30 18:31
其实NV是不是再把费米细分一下,把那些杂七杂八的通用计算等一些分离成二个版本,一个版本只是游戏,高端的有通用计算等一些东西,这样各取所需,可以降低成本把游戏卡价格降下来。估计在三五年内,普通游戏玩家并不需要所谓通用计算,只要玩游戏足够快,显卡足够便宜。如果去除那些附加功能,降低了设计难度与制造成本,显卡降一千下来,另一个版本全功能的多一千,想想470卖1800就有点吸引了。
作者: Demonhunter    时间: 2010-3-30 18:38
本帖最后由 Demonhunter 于 2010-3-30 18:41 编辑

费米的架构肯定很有前瞻性,毕竟对手是R600挖了两代潜力的产品,也差不多到头了

问题在于:DX11游戏是否能够普及?现在不像当时DX9对DX8时代了,一个API升级就能翻身。现在单机游戏研发缓慢,关键是游戏性远远不如以前。再吃资源,画面再好,不好玩,也是白搭。相比NV极力推广的2033,EA的BC2要受欢迎的多,注册用户已经接近100万了

另一个问题就是工艺,这代功耗以及发热,远远限制了费米性能的发挥,估计要下代才能解决

而留给北岛的时间也够了,下代显卡大战才有看头
作者: Demonhunter    时间: 2010-3-30 18:39
其实NV是不是再把费米细分一下,把那些杂七杂八的通用计算等一些分离成二个版本,一个版本只是游戏,高端的 ...
kmark 发表于 2010-3-30 18:31

估计很难,何况对手就走的这条路,完全游戏卡,性价比还不错,功耗发热能够控制,所以买的人多。

不要老是说2033这种游戏,没意思的。大部分人玩的引擎,都是几年前的,RTS不是也拿COH做测试么,游戏不好玩,光吃资源有什么用,谁会为了一个游戏性很烂的游戏去升级费米???
作者: los_parrot    时间: 2010-3-30 18:48
LIano不出意外将集成性能超过rv740的图形核心(支持dx11),基本宣判所有低端卡的死刑.

没有低端市场,nV将不会有足够的收入来维持现在的研发投入.

当然amd悲剧了几十年了,这次的绝佳翻身机会不见得能把握住.
作者: 西把拉古    时间: 2010-3-30 18:52
其实NV是不是再把费米细分一下,把那些杂七杂八的通用计算等一些分离成二个版本,一个版本只是游戏,高端的 ...
kmark 发表于 2010-3-30 18:31



要不你再想想?像你说的这么做,基本就把自己给逼进死胡同了。
作者: Sirlion    时间: 2010-3-30 19:11
费米要在复杂渲染下就可以体现高于rv870很多的性能

毕竟现在这种复杂应用不多,果然生不逢时,不过算是一条路定下了
作者: G81    时间: 2010-3-30 22:39
gf100的晶体管到底有多少是用于游戏的?
作者: los_parrot    时间: 2010-3-30 23:26
r600构架也很先进啊,但是r600本身悲剧,后果是ATi被收购.

fermi构架先进,但是480/470绝对不能说是一个好的产品,留给nV的时间不多了.

intel的larrebee只听见楼梯响,amd的fusion却快要来了.最后干掉独立显卡的,很可能就是amd了.
作者: 32nm    时间: 2010-4-1 22:02
很不理解,为什么NV要减少GF100的TMU?
作者: 32nm    时间: 2010-4-1 22:18
Fermi并没有放弃游戏,按照这些底层测试的性能对比,GF100很明显是放弃了填充了填充率指标,把资源专注 ...
Asuka 发表于 2010-3-30 13:24


fermi不能放弃像素填充率和纹理填充率啊,这个可是游戏画面帧频的基础啊
作者: luanchuifeng    时间: 2010-4-1 22:59
GTX480很尴尬 DX11的能力比对手强很多 但问题是真正的DX11游戏面世的时候480一样扛不住 比如地铁2003 单张480一样悲剧 反观5870 虽然dx11的能力很差 但是目前根本没有几个游戏是用到所有dx11特效的 它的性能弱势没有体现出来 反而在大部分dx10和dx9的游戏里表现上佳 我觉得AMD在这波较量中稍占优势

建议现在买卡的朋友 要么等改进版的费米 要么用5870凑合 现在的GTX480实在是没什么买的价值
作者: feel囝    时间: 2010-4-1 23:27
很不理解,为什么NV要减少GF100的TMU?
32nm 发表于 2010-4-1 22:02


魚與熊掌的問題罷了.
目前工藝就那樣,不可能什麽都擺進去.
至於nv這次豪賭結果怎樣,以後就知道了
作者: 80301070    时间: 2010-4-2 02:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: zhser    时间: 2010-4-2 08:42
家用主机不升级,DX10,DX11....都没什么意思。
作者: R620    时间: 2010-4-2 10:02
填充率太低了,三角形还不错
作者: 以前的密码没了    时间: 2010-4-2 14:17
三角形性能好,国内虚拟业的最爱了。
作者: eDRAM    时间: 2010-4-2 16:33
家用主机不升级,DX10,DX11....都没什么意思。
zhser 发表于 2010-4-2 08:42


说的对,家用主机不升级,在好的显卡也白搭
作者: eDRAM    时间: 2010-4-2 17:03
如果单纯做为游戏卡的话,FERMI应该到不了30亿晶体管,用在游戏方面的最多也就24亿左右
作者: feel囝    时间: 2010-4-2 17:38
感覺好像有點奇怪.
gf100這代,rop到底是做什麽的???
作者: Edison    时间: 2010-4-2 17:51
感覺好像有點奇怪.
gf100這代,rop到底是做什麽的???
feel囝 发表于 2010-4-2 17:38


按照 NVIDIA 的说法,这个和 ROP 无关,而是 SM 那里只能每个周期输出两个像素,15 个 SM 也就是 30 个像素,所以虽然有 48 ROP,但是填充率充其量也就是 21 Gpixels/s 的水平,ROP 数量在这里起的只是提升 8x MSAA 时候的处理能力。
作者: feel囝    时间: 2010-4-2 18:17
重新看了下架構圖,Raster Engine里面包括Edge Setup、Rasterizer和Z-Cull
但是rop几乎没多少说明.
以我之前的理解,光棚化和z轴相关的如剔除之类都是rop做的吧.
难道rop只做alpha/色彩混合?
作者: 0阿诺0    时间: 2010-4-2 18:38
gf100的晶体管到底有多少是用于游戏的?
作者: Edison    时间: 2010-4-2 19:18
gf100的晶体管到底有多少是用于游戏的?
0阿诺0 发表于 2010-4-2 18:38


这说法其实意义不是很大,例如 Larrabee,就可以说是近乎 100% 用于游戏。
作者: 晨之晖    时间: 2010-4-2 19:23
NV塞了太多超前的概念进去,结果是一塌糊涂
作者: 西北狼人    时间: 2010-4-2 20:27
精品文章,值得一读。
作者: PS5    时间: 2010-4-6 11:12
强烈要求NV增加GF100的纹理单元
作者: linkto    时间: 2010-4-6 12:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2010-4-6 12:05
有没有 geometric  shader 效率 的 比较?我想把部分 vertex  shader 的运算放到 geometric  shader 上。
linkto 发表于 2010-4-6 12:02



    http://www.pcinlife.com/article/ ... 69573687d844_4.html
作者: linminlm    时间: 2010-4-6 14:15
现在制程不都是越来越先进么,奇怪怎么功耗越来越大。。
作者: 32nm    时间: 2010-4-10 12:36
纹理/像素填充率比R870低那么多,希望费米2能弥补这个差距
作者: gzeasy2006    时间: 2010-4-11 21:10
这说法其实意义不是很大,例如 Larrabee,就可以说是近乎 100% 用于游戏。
Edison 发表于 2010-4-2 19:18

那什么样的说法意义才大?抛去用于GPGPU的部分晶体管来说,到底有多少晶体管是用于纯3D的呢?
作者: gzeasy2006    时间: 2010-4-11 22:01
现在制程不都是越来越先进么,奇怪怎么功耗越来越大。。
linminlm 发表于 2010-4-6 14:15


如果叫intel给fermi代工你就不会这么说了
作者: skywalker_hao    时间: 2010-4-11 22:33
现在制程不都是越来越先进么,奇怪怎么功耗越来越大。。
linminlm 发表于 2010-4-6 14:15

2003年以后,制程也就是能多塞晶体管了,成本,性能,功耗,要兼得越来越难了
作者: eDRAM    时间: 2010-4-12 15:54
2003年以后,制程也就是能多塞晶体管了,成本,性能,功耗,要兼得越来越难了
skywalker_hao 发表于 2010-4-11 22:33


主要是硅片这种材料快接近极限了,可能换用碳纳米管会好些
作者: R620    时间: 2010-4-13 12:06
费米的架构肯定很有前瞻性,毕竟对手是R600挖了两代潜力的产品,也差不多到头了

问题在于:DX11游戏是否 ...
Demonhunter 发表于 2010-3-30 18:38


crysis2可以发挥出费米的实力
作者: G81    时间: 2010-4-14 11:03
感觉fermi是向工艺妥协的产物,还有很多新技术没加进去,主要是没空间了,28nm or 20nm快点到来吧~




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4