POPPUR爱换

标题: 关于显卡多边形生成率的讨论!!! [打印本页]

作者: leeshock    时间: 2008-12-2 20:27
标题: 关于显卡多边形生成率的讨论!!!
我记得小时侯(n年前),社么tnt2显卡,geforce256显卡有个主要指标是多边形(三角形?)每秒生成率,那个时候的显卡好象是每秒几百万个。还有我还记得以前ps2刚出来的时候不是吹牛号称7200w/s多边形生成率社么的,那个时候这个指标好象是衡量显卡性能的主要指标。对游戏画面来说也是用的多边形越多,画面棱角月少,看上去画面也月好。威慑么现在的显卡都不提这个指标了啊?现在的48xx gtx2xx这个指标应该多少啊?

[ 本帖最后由 leeshock 于 2008-12-16 16:57 编辑 ]
作者: eiowis    时间: 2008-12-2 20:36
现在 单位应该是亿了
作者: leeshock    时间: 2008-12-2 20:47
但是现在的官方宣传,广告,平册,怎么都不说这个数据了?,现在不少游戏画面棱角还是很多的啊,不少赛车游戏弯道不是弯的,是多边形的,看马路中间那条黄线可以看到是一段段直线构成的,说明这个指标应该还是有意义的啊。
作者: Asuka    时间: 2008-12-2 21:11
因为限制GPU性能的瓶颈已经不是多边形生成率这一边

所以自然也没什么好比的
作者: leeshock    时间: 2008-12-2 21:15
就是说现在生成多边形的速度超过填充象素的速度,象素填充跟不上,所以还是填充率重要?那威慑么游戏设计还要尽量少用多边形啊?
作者: tyrande    时间: 2008-12-2 21:31
貌似不是这样说的吧.......现在不是用FLOPS了吗?比多边形生成率更直接吧.......
作者: leeshock    时间: 2008-12-2 21:46
只是记得以前说道显卡一直说多边形生成率,记得特别清楚就是当时的ps2号称7000多w是geforce显卡的几倍几倍,yy先卡一般就yy这个指标。后来怎么说着说着这个指标没了。不知道现在的显卡能生成多少啊
作者: Asuka    时间: 2008-12-2 22:55
原帖由 leeshock 于 2008-12-2 21:15 发表
就是说现在生成多边形的速度超过填充象素的速度,象素填充跟不上,所以还是填充率重要?那威慑么游戏设计还要尽量少用多边形啊?

原帖由 leeshock 于 2008-12-2 21:46 发表
只是记得以前说道显卡一直说多边形生成率,记得特别清楚就是当时的ps2号称7000多w是geforce显卡的几倍几倍,yy先卡一般就yy这个指标。后来怎么说着说着这个指标没了。不知道现在的显卡能生成多少啊





最初,3D画面就是给多边形帖上材质,整个过程都是CPU在算,没显卡什么事,显卡只负责把画面显示出来

后来到voodoo,继而到DX7 T&L,显卡开始在3D运算中夺权。那时显卡也没什么其他的事干,在转换坐标的同时顺便算一下光源而已,坐标转换的速度(某种程度上来说也算是多边形生成率)自然就是吆喝的重点。

从DX8(尤其是DX8.1)开始引申出shader的概念。微软认为,如果大家都只拼贴图,迟早撞死在存储器墙上,于是引入更深的流水线长度,让GPU在等待纹理数据从DRAM里抓出来之前,再干点别的————用ALU算算混合啊、过滤啊、法线啊之类的东西,等纹理数据抓过来了,就用这些算术运算的结果给纹理添加更多的效果————这就是所谓的Pixel Shader

同时,微软认为,用一个SIMD vector ALU只算w x y z坐标,太大材小用了。于是就有了Vertex Shader,代替原来的T&L引擎,它既负责传统的多边形的生成(根据CPU的指令来生成,而不是自己凭空“制造”),也负责在生成的过程中添加一些乱七八糟的效果。比如从DX8开始,VS就可以用DP3 DP4指令算n维向量的内积,或者是用srq求一个平方根的倒数什么的。因为每个顶点都包含许多信息,比顶点上的纹理信息,散光和映射光源下表现的颜色,所以你在生成多边形的时候带上这些附加运算,就可以带来更多的效果————比如制造procedural deformation效果,水面就可以变得波光粼粼

VS和PS,本来只是作为多边形生成和纹理贴图时的“附加效果”而存在的,但是随着GPU发展得越来越快,微软发现努力提升这些附加效果,带来的画面提升反而更大,而单纯增加多边形生成率或者贴图速率,容易受硬件限制。于是这些附加效果渐渐喧宾夺主了————这就是DX9

后来,微软在做自己的游戏机的时候发现,PS和VS在底层的算术操作上,实际上很大一部分指令是通用的,于是干脆做到一起,既然都融合到了一起,流程也没有以前固定流水线那么死板了,可以先算PS,再让VS抓PS里的tex数据映射到顶点上,也可以先输出到MRT,再根据MRT回头来渲染....同时,NV认为,随着GPU规模的扩大,就算继续深化流水线,也迟早还是会撞死在存储器墙上。所以就让GPU同时跑很多个小线程,如果一个线程陷入到存储器延迟中,那就切换到另一个线程给ALU执行,这样ALU就不会偷懒(至少理论上是如此)。后来,微软把C1的想法拿到桌面,就有了DX10;NV和ATi把自己的想法和DX10结合,就有了G80和R600

再后来,NV猛然发现,这几年大家在M$的忽悠下1年脱两层皮,GPU已经远非当年阿斗了,而且也不限于图形渲染,可以干的事也多起来了。 介于此时GPU在某些特定领域已经把CPU甩出老远~(至少账面数字上是如此),NV就出了一个粗大(CUDA)

现在,Intel沉不住气了,你GPU当年不过是一个分裂出去的单细胞动物而已,说白了和头皮屑差不多,现在居然喧宾夺主要抢CPU的饭碗,那还了得。于是Intel就出了一个larrabee,告诉大家,CPU要是变态起来,也是可以很变态的。


所以说,多边形生成率从一个重要指标沦落为一个无关痛痒的参数,是从DX8时代开始的,因为shader代替了单纯的生成多边形-->光栅化-->贴图-->输出这个固定流程,成为了显卡最重要、负担最大的工作

未来GPU怎么变,就完全要看微软怎么想了
作者: xxx748    时间: 2008-12-2 23:21
:) 版主的回答很详细
作者: leeshock    时间: 2008-12-2 23:31
谢谢, 到底是斑竹
“微软发现努力提升这些附加效果,带来的画面提升反而更大,而单纯增加多边形生成率或者贴图速率,容易受硬件限制。于是这些附加效果渐渐喧宾夺主了————这就是DX9”
是不是说应为硬件技术的限制,现在要大副提高多边形生成率和贴图速度不行了,也就是这几年多边形这个指标提高不多?还是说现在这个指标包含在shader里面了? 要yy就yy SM x.0这个?性能?还是想知道现在的48xx gtx2xx大概每秒能生成多少啊?
作者: onlyjcy    时间: 2008-12-2 23:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: iiiiuuuu    时间: 2008-12-2 23:49
多边形生成率并不是无关痛痒的,而是发展撞墙了,所以大家都转去飙发展还没撞墙的shader了。
作者: dreamz3    时间: 2008-12-3 02:31
有一点要说明,3d硬件的发展概念不是微软说了算的,微软只是负责把nv和amd的想法整合成为标准而已
作者: yulei4217    时间: 2008-12-3 08:31
原帖由 dreamz3 于 2008-12-3 02:31 发表
有一点要说明,3d硬件的发展概念不是微软说了算的,微软只是负责把nv和amd的想法整合成为标准而已

我怎么感觉是MS制定标准,而NV和AMD在执行?
作者: Asuka    时间: 2008-12-3 08:50
原帖由 dreamz3 于 2008-12-3 02:31 发表
有一点要说明,3d硬件的发展概念不是微软说了算的,微软只是负责把nv和amd的想法整合成为标准而已


标准由MS制定

nv和amd只负责把MS的标准用硬件实现出来
作者: Asuka    时间: 2008-12-3 08:56
原帖由 leeshock 于 2008-12-2 23:31 发表
是不是说应为硬件技术的限制,现在要大副提高多边形生成率和贴图速度不行了,也就是这几年多边形这个指标提高不多?还是说现在这个指标包含在shader里面了? 要yy就yy SM x.0这个?性能?还是想知道现在的48xx gtx2xx大概每秒能生成多少啊?


现在的游戏,主要是卡在shader这个环节,因为shader过程可以比传统意义上的多边形生成复杂无数倍。所以,即使GPU把多边形生成率提得再高,shader性能不上来的话,显卡跑游戏照样很慢

严格来说,现在显卡的多边形生成率大概就是setup单元光栅化的速度,具体是多少就不清楚了。当年R300 4个vector SIMD号称可以每周期生成1个多边形,按这个标准来算,4870或者GTX260这种显卡,理论上的多边形生成率应该很轻易超过1000M
作者: ATI专业卡    时间: 2008-12-3 09:42
把"生成"这个词变成"实现"就容易理解多了.
作者: R620    时间: 2008-12-3 10:12
原帖由 Asuka 于 2008-12-3 08:56 发表


4870或者GTX260这种显卡,理论上的多边形生成率应该很轻易超过1000M


你的意思4870/GTX260都很容易突破10亿/s 还是1000亿/s:unsure:
作者: Azl2    时间: 2008-12-3 10:20
原帖由 Asuka 于 2008-12-2 22:55 发表







最初,3D画面就是给多边形帖上材质,整个过程都是CPU在算,没显卡什么事,显卡只负责把画面显示出来

后来到voodoo,继而到DX7 T&L,显卡开始在3D运算中夺权。那时显卡也没什么其他的事干,在转换坐 ...


学习了 希望明日香MM 给我们多来点这类知识
{happy:]

作者: snakenj    时间: 2008-12-3 11:03
不过CG工作站里,有个指标是 线框 吧
那些专业显示卡也是号称可以比娱乐卡多了线框加速的功能,在显示超级多的多边形的时候,速度快点

效果好的话,多边形数量少点,画面也可以,
最直接的例子就是 XBOX Halo,其实多边形很少,但是效果不错

不过如果要是追求细节的话,还是多边形数量高 + 效果
象人脸要做的好,多边形是前提条件

Dreamcast的莎木片头的玲莎花的脸部细节相当夸张,不过没有太多的眩目的效果

赛车之类的游戏,车要做的逼真,多边形数量还是要高
GT 1的赛车是500个polygons
GT4 是 5000 polygons
GT5是5-10Wpolygons,详细多少,Sony没有说,只谈到里面的座舱的polygons已经超过了GT4 1辆车的polygons
作者: insect2006    时间: 2008-12-3 11:16
山内一典曾经说过GT5每辆车的多边形高达20万!建模师做一辆车要花18个月!当年PGR4刚出来的时候曾经号称史上最NB的赛车游戏,每量车也不过用了8万-10万多边形
作者: insect2006    时间: 2008-12-3 11:19
多边形目前是远远不够,光影效果做到再好再逼真,你低头一看建筑全是棱角分明的,锯齿狗牙满天飞,你见过八变形的油桶吗?现在的游戏都这么干
作者: Asuka    时间: 2008-12-3 11:20
原帖由 snakenj 于 2008-12-3 11:03 发表
不过CG工作站里,有个指标是 线框 吧
那些专业显示卡也是号称可以比娱乐卡多了线框加速的功能,在显示超级多的多边形的时候,速度快点

效果好的话,多边形数量少点,画面也可以,
最直接的例子就是 XBOX Halo, ...


warhead随便一个frame里的多边形都超过300万了

看来游戏机还是马达马达达啊 {mellow:]
作者: insect2006    时间: 2008-12-3 11:24
而物理效果的模拟最终还是需要多边形的,通过特效提升游戏画面在GI实现之后就会停止进步,到时候多边形就会王者归来!!
作者: Asuka    时间: 2008-12-3 11:27
多边形早就已经归来了

去看看DX11的paper吧
作者: R620    时间: 2008-12-3 11:31
GTX280和HD4870X2每秒能生成多少亿个多边形?

[ 本帖最后由 R620 于 2008-12-3 11:36 编辑 ]
作者: Asuka    时间: 2008-12-3 11:33
原帖由 R620 于 2008-12-3 11:31 发表
GTX280和HD4870X2每秒能生成多少亿个多边形?


这个你去问AMD和NV比较好
作者: R620    时间: 2008-12-3 11:34
原帖由 Asuka 于 2008-12-3 11:33 发表


这个你去问AMD和NV比较好


已经给NV发了邮件了,可惜石沉大海{cry:]
作者: 以前的密码没了    时间: 2008-12-3 11:47
原帖由 iiiiuuuu 于 2008-12-2 23:49 发表
多边形生成率并不是无关痛痒的,而是发展撞墙了,所以大家都转去飙发展还没撞墙的shader了。

很赞同这种说法。从g80和r600以来,setup都是半个周期生成一个三角形(以前是一个周期一个)。大家可以计算一下理论值。
能力方面可以参考“http://we.pcinlife.com/viewthread.php?tid=685495&;
真正游戏中,以opengl游戏来说 使用 “Display List"情况很少 ,大多数时使用“Vertex arrays ”(VBO),所以三角形生成速度是远远不够的。(光照、反射、场景生成,现在游戏至少要绘制3次)
所以实际游戏往往也就100-200万个面,其实还是很少面的。大家可以参考一下crysis.

(没有涉及到tessellator技术)
作者: 冰雨寒雪    时间: 2008-12-3 11:58
还要看游戏引擎的开发了!硬件再高,多边形每秒10亿的演算能力那也要看游戏引擎了,引擎开发不出来还不是一样请注意称呼用词!
作者: R620    时间: 2008-12-3 12:04
原帖由 eiowis 于 2008-12-2 20:36 发表
现在 单位应该是亿了


个人认为最起码在30亿以上{lol:]
作者: iiiiuuuu    时间: 2008-12-3 12:20
原帖由 以前的密码没了 于 2008-12-3 11:47 发表

很赞同这种说法。从g80和r600以来,setup都是半个周期生成一个三角形(以前是一个周期一个)。大家可以计算一下理论值。
能力方面可以参考“http://we.pcinlife.com/viewthread.php?tid=685495&;
真正游戏中,以opengl游戏来说 使用 “Display List"情况很少 ,大多数时使用“Vertex arrays ”(VBO),所以三角形生成速度是远远不够的。(光照、反射、场景生成,现在游戏至少要绘制3次)
所以实际游戏往往也就100-200万个面,其实还是很少面的。大家可以参考一下crysis.

(没有涉及到tessellator技术)


即使是tessellator技术也只是解决内存到显存的顶点数据传输瓶颈,并不能提高多边形生成率。
作者: snakenj    时间: 2008-12-3 13:46
其实人的眼睛对光影的感觉更加明显点
在显示器尺寸维持现在的地步,多点效果会比多点多边形来的好
作者: leeshock    时间: 2008-12-3 13:48
感觉还是现在显卡多边形这个指标提不高了,所以不说了?现在很多游戏细节还是该圆的,椭圆的东西实际是多边形的。游戏画面根cg动画的主要差别 一个是锯齿,还有就是这些有棱角的东西了。这个性能提高还是很有必要的阿,好像是显卡公司现在故意在回避这个指标。要是现在显卡都有几e/每妙的生成率,估计画面就和cg差不多了,一个人物用1000w个,一辆车2000w个。。。。现在游戏效果开到顶光影,烟雾设么的已经很真实了。感觉光影到是每设么好提高了。

版主怎么是明日响?天鹰战士里面的?
作者: leeshock    时间: 2008-12-3 13:57
还有要做一些物理效果,比如东西爆炸变成很多快飞出去,飞出去的东西撞在其他东西上,再撞出许多碎片,这类旧要很多多变性阿。
作者: leeshock    时间: 2008-12-3 14:07
电脑生成三地画面都是先用多边形建模,然后贴图上去.在加些效果社么的,多边形月多,画面越精细,月逼真.所以我觉得不管怎么样多边形生成率这个指标都应该是硬指标痕量显卡性能.估计是现在他们没办法大幅度提高这个性能,所以避而不谈,改用其他容易提高的指标来做卖点宣传.
作者: sprit-punch    时间: 2008-12-3 15:07
原帖由 dreamz3 于 2008-12-3 02:31 发表
有一点要说明,3d硬件的发展概念不是微软说了算的,微软只是负责把nv和amd的想法整合成为标准而已

有的时候你需要的时候m$他不整合,你不需要了他又积极整合o:)

原帖由 snakenj 于 2008-12-3 11:03 发表
...Dreamcast的莎木片头的玲莎花的脸部细节相当夸张,不过没有太多的眩目的效果 ...


那张脸确实印象深刻,和杂志封面上的效果差不多了都,不过那是即时的吗

感觉5年前mark03里第三个测试,拿剑那个女人那张脸、头发就够真实的,用得多边形当时算多,但是估计到现在也不算什么了
古墓-传奇劳拉那人物模型也很牛,十分逼真啊:sweatingbullets:

估计以后游戏特效还是光与影站多些,光与影、水面等特效又是靠堆数学公式实现,所以还是ALU重要,还得靠SHADER来算。
作者: OCFish    时间: 2008-12-3 15:16
原帖由 Asuka 于 2008-12-2 22:55 发表







最初,3D画面就是给多边形帖上材质,整个过程都是CPU在算,没显卡什么事,显卡只负责把画面显示出来

后来到voodoo,继而到DX7 T&L,显卡开始在3D运算中夺权。那时显卡也没什么其他的事干,在转换坐 ...


那么这样说到底,这些业界大佬是因为预测到技术瓶颈后,通过其他手段将最终消费者引向非原来概念中的需求。而且傲慢到无需向消费者说明情况,因为他们就代表了地球上这方面最强。“GOD”不需要解释?这不就是赤裸裸的技术腐败吗?果然S3之类的厂商再也回不来,并非单单是技术问题。

如果作为最终消费者我只想要加强版TI4200这样的”像素填充机“,而不需要也不想要那些PS、VS,但我还是必须为这些掏银子。DX便是这罪恶的根源!所谓的标准便是它们相互分赃的工具。我不期望诸如标准由消费方制定,权威不能被挑战。但至少像INTEL那样承认自己碰壁。
作者: leeshock    时间: 2008-12-3 15:18
游戏里的物体总要建模的啊,多边形型越多模型越惊喜逼真,光影社么的总要照在物体模型上的.
不知道谁家里还有老的tnt geforce初代先卡的包装或者说明书可以看看那个时候这个生成率是多少.
作者: OCFish    时间: 2008-12-3 15:32
原帖由 leeshock 于 2008-12-3 13:48 发表
感觉还是现在显卡多边形这个指标提不高了,所以不说了?现在很多游戏细节还是该圆的,椭圆的东西实际是多边形的。游戏画面根cg动画的主要差别 一个是锯齿,还有就是这些有棱角的东西了。这个性能提高还是很有必要的阿 ...


游戏应用,不是电影特效。其核心内容是互动。所以是有意也好无奈也罢,事实放在眼前MS、AMD和NV至少在游戏应用上错误的输出着他们的概念。而游戏策划及制作人在这方面已经很多年得不到有意义的技术支持了。连个阴影效果能产生互动的游戏也屈指可数。这到底是应用的悲哀,还是技术的悲哀?或者到底是技术为应用服务,还是应用为技术服务?
作者: leeshock    时间: 2008-12-3 15:33
我觉得要画面好还是得一个眼睛用他几w个多边形,一个头几百w(头发多),一棵树上千w个,没片叶子几十个多边形....  然后上高倍抗拒尺,32/64/128,抗到看不出锯齿为止.然后用超高精度的贴土,在这些基础上才加各种光影,特效. 当然现在可能达不到,但是游戏引擎和先卡的发展方向应该是向这个方向漫漫提高,现在的3d引擎和先卡好象都在强调各种特效,(尤其是些新的游戏引擎)而忽略了主要的,追求次要的.
作者: leeshock    时间: 2008-12-3 15:38
crysis里面的树干就都是多边形的而不是圆的,crysis要是真牛的话应该一棵树用他1000w个,然后秒杀未来5年的先卡,这样a和n就急了,就会发展这方面性能了
作者: Asuka    时间: 2008-12-3 15:48
光栅化,在DX11就基本到头了
作者: OCFish    时间: 2008-12-3 15:52
原帖由 leeshock 于 2008-12-3 15:38 发表
crysis里面的树干就都是多边形的而不是圆的,crysis要是真牛的话应该一棵树用他1000w个,然后秒杀未来5年的先卡,这样a和n就急了,就会发展这方面性能了


如果只是单纯的追求一个树丛1000W个多边形,至少对于游戏应用来说是没有意义的。当然如果这些多边形能够真实的表现出树丛茂密的不同程度,而不同的程度会产生不同的影响,并且反馈给玩家,这便产生了一个互动。没有这个过程多边形、特效根本毫无意义。
作者: R620    时间: 2008-12-3 16:18
弹头一贞才300W多边形也太少了吧!现在的GTX280的多边形生成能力最起码都在1000M/S以上了
作者: snakenj    时间: 2008-12-3 16:54
那张脸确实印象深刻,和杂志封面上的效果差不多了都,不过那是即时的吗


real time的
因为有很多锯齿在那里,要是CG的话,会光滑很多,当年为了看这个脸,就在那里等前面的几分钟啊


其实游戏和现实的不同,我们还是可以看出来的,关键在于游戏中的光影和现实还是有区别,
要是能把光影反射做的和现实一样,其实多边形的作用就是其次的,
因为很少有人会去注意背景的细节,主要的视点都集中在画面中央了
把主角做的精细点就可以了
作者: leeshock    时间: 2008-12-3 17:05
象crysis里面这种方的树干,纸片状没有体积的树叶,草车子开过车论印是一段段直线组成的,没有曲线的,能叫真实吗?,光阴再好也只能叫画面非常好,华丽.
作者: leeshock    时间: 2008-12-3 17:08
还有掉出来的弹壳,也不是圆住状的.子弹飞出去就是一个光点, 没有单独给子弹做个模型(好象所有游戏都这样),不是说crysis不好,英为这个是现在画面最好的游戏,所以拿他讨论讨论
作者: R620    时间: 2008-12-3 17:30
以前的VS现在DX10的GS是不是用来计算多边形生成的?

[ 本帖最后由 R620 于 2008-12-3 17:39 编辑 ]
作者: insect2006    时间: 2008-12-3 18:35
这年头多边形才是王道啊
作者: pdfa    时间: 2008-12-3 22:10
GF2U就已经达到1亿,记得当年CREATIVE刊登在大软上的GF2U就是以此作为卖点。后来越来越少听说显卡这方面的指标了。以前的显卡基本就是2个指标:一个是多边形,一个是填充率。
作者: sprit-punch    时间: 2008-12-3 22:16
原帖由 snakenj 于 2008-12-3 16:54 发表
那张脸确实印象深刻,和杂志封面上的效果差不多了都,不过那是即时的吗


real time的
因为有很多锯齿在那里,要是CG的话,会光滑很多,当年为了看这个脸,就在那里等前面的几分钟啊


其实游戏和现实的不同, ...


呵呵,这么说程序员优化的不错,pvr2的效能也不错啊

原帖由 snakenj 于 2008-12-3 16:54 发表
游戏中的光影和现实还是有区别,要是能把光影反射做的和现实一样,其实多边形的作用就是其次的,
因为很少有人会去注意背景的细节, ...

这个绝对有同感,有时晚上在路上走,一排路灯与你之间有个人,能看到每个光源对这个人都有个影子,
深浅不同,你移动会感觉影子也在动,而游戏里很少见到这样的效果,
估计要实现的话,又要堆N多数学公式
作者: snakenj    时间: 2008-12-4 10:03
GF2U就已经达到1亿,记得当年CREATIVE刊登在大软上的GF2U就是以此作为卖点。

我记得GF2 和Radeon都是3000W polygons,但是都是理论速度,就是不算其他材质和光影,
单纯的计算polygons 的顶点的能力

2002年的GF4展示的时候,有个狼人,号称10Wpolygons的建模,demo里是包括背景和其他特效

DC的PowerVR250 1998年的时候是300Wpolygons 的实际效果
后期SEGA自己的OS Kage的效能是500Wpolygons
有2个游戏能达到这个指标
1个是赛车游戏 Lemans 24,不过游戏很无聊
还有个是武装女神,不过这个游戏后来搬到XBOX上了,
当年Apple演示G4还是G3的时候,也用过这个游戏,硬件平台是G3或者G4的 CPU + ATI Rage16MB的显示卡

DC倒霉在就支持1个光源,但是 画面颜色很鲜艳,但是很多影子是贴图上去的,不是实时的
PS2相反,游戏画面大多比较暗淡,但是光源很出色,ICO就是个例子
然后最后SONY的GT4看家作1出,就逆袭了

现在NV ATI都不说自己的卡能有多少 polygon,估计也是面子上过不去
因为保守估计260,4870都应该有20亿 polygon,因为2001年的XBOX都1。25亿 polygon
但是游戏并没有比以前的游戏精细20倍,所以就开始忽悠其他的指标
反正以前的GF4,R200也没有这些指标,不好和现在的卡做对比

不过关键还是游戏开发商实力不行啊

SEGA的街机平台配制:
P4 3.0E
1G Ram
NV5900 256MB的卡

按照现在的观点,都是04,05年的中古产品了
但是VR5的素质相当的赞啊
作者: snakenj    时间: 2008-12-4 10:10
说错了
SEGA的平台是 7800的显示卡
作者: char999    时间: 2008-12-4 10:51
不知道把游戏设置中的模型细节开最高其他全部最低的话在相同环境下同游戏场景不同的显卡比如4850和1950这种差几代的是否FPS区别很大,这个应该可以在一定程度上验证多变形这几年没有什么发展这一观点。ti4200和gtx280的纯多变形生成率到底差多少呢?期待有条件的做下实验
作者: leeshock    时间: 2008-12-4 11:25
"因为保守估计260,4870都应该有20亿 polygon"
求测试图,无图无真相. 另ps3 x360能有多少啊,跨平台游戏ps3/x360版本建模比电脑版用的多边形少吗?
作者: R620    时间: 2008-12-4 11:38
标题: 回复 53# snakenj 的帖子
VR5的确很震撼....
作者: snakenj    时间: 2008-12-4 13:31
求测试图,无图无真相.

从来就没有过图,
3000W polygon 的画面,也得分30fps,60fps,
那么就是100W polygon和50Wpolygon 每frame

没有厂家公布的

我是按照XBOX这样推算的
XBOX是贫弱的P3 733,而且还是128kb 的
NV2X显示卡
公用64MB的显村

Bill 自己说的,1。5亿polygon,后来下调到1。25亿
2001年的配制,按照平均每年1。5倍的递增
到2008年,正好是21。5亿polygon
作者: Asuka    时间: 2008-12-4 13:57
原帖由 snakenj 于 2008-12-4 13:31 发表
求测试图,无图无真相.

从来就没有过图,
3000W polygon 的画面,也得分30fps,60fps,
那么就是100W polygon和50Wpolygon 每frame

没有厂家公布的

我是按照XBOX这样推算的
XBOX是贫弱的P3 733,而且还是1 ...


{happy:] 大哥你先去确认一下frame和fps的含义
作者: insect2006    时间: 2008-12-4 16:20
原帖由 Asuka 于 2008-12-4 13:57 发表


{happy:] 大哥你先去确认一下frame和fps的含义


问题是多边形生生成能力的单位是什么??如果是3000万多边形每秒,那么50FPS算下来平均每frame的确是60万多边形
作者: leeshock    时间: 2008-12-4 17:05
我觉得在可以遇见的将来游戏引擎使用多边形越多,物体场景越精细这个应该不会改变的,显卡盒子上至少应该标一下这个数据吧,n卡和a卡都不写,难道是默契?
作者: R620    时间: 2008-12-4 17:53
标题: 回复 59# Asuka 的帖子
fps是帧  frame是框架 对吗?
作者: R620    时间: 2008-12-5 09:42
原帖由 Asuka 于 2008-12-3 11:27 发表
多边形早就已经归来了

去看看DX11的paper吧


DX11的paper里哪里有说多边形归来?{titter:]
作者: R620    时间: 2008-12-5 09:57
Quadro FX5800基于GTX280图形架构,具备240个CUDA可编程平行运算核心,而且是业界首张搭载4GB显存的显卡,具分段式功能的交互式4D成像技术,高达每秒102GB的大容量内存带宽,填充率每秒超过520亿纹理像素,以及每秒3亿个三角形的几何坐标性能

GTX280也才是3亿而已没什么了不起的

[ 本帖最后由 R620 于 2008-12-5 09:59 编辑 ]
作者: R620    时间: 2008-12-5 09:59
GTX280也就是每秒生成3亿个多边形而已没什么了不起的:p
作者: char999    时间: 2008-12-5 11:06
Quadro FX5800基于GTX280图形架构,具备240个CUDA可编程平行运算核心,而且是业界首张搭载4GB显存的显卡,具分段式功能的交互式4D成像技术,高达每秒102GB的大容量内存带宽,填充率每秒超过520亿纹理像素,以及每秒3亿个三角形的几何坐标性能

这个有价值啊!
单卡目前的极限多边形生成率也不过3亿而已,看来从X1900,7800时到到现在多边形提升基本很少,顶多2,3倍的样子,这也能解释为什么即使是顶级的PC游戏画面上依然没有凌驾与X360平台的感觉了,注意,这里的凌驾就像从FC到SFC,PS到PS2的感觉。
作者: Asuka    时间: 2008-12-5 11:07
PC画面还不能凌驾X360?

楼上你确认你是地球居民?{happy:]
作者: R620    时间: 2008-12-5 11:37
http://www.pcpop.com/doc/0/352/352148.shtml
作者: leeshock    时间: 2008-12-5 12:21
frame么就是一副画面,或者一真,fps么 大概是frame per second,一秒重几真的意思
作者: hdht    时间: 2008-12-5 12:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: char999    时间: 2008-12-5 13:39
PC画面还不能凌驾X360?

楼上你确认你是地球居民?

你帮我找个能凌驾的吧。CRISIS VH也别跟我说了,那东西漂亮是漂亮,但也就那样,该方的地方还是方,假的还是假
作者: Asuka    时间: 2008-12-5 13:42
原帖由 char999 于 2008-12-5 13:39 发表
PC画面还不能凌驾X360?

楼上你确认你是地球居民?

你帮我找个能凌驾的吧。CRISIS VH也别跟我说了,那东西漂亮是漂亮,但也就那样,该方的地方还是方,假的还是假


对比画面,PC上一个FEAR资料片就够游戏机最顶级水平了,哪用得上crysis
作者: leeshock    时间: 2008-12-5 14:10
"现在游戏的画面和高品质CG电影的画面差距我看主要就在多边形数量上。

现在的游戏里除了贴图,我看就没有什么东西人眼看上去是圆形。"
还有锯齿,cg渲染好以后很多都是人工一点一点修的,把矩尺修掉

x360和pc那个画面好去别处讨论吧.要是象上面说的gtx280理论3e个,光源,物理.社么的特效用掉一部分性能,算他还有1.5e/秒, 游戏一秒一百真的话就是1500w一真画面,场景大点,人物,东西多点,还源源不够啊,怪布道连crysis也那么多方的东西,不过不知道游戏当中如果一个人物,物体建模好了,是不是这个物体在下一真画面当中出现,就不要再算多边形了?,还是每真画面都要把场景里所有的东西都重复计算一次多边形?谁知道,说一下?
作者: leeshock    时间: 2008-12-5 14:14
"现在的游戏里除了贴图,我看就没有什么东西人眼看上去是圆形"

这到不是, crysisi里车轮 还是满圆的啊, 战争机器, 使命召唤社么的人头也是比较圆的.
作者: snakenj    时间: 2008-12-5 14:26
单独一个物体,车辆,人物啊,来1000W个ploygons,估计那些程序员要骂娘的,累死人啊
作者: leeshock    时间: 2008-12-5 15:16
"单独一个物体,车辆,人物啊,来1000W个ploygons,估计那些程序员要骂娘的,累死人啊"
难道瓶颈是程序员?不是硬件?
作者: char999    时间: 2008-12-5 16:07
原帖由 leeshock 于 2008-12-5 14:10 发表
"现在游戏的画面和高品质CG电影的画面差距我看主要就在多边形数量上。

现在的游戏里除了贴图,我看就没有什么东西人眼看上去是圆形。"
还有锯齿,cg渲染好以后很多都是人工一点一点修的,把矩尺修掉

x360和pc那 ...



1.5e/100= 1500w?

150W吧。

而且现在新出的大作基本上280是跑不到100FPS的,就是说大概每桢画面会有300W-500W的多边形,Crisis应该的所使用的多边形应该就在这个数量级上。

自己也小失望了把,还以为显卡真的进步了3D系列评分里那么多倍,弄了半天进步的只是厂商希望我们看到的方面。
作者: R620    时间: 2008-12-5 17:48
原帖由 leeshock 于 2008-12-5 15:16 发表
"单独一个物体,车辆,人物啊,来1000W个ploygons,估计那些程序员要骂娘的,累死人啊"
难道瓶颈是程序员?不是硬件?


没必要单个物体1000w ploygons,又不是搞CG电影制作{ninja:]
作者: yuanico    时间: 2008-12-5 21:18
看过一篇介绍mgs3画面的文章 总结下来就是ps2上的游戏 画面技术含量的确不高 但是美工水准太可怕了 做技术的和做游戏的 思路的确不一样啊
作者: PS5    时间: 2008-12-6 10:22
原帖由 yuanico 于 2008-12-5 21:18 发表
看过一篇介绍mgs3画面的文章 总结下来就是ps2上的游戏 画面技术含量的确不高 但是美工水准太可怕了 做技术的和做游戏的 思路的确不一样啊


仔细看就不觉得TV GAME的画面好了{glare:]
作者: Asuka    时间: 2008-12-6 10:29
原帖由 leeshock 于 2008-12-5 14:10 发表
x360和pc那个画面好去别处讨论吧.要是象上面说的gtx280理论3e个,光源,物理.社么的特效用掉一部分性能,算他还有1.5e/秒, 游戏一秒一百真的话就是1500w一真画面,场景大点,人物,东西多点,还源源不够啊,怪布道连crysis也那么多方的东西,不过不知道游戏当中如果一个人物,物体建模好了,是不是这个物体在下一真画面当中出现,就不要再算多边形了?,还是每真画面都要把场景里所有的东西都重复计算一次多边形?谁知道,说一下?


每一帧都要把整个场景渲染一遍
作者: Asuka    时间: 2008-12-6 10:40
现在的游戏根本不可能到每frame 300-500W的多边形

几个画面出色的主流FPS的多边形一般是两位数左右,COD4、COD5在10~20W左右,GRID、GOW、上古4可以到20~40W  polygon per frame

GT5之类的游戏运行起来每个frame多边形也不会多,维持在两位数的水平,因为7800的setup引擎能力摆在那里,它们依然是用出色的shader带来更养眼的效果

比较例外的是Crysis,它每帧的多边形可以随便超过100W,Crysis warhead最高的时候可以到每个frame 350W左右的多边形,这种规模的多边形让这个2007年的引擎的渲染效果至今都没有被超越,这也是无论用什么显卡都跑不快的原因之一。







下图是cho跑的COD4引擎某一段场景渲染特性分析



SHADER:TMU:ROP三组单元的平均繁忙度为76.1%、49.8%、28%,SHADER等待TMU所占用的处理时间平均为13.3%,几何处理繁忙度并不高,只有大约0.2%,Setup引擎处理的三角形数量平均每帧约为11.3万个三角形,装载的纹理大小为439.4MB左右。

作者: leeshock    时间: 2008-12-7 15:47
比较例外的是Crysis,它每帧的多边形可以随便超过100W,Crysis warhead最高的时候可以到每个frame 350W左右的多边形,这种规模的多边形让这个2007年的引擎的渲染效果至今都没有被超越,这也是无论用什么显卡都跑不快的原因之一

果然还是多边形生成率这个性能重要啊,被显卡厂忽悠了啊
作者: Asuka    时间: 2008-12-7 16:54
原帖由 leeshock 于 2008-12-7 15:47 发表
比较例外的是Crysis,它每帧的多边形可以随便超过100W,Crysis warhead最高的时候可以到每个frame 350W左右的多边形,这种规模的多边形让这个2007年的引擎的渲染效果至今都没有被超越,这也是无论用什么显卡都跑不快的原因之一

果然还是多边形生成率这个性能重要啊,被显卡厂忽悠了啊


Crysis的模型精细只是它对硬件要求高的原因之一

CE2的shader、材质、postprocessing都是PC GAME有史以来最复杂的,而且因为渲染的object多,overhead也很大

我前面已经说过了,多边形生成率根本不是现在硬件的瓶颈所在,首先把显卡压死的是shader
作者: leeshock    时间: 2008-12-7 20:21
明日香又来了
作者: tjtj    时间: 2008-12-7 21:12
一同学习。。
作者: shu0202    时间: 2008-12-7 22:29
如果只谈多边形,今天的GPG快速描绘几百万/帧是轻而易举的事情。3DMark05/06许多场景都在200万/帧以上,400多元的显卡都能跑得飞快。但是一旦加入比较复杂的光影和粒子效果就立刻把GPU拖垮。现在的问题是多边形数量上去了,相应的为每个多边形所需的像素效果运算会大规模增加,这才是真正的负担!所以多数游戏多边形数量保持在40万/帧以内是为了迁就pixel。另外,我个人感觉很多游戏引擎效率低下缺少优化更是一个重要问题。
作者: leeshock    时间: 2008-12-7 23:06
shu202说得有点道理
作者: shu0202    时间: 2008-12-8 13:22
Shader的关联复杂程度对性能影响非常显著。虽然理论上NV40已经能够运行任意长的Shader程序,但是谁都知道实时跑上千条Shader意味着什么。大规模增加多边形会导致描画像素关联的Shader呈几何数量增长,而且数据传输的压力和为解决数据传输问题而设置的本地寄存器的容量压力都会无法满足要求。所以能够使用大量重复数据会是减轻压力的办法。Crysis的野外场景这方面做得很不错;卡马克未来涉及大规模野外场景设计也是这个办法。
所以当Crysis用电影级的上万条Shader长度打造画面并使之能够比较好的运行的时候,我是由衷赞叹的!其他变态游戏的Shader复杂程度甚至不及Crysis的四分之一!
作者: insect2006    时间: 2008-12-8 14:15
家用机里面我记得用shader用的最变态的就是killzone 2
作者: iiiiuuuu    时间: 2008-12-8 14:21
这样啊?

Deferred Shading的Pixel shader的复杂度与多边形数量无关。

而且即使不用Deferred Shading就有关了?
作者: leeshock    时间: 2008-12-8 21:15
微软表示Windows 7将直接在CPU上跑DirectX 10

  Windows Vista对GPU的高要求让微软的老爷机客户们意念崩溃,因此他们正在做出一些改变以减低系统需求.
最新的一个消息是Windows 7中的DirectX 10版本将不再需要专用的GPU,微软透露他们将发布一个最新的概念:Windows高级光栅平台 - "WARP".已经将Direct3D 10和10.1全部置于CPU来运行并且可以同时提供高达8倍的多采样抗锯齿,各向异性过滤和所有可选的纹理格式,并且实现这些特效的系统配置仅需800MHz的处理器.


  这意味着Windows 7的特效本身和许多游戏中原有的工作量都将转移到CPU来完成,完成了一次任务处理对象的回归.

  微软还提供了一些有趣的数据,当Crysis运行在英特尔集成显卡的800x600最低质量设置下时,八核心i7系统的平均帧速为7.36fps.

  虽然目前能实现的性能很入门,但ATI和NV应该会适当发发抖.
作者: everyoung    时间: 2008-12-8 21:57
微软绝对是标准制定者,计算机3D图形技术的首创者全在微软,都是微软从SGI挖过去,都是数学家级别的人物
作者: shu0202    时间: 2008-12-8 22:36
原帖由 everyoung 于 2008-12-8 21:57 发表
微软绝对是标准制定者,计算机3D图形技术的首创者全在微软,都是微软从SGI挖过去,都是数学家级别的人物


对图形渲染这种实践性很强的产业来说,闭门造车搞纯理论的标准是根本不行的。D3D由MS发布,但是它必须根据产业的发展特别是硬件技术的发展以协商的方式来确定标准,NV和ATi这些企业的设想是非常重要的。当然他们之间的分歧也很大,MS当然要统一最后的意见。
作者: elisha    时间: 2008-12-8 22:56
原帖由 insect2006 于 2008-12-8 14:15 发表
家用机里面我记得用shader用的最变态的就是killzone 2

3年过去了,killzone2还没出来呢
作者: guojuxia    时间: 2008-12-9 10:50
原帖由 Asuka 于 2008-12-2 22:55 发表







最初,3D画面就是给多边形帖上材质,整个过程都是CPU在算,没显卡什么事,显卡只负责把画面显示出来

后来到voodoo,继而到DX7 T&L,显卡开始在3D运算中夺权。那时显卡也没什么其他的事干,在转换坐 ...


哈哈哈好生动啊赞~~~
作者: 93blue    时间: 2008-12-9 15:50
看多了各大FANS的互喷贴、娱乐贴,在显卡区看到这种难得的技术讨论贴要顶一下  {lol:]
作者: G81    时间: 2008-12-9 17:54
原帖由 leeshock 于 2008-12-8 21:15 发表
虽然目前能实现的性能很入门,但ATI和NV应该会适当发发抖


ATI和NV为什么要发抖?:blink:
作者: haofeia    时间: 2008-12-9 18:55
广告时间 o:)

內建4GB記憶體緩存 NVIDIA發佈全新Quadro FX 5800

NVIDIA 宣佈推出首款 4GB 專業繪圖卡 Quadro FX 5800 ,具備 CUDA 密集平行咚慵軜嫞瑸槭?团c天然氣探索、醫學成像及造型設計等專業應用提供當前最強大的效能與功能,超越傳統 3D 成像的技術,將大量的資料集進行視覺化,可以協助專業人士快速地作出精確的決定。

NVIDIA Quadro FX 5800 基於 GT200 繪圖架構,具備 240 個 CUDA 可編程平行咚愫诵模??沂菢I界首張搭載 4GB 繪圖記憶體的繪圖卡,具分段式功能的互動式 4D 成像技術,高達每秒 102 GB 的大容量記憶體頻寬,填充率每秒超過 520 億紋素,以及每秒 3 億個三角形的幾何座標效能,支援 OpenGL 與微軟 DirectX 10 等次世代應用及 Quadro G-Sync II 功能提供先進的多重系統與多重裝置視覺化環境。

这个能说明一些吧!
作者: G81    时间: 2008-12-10 18:01
原帖由 shu0202 于 2008-12-7 22:29 发表
如果只谈多边形,今天的GPG快速描绘几百万/帧是轻而易举的事情。3DMark05/06许多场景都在200万/帧以上,400多元的显卡都能跑得飞快。但是一旦加入比较复杂的光影和粒子效果就立刻把GPU拖垮。现在的问题是多边形数量上 ...


那么CRYSIS为什么连GTX280都无法流畅?这个你怎么解释?总不至于GTX280这个级别的显卡还需要迁就pixel吧?(_(




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4