POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: leeshock
打印 上一主题 下一主题

关于显卡多边形生成率的讨论!!!

  [复制链接]
81#
发表于 2008-12-6 10:29 | 只看该作者
原帖由 leeshock 于 2008-12-5 14:10 发表
x360和pc那个画面好去别处讨论吧.要是象上面说的gtx280理论3e个,光源,物理.社么的特效用掉一部分性能,算他还有1.5e/秒, 游戏一秒一百真的话就是1500w一真画面,场景大点,人物,东西多点,还源源不够啊,怪布道连crysis也那么多方的东西,不过不知道游戏当中如果一个人物,物体建模好了,是不是这个物体在下一真画面当中出现,就不要再算多边形了?,还是每真画面都要把场景里所有的东西都重复计算一次多边形?谁知道,说一下?


每一帧都要把整个场景渲染一遍
回复 支持 1 反对 0

使用道具 举报

82#
发表于 2008-12-6 10:40 | 只看该作者
现在的游戏根本不可能到每frame 300-500W的多边形

几个画面出色的主流FPS的多边形一般是两位数左右,COD4、COD5在10~20W左右,GRID、GOW、上古4可以到20~40W  polygon per frame

GT5之类的游戏运行起来每个frame多边形也不会多,维持在两位数的水平,因为7800的setup引擎能力摆在那里,它们依然是用出色的shader带来更养眼的效果

比较例外的是Crysis,它每帧的多边形可以随便超过100W,Crysis warhead最高的时候可以到每个frame 350W左右的多边形,这种规模的多边形让这个2007年的引擎的渲染效果至今都没有被超越,这也是无论用什么显卡都跑不快的原因之一。







下图是cho跑的COD4引擎某一段场景渲染特性分析



SHADER:TMU:ROP三组单元的平均繁忙度为76.1%、49.8%、28%,SHADER等待TMU所占用的处理时间平均为13.3%,几何处理繁忙度并不高,只有大约0.2%,Setup引擎处理的三角形数量平均每帧约为11.3万个三角形,装载的纹理大小为439.4MB左右。
回复 支持 1 反对 0

使用道具 举报

83#
 楼主| 发表于 2008-12-7 15:47 | 只看该作者
比较例外的是Crysis,它每帧的多边形可以随便超过100W,Crysis warhead最高的时候可以到每个frame 350W左右的多边形,这种规模的多边形让这个2007年的引擎的渲染效果至今都没有被超越,这也是无论用什么显卡都跑不快的原因之一

果然还是多边形生成率这个性能重要啊,被显卡厂忽悠了啊
回复 支持 0 反对 1

使用道具 举报

84#
发表于 2008-12-7 16:54 | 只看该作者
原帖由 leeshock 于 2008-12-7 15:47 发表
比较例外的是Crysis,它每帧的多边形可以随便超过100W,Crysis warhead最高的时候可以到每个frame 350W左右的多边形,这种规模的多边形让这个2007年的引擎的渲染效果至今都没有被超越,这也是无论用什么显卡都跑不快的原因之一

果然还是多边形生成率这个性能重要啊,被显卡厂忽悠了啊


Crysis的模型精细只是它对硬件要求高的原因之一

CE2的shader、材质、postprocessing都是PC GAME有史以来最复杂的,而且因为渲染的object多,overhead也很大

我前面已经说过了,多边形生成率根本不是现在硬件的瓶颈所在,首先把显卡压死的是shader
回复 支持 1 反对 0

使用道具 举报

85#
 楼主| 发表于 2008-12-7 20:21 | 只看该作者
明日香又来了
回复 支持 1 反对 0

使用道具 举报

86#
发表于 2008-12-7 21:12 | 只看该作者
一同学习。。
回复 支持 反对

使用道具 举报

87#
发表于 2008-12-7 22:29 | 只看该作者
如果只谈多边形,今天的GPG快速描绘几百万/帧是轻而易举的事情。3DMark05/06许多场景都在200万/帧以上,400多元的显卡都能跑得飞快。但是一旦加入比较复杂的光影和粒子效果就立刻把GPU拖垮。现在的问题是多边形数量上去了,相应的为每个多边形所需的像素效果运算会大规模增加,这才是真正的负担!所以多数游戏多边形数量保持在40万/帧以内是为了迁就pixel。另外,我个人感觉很多游戏引擎效率低下缺少优化更是一个重要问题。
回复 支持 反对

使用道具 举报

88#
 楼主| 发表于 2008-12-7 23:06 | 只看该作者
shu202说得有点道理
回复 支持 反对

使用道具 举报

89#
发表于 2008-12-8 13:22 | 只看该作者
Shader的关联复杂程度对性能影响非常显著。虽然理论上NV40已经能够运行任意长的Shader程序,但是谁都知道实时跑上千条Shader意味着什么。大规模增加多边形会导致描画像素关联的Shader呈几何数量增长,而且数据传输的压力和为解决数据传输问题而设置的本地寄存器的容量压力都会无法满足要求。所以能够使用大量重复数据会是减轻压力的办法。Crysis的野外场景这方面做得很不错;卡马克未来涉及大规模野外场景设计也是这个办法。
所以当Crysis用电影级的上万条Shader长度打造画面并使之能够比较好的运行的时候,我是由衷赞叹的!其他变态游戏的Shader复杂程度甚至不及Crysis的四分之一!
回复 支持 反对

使用道具 举报

90#
发表于 2008-12-8 14:15 | 只看该作者
家用机里面我记得用shader用的最变态的就是killzone 2
回复 支持 反对

使用道具 举报

91#
发表于 2008-12-8 14:21 | 只看该作者
这样啊?

Deferred Shading的Pixel shader的复杂度与多边形数量无关。

而且即使不用Deferred Shading就有关了?
回复 支持 反对

使用道具 举报

92#
 楼主| 发表于 2008-12-8 21:15 | 只看该作者
微软表示Windows 7将直接在CPU上跑DirectX 10

  Windows Vista对GPU的高要求让微软的老爷机客户们意念崩溃,因此他们正在做出一些改变以减低系统需求.
最新的一个消息是Windows 7中的DirectX 10版本将不再需要专用的GPU,微软透露他们将发布一个最新的概念:Windows高级光栅平台 - "WARP".已经将Direct3D 10和10.1全部置于CPU来运行并且可以同时提供高达8倍的多采样抗锯齿,各向异性过滤和所有可选的纹理格式,并且实现这些特效的系统配置仅需800MHz的处理器.


  这意味着Windows 7的特效本身和许多游戏中原有的工作量都将转移到CPU来完成,完成了一次任务处理对象的回归.

  微软还提供了一些有趣的数据,当Crysis运行在英特尔集成显卡的800x600最低质量设置下时,八核心i7系统的平均帧速为7.36fps.

  虽然目前能实现的性能很入门,但ATI和NV应该会适当发发抖.
回复 支持 反对

使用道具 举报

93#
发表于 2008-12-8 21:57 | 只看该作者
微软绝对是标准制定者,计算机3D图形技术的首创者全在微软,都是微软从SGI挖过去,都是数学家级别的人物
回复 支持 反对

使用道具 举报

94#
发表于 2008-12-8 22:36 | 只看该作者
原帖由 everyoung 于 2008-12-8 21:57 发表
微软绝对是标准制定者,计算机3D图形技术的首创者全在微软,都是微软从SGI挖过去,都是数学家级别的人物


对图形渲染这种实践性很强的产业来说,闭门造车搞纯理论的标准是根本不行的。D3D由MS发布,但是它必须根据产业的发展特别是硬件技术的发展以协商的方式来确定标准,NV和ATi这些企业的设想是非常重要的。当然他们之间的分歧也很大,MS当然要统一最后的意见。
回复 支持 反对

使用道具 举报

95#
发表于 2008-12-8 22:56 | 只看该作者
原帖由 insect2006 于 2008-12-8 14:15 发表
家用机里面我记得用shader用的最变态的就是killzone 2

3年过去了,killzone2还没出来呢
回复 支持 反对

使用道具 举报

96#
发表于 2008-12-9 10:50 | 只看该作者
原帖由 Asuka 于 2008-12-2 22:55 发表







最初,3D画面就是给多边形帖上材质,整个过程都是CPU在算,没显卡什么事,显卡只负责把画面显示出来

后来到voodoo,继而到DX7 T&L,显卡开始在3D运算中夺权。那时显卡也没什么其他的事干,在转换坐 ...


哈哈哈好生动啊赞~~~
回复 支持 反对

使用道具 举报

97#
发表于 2008-12-9 15:50 | 只看该作者
看多了各大FANS的互喷贴、娱乐贴,在显卡区看到这种难得的技术讨论贴要顶一下  {lol:]
回复 支持 反对

使用道具 举报

98#
发表于 2008-12-9 17:54 | 只看该作者
原帖由 leeshock 于 2008-12-8 21:15 发表
虽然目前能实现的性能很入门,但ATI和NV应该会适当发发抖


ATI和NV为什么要发抖?:blink:
回复 支持 反对

使用道具 举报

99#
发表于 2008-12-9 18:55 | 只看该作者
广告时间 o:)

內建4GB記憶體緩存 NVIDIA發佈全新Quadro FX 5800

NVIDIA 宣佈推出首款 4GB 專業繪圖卡 Quadro FX 5800 ,具備 CUDA 密集平行咚慵軜嫞瑸槭?团c天然氣探索、醫學成像及造型設計等專業應用提供當前最強大的效能與功能,超越傳統 3D 成像的技術,將大量的資料集進行視覺化,可以協助專業人士快速地作出精確的決定。

NVIDIA Quadro FX 5800 基於 GT200 繪圖架構,具備 240 個 CUDA 可編程平行咚愫诵模??沂菢I界首張搭載 4GB 繪圖記憶體的繪圖卡,具分段式功能的互動式 4D 成像技術,高達每秒 102 GB 的大容量記憶體頻寬,填充率每秒超過 520 億紋素,以及每秒 3 億個三角形的幾何座標效能,支援 OpenGL 與微軟 DirectX 10 等次世代應用及 Quadro G-Sync II 功能提供先進的多重系統與多重裝置視覺化環境。

这个能说明一些吧!
回复 支持 反对

使用道具 举报

100#
发表于 2008-12-10 18:01 | 只看该作者
原帖由 shu0202 于 2008-12-7 22:29 发表
如果只谈多边形,今天的GPG快速描绘几百万/帧是轻而易举的事情。3DMark05/06许多场景都在200万/帧以上,400多元的显卡都能跑得飞快。但是一旦加入比较复杂的光影和粒子效果就立刻把GPU拖垮。现在的问题是多边形数量上 ...


那么CRYSIS为什么连GTX280都无法流畅?这个你怎么解释?总不至于GTX280这个级别的显卡还需要迁就pixel吧?(_(
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-4-24 18:25

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表