POPPUR爱换

标题: 看见UT3的物理地图帧数后,想问个问题。 [增加PPU vs GeForce PhysX] [打印本页]

作者: jiliaoke    时间: 2008-6-24 22:59
标题: 看见UT3的物理地图帧数后,想问个问题。 [增加PPU vs GeForce PhysX]
看见他们跑的哪个UT3的物理地图后,想问个问题。可以肯定,NV的卡跑UT3物理地图的帧数至少降低了70%(和其它UT3的地图比),我想问的是,这70%的显卡资源用在什么地方了?到底是更多的物理特效需要更多的图形细节来表达,所以导致渲染物体增多才下降的,还是纯物理计算跟不上导致的?本人非N/A fans,纯好奇。
作者: darkangel308    时间: 2008-6-24 23:15
按理说是CPU物理计算瓶颈造成的,不过NV的有物理加速的功能,帧速还是不算高就不知道什么原因了......
作者: slice    时间: 2008-6-24 23:17
鉴于该地图即使N卡不用物理驱动FPS也更加难看来说,GPU确实产于了大量物理运算,不用GPU加速物理那么瓶颈完全在处理物理上。
而启用物理加速后,至于如何平衡物理运算和图像处理,这得问NV的驱动如何平衡,假如如果已经是比较平衡的了的话,也就是说都不是瓶颈或都是瓶颈了,比例LZ自己看着办。

[ 本帖最后由 slice 于 2008-6-24 23:18 编辑 ]
作者: 9998702    时间: 2008-6-24 23:35
物理运算就是个鸡肋,希望以后出现效率更高的特效
作者: jhj9    时间: 2008-6-24 23:43
原帖由 jiliaoke 于 2008-6-24 22:59 发表
看见他们跑的哪个UT3的物理地图后,想问个问题。可以肯定,NV的卡跑UT3物理地图的帧数至少降低了70%(和其它UT3的地图比),我想问的是,这70%的显卡资源用在什么地方了?到底是更多的物理特效需要更多的图形细节来表 ...


更多的物理特效需要更多的图形细节来表达,这应该就是最主要的因素。
这些场景的构成复杂程度,以及物体数量本来就比普通地图要多和复杂,即使不进行物理处理,这些地图本身也能带来很大的负载。
同时这些可以被破坏,进行交互的物理运算本身也会带来很大的运算量,自然也会降低速度。
作者: fevaoctwh    时间: 2008-6-24 23:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: jiliaoke    时间: 2008-6-24 23:56
原帖由 fevaoctwh 于 2008-6-24 23:48 发表
物理运算地图你可以理解为没开PPU,所有物理运算都要CPU负责,累死。GPU等着CPU的数据再渲染,效率不高
开启NV的神奇的物理加速后,GPU会接手物理运算。只不过GPU还是GPU,运算能力就这点,物理运算会消耗大量的运算 ...



关于插物理卡这个观点我倒不是特别认同,因为我印象以前那个cell factor插了物理卡了照样不是很快,那个玩意的画面跟UT3没法比

[ 本帖最后由 jiliaoke 于 2008-6-24 23:58 编辑 ]
作者: ktv123    时间: 2008-6-25 00:00
物理加速是用来转移自己产品性能不济价格过高的话题

N这次太保守 如果上了55NM 不至于这么惨 不过等N上了55NM

A又上了 50或45NM

除非换新架构 不然这个G80是无法扭转局势的

A已经获得先凑
作者: fevaoctwh    时间: 2008-6-25 00:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: jiliaoke    时间: 2008-6-25 00:21
原帖由 fevaoctwh 于 2008-6-25 00:02 发表


但是FPS下降幅度肯定比现在的GPU方法小。运算能力是固定的。负责了物理运算再渲染画面肯定不能和单渲染画面的FPS比
插了物理加速卡,GPU不会浪费资源在物理运算上了。本来物理运算就会产生很多多出来的图形渲染 ...


恩,这个有道理啊,我到是也觉得,现在的GPU远远没到性能过剩的地步。
作者: fevaoctwh    时间: 2008-6-25 00:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2008-6-25 00:29
原帖由 fevaoctwh 于 2008-6-25 00:02 发表
但是FPS下降幅度肯定比现在的GPU方法小。运算能力是固定的。负责了物理运算再渲染画面肯定不能和单渲染画面的FPS比
插了物理加速卡,GPU不会浪费资源在物理运算上了。本来物理运算就会产生很多多出来的图形渲染 ...


你断定使用PPU的fps下降速度比现在GPU小?
作者: fevaoctwh    时间: 2008-6-25 00:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2008-6-25 00:47
原帖由 fevaoctwh 于 2008-6-25 00:02 发表


但是FPS下降幅度肯定比现在的GPU方法小。运算能力是固定的。负责了物理运算再渲染画面肯定不能和单渲染画面的FPS比
插了物理加速卡,GPU不会浪费资源在物理运算上了。本来物理运算就会产生很多多出来的图形渲染 ...


到时候一张GTX280一张8800GT,老卡用来做物理加速,比真正最顶级的物理卡效果还好,难道没意义?
作者: Edison    时间: 2008-6-25 00:48
原帖由 fevaoctwh 于 2008-6-25 00:45 发表
简单的问题。1、用物理加速卡GPU只负责画面渲染
2、用NV的177.39或者日后的驱动,GPU要分出一部分运算能力算物理去
你告诉我哪个快?如果你告诉我2.我也没什么话好说了


理论的东西我在之前已经阐述过多次了,一会儿我会上PPU的成绩。
作者: fevaoctwh    时间: 2008-6-25 00:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2008-6-25 00:50
原帖由 fevaoctwh 于 2008-6-25 00:45 发表


简单的问题。1、用物理加速卡GPU只负责画面渲染
2、用NV的177.39或者日后的驱动,GPU要分出一部分运算能力算物理去
你告诉我哪个快?如果你告诉我2.我也没什么话好说了


很简单,GPU如果不分一部份出去,那么CPU被累死,GPU闲着不少工夫在等CPU。
GPU分一部分出去,那么这一小部分就已经超越了物理卡的性能,GPU从而剩下的部分也可以发挥出来,真正满载。

用物理卡的时候,因为物理卡本身能力有限,比CPU情况好,但仍有可能无法让GPU满载,这种情况下GPU分出去恐怕比物理卡还好。
作者: fevaoctwh    时间: 2008-6-25 00:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: fevaoctwh    时间: 2008-6-25 00:52
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2008-6-25 00:52
原帖由 fevaoctwh 于 2008-6-25 00:49 发表


这个和插物理加速卡有什么差别??!!
而且CUDA的物理加速目前还是少数派


所有的G80、G90、GT200系列的显卡都可以,哪怕是一块8600GT都可以CUDA物理加速,怎么会是少数派了?
现在买GTX280的都是手里没有一张G80架构老卡的人?
和物理加速卡的区别就是,GPU的物理加速能力远比物理卡还好。
作者: Edison    时间: 2008-6-25 00:53
原帖由 fevaoctwh 于 2008-6-25 00:51 发表
3DV别拿上来了……
挑一款能同时支持CUDA运算和物理卡的游戏。虽然我不知道有没有……

既然是在UT3的讨论串里,我当然说的是UT3。
作者: jiliaoke    时间: 2008-6-25 00:53
原帖由 Edison 于 2008-6-25 00:48 发表


理论的东西我在之前已经阐述过多次了,一会儿我会上PPU的成绩。



老大,给点物理卡相关理论的链接吧,我很想知道这个物理和画面到最后能达到一个怎样的平衡以及现在的瓶颈到底是什么?因为我印象物理单卡并不快(而且跑的还是对它特别优化的游戏(cell factor)
作者: fevaoctwh    时间: 2008-6-25 00:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: fevaoctwh    时间: 2008-6-25 00:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2008-6-25 00:55
原帖由 fevaoctwh 于 2008-6-25 00:52 发表


物理卡的运算能力我是不知道……:loveliness::loveliness::loveliness:


物理卡的理论运算能力大概只有GTX280的1/19左右,为47GFlops
所以显卡分出10%性能,就已经相当于拥有了两块物理卡,此时综合性能恐怕比单块物理卡瓶颈时的综合性能要好了吧?
根源就在这里
作者: fevaoctwh    时间: 2008-6-25 00:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2008-6-25 00:56
原帖由 fevaoctwh 于 2008-6-25 00:54 发表


UT3那地图能跑物理卡吗……残念……


当然可以,要不怎么会用来作测试?
UT3正是因为能够支持物理卡,所以才能支持CUDA物理加速的。
物理驱动是使用CUDA来让GPU仿真物理加速卡的,所以要支持CUDA物理加速的先决条件就是支持物理卡
作者: jhj9    时间: 2008-6-25 00:57
原帖由 fevaoctwh 于 2008-6-25 00:55 发表
http://www.pcinlife.com/article/graphics/2006-06-09/1149867316d160.html


看看第二页的表格:AGEIA PPU单精度浮点性能指标 46.875 GFLOPS @250MHz
GTX280浮点指标是933GFlops
作者: fevaoctwh    时间: 2008-6-25 00:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: fevaoctwh    时间: 2008-6-25 01:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2008-6-25 01:04
原帖由 fevaoctwh 于 2008-6-25 01:00 发表


看了测试……如果GPU没喂饱是可能提升……
但是本人还是认为……真正的极端环境下……为了保证FPS只有插物理卡……当然,日后可能就是86GT了……


其实就算稍微不如真正的物理卡也是可以接受的,毕竟你少花钱买了一块卡,效果差不多嘛。
总比GPU空闲,CPU累死要强一些了
作者: jiliaoke    时间: 2008-6-25 01:07
原帖由 jhj9 于 2008-6-25 00:50 发表


很简单,GPU如果不分一部份出去,那么CPU被累死,GPU闲着不少工夫在等CPU。
GPU分一部分出去,那么这一小部分就已经超越了物理卡的性能,GPU从而剩下的部分也可以发挥出来,真正满载。

用物理卡的时候,因为 ...



我大概明白jhj9的意思了,是游戏加入足够多的物理特效,CPU运算能力不够导致显卡在某个点上有个空闲状态,这时候把任务抛给显卡做运算。

不过现在问题抛给游戏制作商了,他们得在画面和物理找到一个平衡点。
作者: jhj9    时间: 2008-6-25 01:10
原帖由 jiliaoke 于 2008-6-25 01:07 发表



我大概明白jhj9的意思了,是游戏加入足够多的物理特效,CPU运算能力不够导致显卡在某个点上有个空闲状态,这时候把任务抛给显卡做运算。

不过现在问题抛给游戏制作商了,他们得在画面和物理找到一个平衡点。 ...


在使用物理卡的时候,这个找平衡点的问题本来也存在,物理卡自己的能力是个问题
而现在由于显卡本身可以平衡物理加速和显示之间的性能(一个闲的时候另一个资源自然就多了,所以能保证一直都满载,自动平衡),所以相对来说只要制作商不把总性能要求弄得太过分,其实现在发挥的余地更大,更自由了。
作者: jiliaoke    时间: 2008-6-25 01:19
原帖由 jhj9 于 2008-6-25 01:10 发表


在使用物理卡的时候,这个找平衡点的问题本来也存在,物理卡自己的能力是个问题
而现在由于显卡本身可以平衡物理加速和显示之间的性能(一个闲的时候另一个资源自然就多了,所以能保证一直都满载,自动平衡), ...


也有道理,毕竟就算没物理加速纯用CPU的时候也处在一个到底该表现多少物理特效的平衡问题,现在的效能低下应该可以认为开发商没吃透硬件性能。

总的来说以后游戏的画面在保持不变的情况下,物理特效应该可以更多而不是更少。

[ 本帖最后由 jiliaoke 于 2008-6-25 01:20 编辑 ]
作者: Edison    时间: 2008-6-25 01:31
the PPU 100:
作者: Edison    时间: 2008-6-25 01:37
i benchmaking a demo that had 16! bot(avg AI) in heatray_physx :

with PPU PhysX (without GeFoece PhysX):
Avg: 35.690 - Min: 19 - Max: 48

with GeForce PhysX (without PPU PhysX)
Avg: 38.687 - Min: 25 - Max: 55

benchmarking on 8800GTS 1920X1200 4AA 16AF, the GTX 280 almost same.

The Truth is: NVIDIA restrict the GeForce Physx‘s power for sync the running of game code(AI, logic, etc ) .
作者: Edison    时间: 2008-6-25 03:04
原帖由 akaferl 于 2008-6-25 02:25 发表
cpu添加做物理也不用nv的小p
肯定是自己的小H,看intel和amd的合作,cpu这块小H是完全独占。
不看好显卡的物理计算,显卡永远都不可能过剩的。


如果你不看好PhysX还是有点道理,但是所谓的显卡永远不可能过剩的论调本身是存在严重歧义。

1、游戏包括了人工智能、物理运算、游戏逻辑、音频计算、图形计算等模块。

2、目前的人工智能、物理运算受制于CPU而导致许多复杂的角色事件行为、物理现象无法实现。

3、你可以在CPU上实现复杂的这些角色事件行为或者物理现象,但是受制于CPU的并行处理能力,你投入的庞大并行程序开发资源所能获得的回报往往比较低(例如4倍)。

4、你可以把这些在CPU上开发并行AI、物理运算的资源投放在更强大的GPU上。

5、这时候就会出现一种现象,这类运算如果在8核CPU上实现,获得的物理效果可能顶多是双内核CPU的4x或者顶多8x,但是CPU还需要跑其他东西,所以现实中,你能在CPU作的物理效果也就是双核x4的水平,这时候就会出现4倍的效果,实际情况没有这么乐观,因为带宽、资料交换等原因,速度还是会有较大的出入。

这是>4核处理器上能实现的情况,如果玩家只有一枚双核,这时候的游戏就会明显卡在CPU上了,只能满足设计人员预想中50%的性能,高性能的显卡为此需要花费大量的时间在等待CPU递交资料。

6、但是如果开发人员面前有一个选择,透过一个跨平台的物理库能够写一段同样的代码,即可以在CPU上执行,也可以在GPU上执行,情况就会很不一样。

对于拥有高性能显卡的用户来说,可以使用价格相对较便宜,而且在日常中足够应付大多数处理双核处理器,就可以在这样的程序中获益,让GPU的资源得以充分发挥,这类复杂运算原本会让双核CPU+高性能GPU用户的GPU资源出现大量的浪费,而现在因为瓶颈消除,同样复杂的物理运算往往会获得非常可观的性能提升。

以UT3为例,加重物理运算的地图中,消耗的GPU运算能力与与之获得的性能提升是完全值得的,而且从测试成绩看,即使是8800GTS也是有相当部分的GPU资源在这类测试中未被释放,GPU或者说异架构物理计算大有可为,也是物理加速上重要方向。

7、如果用户觉得显卡的性能不够用,此时游戏的瓶颈极大可能不在物理运算上而是在图形运算,这个时候首选的是升级显卡,这类用户一般是拿着片整合主板或者是8600级别等上一代的中低阶显卡。

8、Crysis这类游戏主要卡在图形计算上,自然没必要把物理加速放在GPU上,能达到如此极致的游戏目前也就一个。AGEIA的硬件加速主要对瓶颈不在显卡而是在物理特别是有复杂物理运算的游戏,这类游戏现成的有15个。
作者: pelen9988    时间: 2008-6-25 03:31
原帖由 Edison 于 2008-6-25 01:37 发表
i benchmaking a demo that had 16! bot(avg AI) in heatray_physx :

with PPU PhysX (without GeFoece PhysX):
Avg: 35.690 - Min: 19 - Max: 48

with GeForce PhysX (without PPU PhysX)
Avg: 38.687 - Mi ...


还是 El老大的测试比较实在~~口水战累~~~事实证明CUDA物理比 PPU物理目前来说还稍微实用点性能也稍微猛一点点~~:p

我很看好物理~~~
作者: jackpeng33    时间: 2008-6-25 07:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: kamuiyay    时间: 2008-6-25 08:38
提示: 作者被禁止或删除 内容自动屏蔽
作者: lazybat    时间: 2008-6-25 11:07
提示: 作者被禁止或删除 内容自动屏蔽
作者: roadrunner    时间: 2008-6-25 12:03
高性能显卡等待CPU提交资料这个情况很难发生啊

现在CPU瓶颈的游戏可不多.
作者: fevaoctwh    时间: 2008-6-25 12:03
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4