POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
123
返回列表 发新帖
楼主: shu0202
打印 上一主题 下一主题

我来告你真正的物理加速

[复制链接]
41#
发表于 2008-8-14 20:09 | 只看该作者
原帖由 shu0202 于 2008-8-14 20:04 发表
应该不完全是GPU等待CPU物理运算部分造成的速度损失,当初PPU运算也同样会大幅度降低游戏速度。也许是PhysX的模型造成频繁的数据交换造成的。完全的硬件物理加速应该不会对图形渲染部分造成性能影响。


你是把 PPU+复杂效果的场景和 CPU+简单效果的场景比较后得出 PPU 拖慢速度的结论?
回复 支持 反对

使用道具 举报

42#
发表于 2008-8-14 20:16 | 只看该作者
原帖由 Edison 于 2008-8-14 19:45 发表


以 gt200 为例,它的每个 core 最多可以有 32 个 warp,每个 warp 有 32 个 thread ,这就是 1024 个thread per core,理论上可以掩藏 200+ 个周期的内存存取时间,而 ROP 完成 一个 32-bit (RGBA8) 的 4x MSAA  ...


谢谢指教……
回复 支持 反对

使用道具 举报

43#
 楼主| 发表于 2008-8-14 20:23 | 只看该作者

回复 46# Edison 的帖子

对比尖峰战士开启PPU后增加了爆炸后的碎片效果和表面脱落效果,这些效果甚至对3年前的支持SM3.0的硬件都不是什么头疼的事。事实上你在游戏中不碰任何东西开启PPU都会造成帧速下降,这不能作为区分复杂效果场景和简单效果场景的令人信服的依据。
回复 支持 反对

使用道具 举报

distance 该用户已被删除
44#
发表于 2008-8-14 20:27 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
45#
发表于 2008-8-14 20:37 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

distance 该用户已被删除
46#
发表于 2008-8-14 20:51 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

distance 该用户已被删除
47#
发表于 2008-8-14 20:59 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

distance 该用户已被删除
48#
发表于 2008-8-14 21:15 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

49#
发表于 2008-8-14 21:54 | 只看该作者
原帖由 shu0202 于 2008-8-14 20:23 发表
对比尖峰战士开启PPU后增加了爆炸后的碎片效果和表面脱落效果,这些效果甚至对3年前的支持SM3.0的硬件都不是什么头疼的事。事实上你在游戏中不碰任何东西开启PPU都会造成帧速下降,这不能作为区分复杂效果场景和简单效果场景的令人信服的依据。


在使用 PPU 的情况下, 程序员可能会设定一个物理运算的更新频率以确保场景中的物理效果、动画、键盘/鼠标动作响应保持一致,在初期的 PhysX 游戏中,这个更新频率会设置的比较低,此时就会出现即使没有复杂特效出现也会有速度下降的现象。

我记得更新 physx 驱动后,GRAW 的 fps 是有所提升的。

物理运算现在都是用省略的模型作计算,例如一个 10 万三角面的模型,实际用于物理计算的简化模型的 box 可能只有 1 百个不到,就当成是 800 个顶点好了, PCI 的带宽有 133MB/s,足够确保 10 万个顶点 30 fps 的传输,在物理运算的时候,以目前的规模看,总线带宽根本不是瓶颈,更何况现在的 PCIE 带宽有 4GB/s 以上。
回复 支持 反对

使用道具 举报

Bohr 该用户已被删除
50#
发表于 2008-8-14 22:06 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

51#
发表于 2008-8-14 22:40 | 只看该作者
原帖由 distance 于 2008/8/14 20:51 发表

不要静态的来看问题,游戏是在不断推陈出新的,也许几个月后比crisis要求还高的游戏就出来了。gpu再发展,总有那么几款游戏让它跑起来吃力,这些硬件杀手也总是受到发烧友的追捧。换言之,gpu再快你也不能说它有富 ...


不是静态看问题,对于显卡的发展,我是这样看的:
1、总体来看,到现在为止显卡的硬件发展速度快于游戏的速度。想想当年的Voodoo到现在的G200,分辨率提升了,效果丰富了,纹理、模型更真实了,但是FPS还是上去了。
2、在很长一段时间内,1920X1200会是一个极限分辨率,因为30“以上的显示器对于桌面应用来说已经偏大了,26~27应该是不需要做颈部运动的一个合理尺寸。而对于28以下的显示器来说,提升分辨率的意义不是很大,除非显示技术有重大的革新,但现在看到的资讯,似乎LCD/LED还会占很长一段时间。
3、画质和效果固然还可以进一步提高,不过相对于物理计算带来的效果,个人认为后者给用户带来的体验更好一点。稍微损失点画质去获得物理效果,个人觉得还是值得的。
4、当然,除了物理计算,还有一个也非常值得期待的特效:光线跟踪。但这个似乎对运算能力的要求更变态,至于如何取舍和发展,我想这是游戏厂商的事情了,但不管如何平衡,绝大部分的游戏厂商还是会让高端显卡的用户获得一个可接受的游戏性能的。

4~5倍是根据现在CPU和GPU的理论浮点计算能力计算的,这还算是非常保守的数据了,事实上CPU能用于物理计算的资源很有限,另外相对于GPU,CPU的实际浮点运算能力和理论值得差距比GPU大得多。NV给出的数据是14倍。

[ 本帖最后由 harleylg 于 2008-8-14 22:49 编辑 ]
回复 支持 反对

使用道具 举报

52#
发表于 2008-8-15 01:27 | 只看该作者
原帖由 Edison 于 2008-8-14 19:45 发表


以 gt200 为例,它的每个 core 最多可以有 32 个 warp,每个 warp 有 32 个 thread ,这就是 1024 个thread per core,理论上可以掩藏 200+ 个周期的内存存取时间,而 ROP 完成 一个 32-bit (RGBA8) 的 4x MSAA  ...



以E版的理论来说。。。。。N卡想拼A卡的话。。。永远只有显存容量更大些才有希望了。。。:shifty:
回复 支持 反对

使用道具 举报

53#
发表于 2008-8-15 01:29 | 只看该作者
原帖由 msmme 于 2008-8-15 01:27 发表
以E版的理论来说。。。。。N卡想拼A卡的话。。。永远只有显存容量更大些才有希望了。。。:shifty:

我没这样的理论,不要把你的所有想法都往我这里栽,承受不了,这里讨论的是物理运算,因此也请不要尝试转移话题,你可以就你提出的其他问题另行开新的主题。
回复 支持 反对

使用道具 举报

distance 该用户已被删除
54#
发表于 2008-8-15 02:05 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

55#
发表于 2008-8-15 02:07 | 只看该作者
原帖由 distance 于 2008-8-15 02:05 发表

显卡的硬件发展速度如果快于游戏发展速度,就意味着玩家不用升级硬件了,也就意味着新硬件没人买了,这是硬件厂商不能容忍的。“显卡的硬件发展速度快于游戏”这种现象会出现,但只会阶段性的短暂出现。好莱坞电影 ...




你这个话对头。。。。。硬件永远只有更新,而无够用。。。赞。。{happy:]
回复 支持 反对

使用道具 举报

56#
 楼主| 发表于 2008-8-15 09:33 | 只看该作者

回复 54# Edison 的帖子

老大比我理解深刻多了!可是如果物理运算只用简化模型,比如老大提到的800个顶点,用CPU运算也绰绰有余了,GPU的物理加速不是多此一举么?并且为什么这点运算量再CPU上跑还是很费力?
回复 支持 反对

使用道具 举报

fifalan 该用户已被删除
57#
发表于 2008-8-15 11:40 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

58#
发表于 2008-8-15 14:13 | 只看该作者
原帖由 lzy651 于 2008-8-14 17:15 发表
迟早物理加速卡会重新复活出来的!~~
不会是CPU,不会是GPU,他们都不时最适合的
物理加速卡如果有 nv和INTEL的那个集成规模,那甩这两家几条马路是肯定的事

就看谁能握到广泛支持的标准,物理加速卡就由谁演变


物理卡还能复活?
CPU确实不适合,因为他更像是一种控制密集型的处理器,另外晶体管大量消耗在CACHE上,
GPU把大量的晶体管应用在(ALU)上,并行化和可编程性提高后更像是流处理器,当然适合大规模的数值计算。
以后肯定是GPU负责物理加速的趋势,只不过还需要时间。
回复 支持 反对

使用道具 举报

59#
发表于 2008-8-15 15:59 | 只看该作者
Pentium 以后的 x86 主流桌面处理器都是超标量流水线的,Cyrix 6X86 后的主流桌面 x86 处理器都是具备OoOE,Pentium 4 还有 SMT 支持和 SSE2 支持,因此说 CPU 是串行执行是完全不正确的。

GPU 的 ISA 一点都不比 CPU 简单甚至更复杂,具体的可以看看 R600ISA.pdf,光是 shader 的算术指令就远远不止于加减乘,其除法是倒数实现。

顶点规模和运算规模并不能简单地直接挂钩,关键是物理运算基本上就是碰撞侦测这样的运算以及一大堆为了确保运算结果可以达到预期效果的封装功能。
回复 支持 反对

使用道具 举报

60#
发表于 2008-8-15 20:56 | 只看该作者
原帖由 distance 于 2008/8/15 02:05 发表

显卡的硬件发展速度如果快于游戏发展速度,就意味着玩家不用升级硬件了,也就意味着新硬件没人买了,这是硬件厂商不能容忍的。“显卡的硬件发展速度快于游戏”这种现象会出现,但只会阶段性的短暂出现。好莱坞电影 ...


你说的没错,不过问题是物理计算、光线跟踪就是很好的消耗显卡计算资源、提示游戏画面真实感的途径。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-3-6 22:56

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表