POPPUR爱换

标题: 我来告你真正的物理加速 [打印本页]

作者: shu0202    时间: 2008-8-14 14:39
标题: 我来告你真正的物理加速
       现在的物理加速有两大板块:PhysX和Havok。PhysX是基于专门的物理加速硬件的物理运算引擎,Havok是利用CPU软加速的物理引擎。到底哪个引擎效果更好更有前途?这正是大家关注的话题。
       PhysX提出的背景是CPU运算能力无法满足大规模的物理运算的需求。专门的物理加速硬件能够提供比当时最强大的CPU高20倍以上的物理运算能力,这能够让以往预先渲染表现物理特性的动画实时的运算实现。不仅如此,过去根本不可能完成的实时环境互动、布料效果、流体效果、不规则和细小物体的碰撞检测、弹性运动、海量粒子运动都有望实时完成。可以说硬件物理加速对数字互动领域绝对是革命性的设想。nVIDIA接手PhysX为硬件物理运算提供了强劲的发展动力,因为GPU模型能够提供强大得多的物理运算效能。当初ATi也在GPU物理加速特别是碰撞检测模式上有丰硕的研究成果,并且也是支持PhysX的。可惜后来世事难料。
       PhysX现阶段主要用于游戏中的爆炸碎片和物理环境的破坏效果,表现大量物体的碰撞受力运动,应用范围还非常狭窄。另外加载硬件运算物理模式和环境物体破坏产生大量的碎片在现有的图形渲染模式下会对系统造成过重的负担,大大降低游戏的流畅度。许多高级物理效果还未进入实用化就已经让系统不堪重负无疑是PhysX推广的重大障碍,而这样的问题只能期待具有更强大的性能和更强大的可编程硬件的出现。NV会如何推广PhysX标准不得而知,但是让GPU同时进行图形渲染和物理运算并不是个好主意,效率上难以让人满意。另外如果只有NV的GPU支持PhysX的硬件加速,对多数游戏厂商来说就缺乏吸引力。如今微软已经取得Havok的永久使用权,这对PhysX来说不是好事情。得不到微软的支持,PhysX前景不太被看好。PhysX同样支持CPU加速,NV不应该只执著于对GPU加速的推广。

       Havok伴随着HL2的物理宣传声名鹊起,特别是布娃娃系统让人津津乐道。不过我更欣赏英雄连当中Havok的表现,完全的环境互动给人非常震撼的感受,相反PhysX并没有哪部作品给人留下多少深刻的印象。PhysX没有表现出硬件加速相对于Havok的CPU运算效果上显著的优势,Havok的优势则在于只要有主流的CPU就能够流畅运行,加上优秀的表现效果得到了越来越多的游戏开发商的支持。如今多核心CPU大行其道,CPU物理加速获得了空前的发展机遇。有Intel和微软的全面支持,Havok前景一片光明。Havok在Intel手中必然会向硬件加速拓展,微软未来的DirectX也必然要加入硬件物理加速功能。Intel和AMD都能够以混合CPU或者混和GPU的方式实现Havok物理硬件加速,不过这取决于Intel在硬件上的进展,乐观估计也要在两年后才能实现。在此期间,PhysX才有取胜对手的机会。NV是否能拉拢AMD全面支持PhysX硬件加速并且实现Havok无法实现的震撼效果是杀出困境的关键。
       暴雪的星际2和暗黑3都加入了对Havok的支持。不过星际2的支持相当有限,这是为了避免操作中不可控的意外出现,这和Relic对Havok的全面支持不可同日而语。暗黑3对Havok的支持相当出色,因此这两款游戏没有必要再加入对AMD硬件的物理加速的专门支持,AMD也没有正式表示通过GPU支持Havok的硬件物理加速。Intel恐怕也不会支持AMD先于自己提供Havok硬件物理加速。

作者: julian110    时间: 2008-8-14 14:50
PhysX同样支持CPU加速,NV不应该只执著于对GPU加速的推广。

NV只能执着于GPU加速,因为它没有CPU,过于支持CPU的话,自寻死路。
作者: gz_easy    时间: 2008-8-14 14:52
不少人可能将PhysX和Havok看成PC组件选择依据:NV GPU + Intel CPU还是AMD GPU + Intel CPU抑或AMD GPU + AMD CPU,也许Intel GPU + Intel CPU甚至Intel GPU + AMD CPU? (后2者比较遥远)
作者: shu0202    时间: 2008-8-14 14:57
原帖由 julian110 于 2008-8-14 14:50 发表

NV只能执着于GPU加速,因为它没有CPU,过于支持CPU的话,自寻死路。


NV只能选择共赢,现阶段CPU加速比GPU加速有更广泛的适用性。所有采用PhysX的游戏如果既能在CPU上运行,也能在NV和AMD的GPU上硬件加速,并且提供比Havok更强大的物理效果和流畅度,PhysX才能有吸引力。
作者: harleylg    时间: 2008-8-14 15:08
1、NV并没有推广GPU加速PhysX,而是通过GPU支持而提升PhysX的性能。只是在AMD实现GPU加速PhysX之前,对于游戏开发商来说,如果支持PhysX的话,需要考虑显卡的型号和加速能力来制定PhysX的应用细节,距离来说同样的爆炸场面,AMD显卡没有碎片,9300 100个碎片,9800 400个碎片,GTX280 800个碎片。

2、Havok只是一个API,如何实现有很多方式,CPU实现可以,GPU实现可以,如果创新愿意的话,用X-Fi的运算芯片实现也可以。06年的时候NV和ATi都已经计划用GPU实现Havok了,也就是Havok FX,只是因为Intel收购了Havok,这件事就不了了之了。也许Larabee出来之后,Intel会重新提出GPU加速Havok。

3、Havok不是主流CPU就能流畅运行,而是因为现在PC上只能CPU实现Havok,所以为了游戏流畅,游戏厂家会限制物理效果的使用。如果所有的显卡都能加速Havok的话,我想就现在的显卡和游戏水平,游戏厂商不会介意分配20%左右的显卡性能去实现物理计算,在高端平台上,物理效果起码能高2~3倍。
作者: harleylg    时间: 2008-8-14 15:42
原帖由 mousefire 于 2008/8/14 15:28 发表


20%的显示性能换来的物理效果是否值得是个问题哦,在目前的显卡性能水平下,给你两个选择:
1. CPU提供的基本的物理加速+AA
2. GPU提供更好的物理加速+无AA
你会做出什么样的结论?而且UT3的物理加速版地图已 ...


1、AA是肯定要的,不过个人觉得4xAA就够了……
2、在大部分的游戏里面,R700已经可以提供Full HD,4xAA之后还非常流畅的性能。就UT3来说,非物理地图跑120FPS很轻松,如果按照60FPS算流畅的话,完全可以拿一个GPU来做物理计算。至于一个RV770的GPU跟CPU相比,运算能力提升4~5倍很轻松。至于4~5倍的运算能力能实现怎样的物理效果,那就再说了。
3、不要说9500GT物理加速没意义,第一95GT可以作为单独的PPU,第二,物理加速本来就是锦上添花,提升画质的东西,很长一段时间内低端用户享受不到也很正常。难道3850的用户就可以H下面跑Crysis么?
作者: kaede    时间: 2008-8-14 15:43
关键是havok的软件比physX强不少.
作者: evilviper    时间: 2008-8-14 15:53
主要是现阶段运行很多游戏时候显卡分不出余力去进行物理加速运算,否则免费提升游戏体验谁不喜欢
作者: Edison    时间: 2008-8-14 16:01
现在的 GPU PhysX 就提供更好的物理加速+4AA,AA 运算对物理运算几乎没有影响。

"GPU提供更好的物理加速+无AA" 的说法误导性质居多。
作者: indiana    时间: 2008-8-14 16:17
前两天加班看同事玩“三国志”,觉得大将被砍死从马上掉下来的姿势有喜感,,,,掉地上还能弹起一下的,大刀也飞得好看
作者: VGASOS    时间: 2008-8-14 16:35
希望NV能做到使用NV或AMD或INTEL的顯示卡再加上一張NV的顯卡當PPU
這樣應該是一個不錯的選擇
作者: zhangmeng    时间: 2008-8-14 16:40
不知所云,等他们搞出东西来并且足够便宜的话我就尝试一下,否则无视
作者: qinwei111    时间: 2008-8-14 16:43
现在的 GPU PhysX 就提供更好的物理加速+4AA,AA 运算对物理运算几乎没有影响???

不是会降帧吗?
作者: Prescott    时间: 2008-8-14 16:53
天下大事,分久必合,合久必分,CPU/GPU已经分开的太久了 {lol:]
作者: harleylg    时间: 2008-8-14 16:56
原帖由 mousefire 于 2008/8/14 15:46 发表


4XAA完了主流显卡还有多少余力来弄物理计算?UT3的物理地图可是让GTX280都很囧


个人认为很长一段时间内物理效果都是高端用户的专利,个人认为在主流显卡能做到Full HD+4xAA@60FPS之前,没几个人会开物理……
这个应该没什么争议,所以N饭不用太高兴,A饭也不用失望……

[ 本帖最后由 harleylg 于 2008-8-14 17:11 编辑 ]
作者: harleylg    时间: 2008-8-14 16:59
原帖由 kaede 于 2008/8/14 15:43 发表
关键是havok的软件比physX强不少.


NV收购了PhysX之后也没怎么推了,但现在NV爆发,加上NV的现有份额,还有NV和游戏厂商的关系,开发中的游戏拉过去支持PhysX也不是不可能,就算已经有的,也没准会推出PhysX补丁……不过这都属于没影的事,还是耐心等待为上……
作者: Edison    时间: 2008-8-14 17:02
原帖由 qinwei111 于 2008-8-14 16:43 发表
现在的 GPU PhysX 就提供更好的物理加速+4AA,AA 运算对物理运算几乎没有影响???
不是会降帧吗?


GPU 物理运算都是用 shader 来跑,而 AA 求解是 ROP 来跑的,瓶颈在 shader 的情况下 ROP 的 AA 性能损耗看起来就是相当低。
作者: harleylg    时间: 2008-8-14 17:12
原帖由 Edison 于 2008/8/14 17:02 发表


GPU 物理运算都是用 shader 来跑,而 AA 求解是 ROP 来跑的,瓶颈在 shader 的情况下 ROP 的 AA 性能损耗看起来就是相当低。


这个保留意见,没有看到这样的测试……偶手上也木有N卡了……
作者: librae    时间: 2008-8-14 17:17
NV现在很有自闭门户的趋势啊:devil:
作者: julian110    时间: 2008-8-14 17:20
非也非也,NV现在敞开大门让AMD进,人家不进啊,MS也不进啊。。。
作者: Edison    时间: 2008-8-14 17:34
原帖由 lzy651 于 2008-8-14 17:15 发表
迟早物理加速卡会重新复活出来的!~~
不会是CPU,不会是GPU,他们都不时最适合的
物理加速卡如果有 nv和INTEL的那个集成规模,那甩这两家几条马路是肯定的事
就看谁能握到广泛支持的标准,物理加速卡就由谁演变


我认为以后不会有专用的物理加速卡, 这是先有鸡还是先有蛋的问题, PPU 的占用率太低,直接影响了它的支持度,而现在被收购后,已经有了数以亿计的 CUDA 产品能够实现相应的硬件支持,除此以外,PhysX也能在数以亿计的双核、多核处理器上提供直接的运行支持,现在再有人弄专用的物理加速卡无疑是傻瓜一个。
作者: Edison    时间: 2008-8-14 17:36
原帖由 mousefire 于 2008-8-14 17:33 发表
AA 只与 ROP 有关吗?那为什么 ROP 数相同的 9800GTX 和 HD4850 的AA性能相关甚远?


那是因为 G92 的 ROP 不够 RV770 强大而不是数量上的问题,就好像 R600 的 ROP 也是 16 个,但是 AA 性能远不如前者。
作者: julian110    时间: 2008-8-14 17:53
原帖由 Edison 于 2008-8-14 17:02 发表


GPU 物理运算都是用 shader 来跑,而 AA 求解是 ROP 来跑的,瓶颈在 shader 的情况下 ROP 的 AA 性能损耗看起来就是相当低。

SO 在D10下的统一shader都是基本不空闲的,也就是说NV挤压了GPU处理顶点、像素、几何图形等所需要的能力,来处理物理效果?而把这些东西交还给了CPU来做?这也许能解释为什么跑NV的NVIDIA PhysX Particle Fluid Demo时,CPU占用居高不下的原因了。
作者: eviano    时间: 2008-8-14 18:02
反正现在的局面是I/N或者AN的平台可以用PhysX和Havok两种玩法,AA平台就只能Havok而已。相信THE WAY会加入很多PhysX的,AFANS一边酸去吧
作者: YY小熊猫    时间: 2008-8-14 18:05
CPU占用率偏高,不知道为什么要通过死循环的同步方式检测计算结果。
作者: Edison    时间: 2008-8-14 18:12
原帖由 julian110 于 2008-8-14 17:53 发表
SO 在D10下的统一shader都是基本不空闲的,也就是说NV挤压了GPU处理顶点、像素、几何图形等所需要的能力,来处理物理效果?而把这些东西交还给了CPU来做?这也许能解释为什么跑NV的NVIDIA PhysX Particle Fluid Demo时,CPU占用居高不下的原因了。


不是这样的。

统一架构是指 vs/gs/ps 的 ISA 都是一样的,因此这三类 shader 都可以在同样的 shader 单元上执行,透过硬件调度器实现 VS/GS/PS 的资源分配。

在高复杂度物理计算下,如果完全是 CPU 来完成,那么原本开发人员预计 16ms (相当于 60fps 左右)的图形/物理计算更新频率就可能变成物理运算+其他运算需要花费 100ms(10fps),而游戏场景的图形渲染依然是 16ms,由于物理运算成为瓶颈,反映出来的游戏速度实际上就是 10fps。

GPU 在这样的情况下有 84% 的时间在等待 CPU 完成物理运算。

如果有其他加速加速器协作或者使用中高端的 GPU 进行物理加速,情况就会有所不同。

以 GeForce PhysX 为例,因为是基于 CPU+GPU 的 CUDA 异构运算体系,虽然部分难以并行化的运算依然会保留在 CPU 上,但是 GPU 可以分担其中可以并行化的物理计算,此时 CPU 跑物理以及其他运算需要花费的时间可能就是 25ms(40fps) 或者更少。而 GPU 此时把原来用于等待 CPU 的 84% 的部分(例如 20%)运算资源用在物理加速就能达成吻合 CPU 25ms 运算时间的更新频率上,仍然可以有 64% 的资源用于图形运算上,于是速度可以达到 40fps。

由于剩余的图形资源依然较多,因此像 UT3 PhysX Mod, 9800GTX 使用 GeForce PhysX 依然可以在 1920x1200 4AA+16AF 的情况下达到 38FPS 的速度。

GeForce PhysX 是异构运算,是 CPU+GPU 共同达成的,而不是像 PPU 那样完全针对物理设计的 ASIC ,CPU 占用率高一点并不奇怪,而且那个 demo 是一个物理运算极高的场景,在许多现实游戏中,并不常见,当然游戏开发上还是可以在这样的环境下做一些东西出来的。
作者: julian110    时间: 2008-8-14 18:23
恩,thanks。
不过你所说的这些是基于PX的复杂“粒子”物理运动下成立的。
对于Havok所擅长的场景物理互动来说也就未必了。当然Havok也做了一定的缩减
作者: Edison    时间: 2008-8-14 18:32
PhysX 的物理不仅仅是 eye-candy 的粒子变化效果,也包括了墙壁碎裂等直接影响 gameplay 的物理效果:

http://www.nvidia.com/object/physx_faq.html

Currently, most of the action is limited to pre-scripted or ‘canned' animations triggered by in-game events like a gun shot striking a wall. Even the most powerful weapons can leave little more than a smudge on the thinnest of walls; and every opponent you take out, falls in the same pre-determined fashion. Players are left with a game that looks fine, but is missing the sense of realism necessary to make the experience truly immersive.

http://developer.nvidia.com/object/physx_features.html


从实现的效果上,PhysX 和 Havok 不会有什什么差别,差别在于能用到什么程度,在 CPU-only 的情况下,它们是一样的,但是如果是有其他处理器加速的话,具备加速的一方可以有更多的资源来实现更复杂的效果。

NVIDIA 现在有一个叫 APEX 的东西,能够做到动态的判断资源富裕度而决定效果的复杂度。
作者: gz_easy    时间: 2008-8-14 18:48
取决于ISV想把PhysX利用到何种程度。
作者: julian110    时间: 2008-8-14 18:50
以 GeForce PhysX 为例,因为是基于 CPU+GPU 的 CUDA 异构运算体系,虽然部分难以并行化的运算依然会保留在 CPU 上,但是 GPU 可以分担其中可以并行化的物理计算,此时 CPU 跑物理以及其他运算需要花费的时间可能就是 25ms(40fps) 或者更少。而 GPU 此时把原来用于等待 CPU 的 84% 的部分(例如 20%)运算资源用在物理加速就能达成吻合 CPU 25ms 运算时间的更新频率上,仍然可以有 64% 的资源用于图形运算上,于是速度可以达到 40fps

。。。我又看了次,我们来个推理。
使用CUDA 异构运算体系,导致——>部分难以并行化的运算依然会保留在CPU上,导致——>CPU 跑物理以及其他运算需要花费的时间,导致——>GPU等待CPU,导致——>GPU有空闲时间把运算资源用在物理加速,并且最后仅有64%的资源用于图形运算。
可见并不是GPU一定要等待CPU,只是CUDA体系要求CPU加强运算导致的一系列后果。
还有个疑问,貌似Physx也并不能完全使用CPU的时间,一个DEMO连4核都用不了,如果用上4核,GPU哪儿来的时间等待CPU?哪儿来的空闲时间计算物理?
作者: Edison    时间: 2008-8-14 18:59
64% 是指原来剩余 84% 的资源中的部分,加上之前的16%,那就是 80% 的资源可以用于图形运算,而 20% 用于物理计算。

GPU 等待 CPU ,是复杂物理计算或者其他通用计算导致的后果,而不是 CUDA 导致的,CUDA PhysX 的引入是为了释放被闲置的资源。

这就好像在 GPU 问世以前,图形几何处理大部分是 CPU 完成,后来有 GPU 的引入, T&L以及可编程几何运算都能在 GPU 上实现,结果这时候有人跑出来说,我用 CPU 跑这些运算慢,是由于 GPU 实现了这个运算加速而导致我纯粹用 CPU 跑变得很慢的结果。

PhysX 现在已经是支持多核的,但是物理运算本身不是所有的运算都能实现并行化,并行化无法实现的部分运算也就无法充分使用所有的内核。
作者: westlee    时间: 2008-8-14 19:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2008-8-14 19:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2008-8-14 19:12
原帖由 westlee 于 2008-8-14 19:08 发表
无法并行化的那部分是不是在多核cpu上的表现也不佳?不能充分利用cpu的运算资源?


对,物理计算是有一定的相依性,不过这部分剩余的资源可以用于 AI 、game code、audio 等部分的计算上。
作者: julian110    时间: 2008-8-14 19:32
按你这么说,HAVOK的物理就没有难以并行化的部分了?
如果HAVOK也存在难以并行化的部分,而又没有使用GPU处理可以并行的部分,都由CPU处理,那么GPU所等待的时间更多,那么现在运行HAVOK游戏的GPU岂不是都很闲?

[ 本帖最后由 julian110 于 2008-8-14 19:34 编辑 ]
作者: Edison    时间: 2008-8-14 19:37
原帖由 julian110 于 2008-8-14 19:32 发表
按你这么说,HAVOK的物理就无法在难以并行话的部分了?
如果HAVOK也存在难以并行化的部分,而又没有使用GPU处理可以并行的部分,都由CPU处理,那么GPU所剩余的时间更多,那么现在运行HAVOK游戏的GPU岂不是都很闲?


为了迁就 CPU 的性能,开发商在物理效果上作降低处理就可以了,这就好像 GPU 问世以前依然有不少实时 3D 游戏一样。

以后 Larrabee 问世后,Havok 也许可以在 Larrabee 上实现以 same ISA heterogeneous 的方式实现物理运算加速,但是这样的加速对于现有的 Havok 游戏来说应该意义不是很大。
作者: itany    时间: 2008-8-14 19:38
原帖由 Edison 于 2008-8-14 17:02 发表

GPU 物理运算都是用 shader 来跑,而 AA 求解是 ROP 来跑的,瓶颈在 shader 的情况下 ROP 的 AA 性能损耗看起来就是相当低。


这个提法貌似存在争议啊
作者: Edison    时间: 2008-8-14 19:45
原帖由 itany 于 2008-8-14 19:38 发表
这个提法貌似存在争议啊


以 gt200 为例,它的每个 core 最多可以有 32 个 warp,每个 warp 有 32 个 thread ,这就是 1024 个thread per core,理论上可以掩藏 200+ 个周期的内存存取时间,而 ROP 完成 一个 32-bit (RGBA8) 的 4x MSAA 像素只需要一个周期,假设 color buffer compression 完全不起效,也只需要占用 128-bit per pixel 的 color 带宽,如果 color buffer compression 起效,那就是占用 32-bit per pixel 的 color 带宽,对于一个 512-bit 总线的处理器来说,只要 shader 占用率是满满的, ROP 的 MSAA 性能损失是相当低的。
作者: boris_lee    时间: 2008-8-14 19:51
这帖子不错,纯技术讨论,没有口水
楼主及后面一些人的“CPU软加速”这个提法不妥,如果说利用cpu的特殊指令集加速还是可以的
作者: shu0202    时间: 2008-8-14 20:04
应该不完全是GPU等待CPU物理运算部分造成的速度损失,当初PPU运算也同样会大幅度降低游戏速度。也许是PhysX的模型造成频繁的数据交换造成的。完全的硬件物理加速应该不会对图形渲染部分造成性能影响。
作者: Edison    时间: 2008-8-14 20:09
原帖由 shu0202 于 2008-8-14 20:04 发表
应该不完全是GPU等待CPU物理运算部分造成的速度损失,当初PPU运算也同样会大幅度降低游戏速度。也许是PhysX的模型造成频繁的数据交换造成的。完全的硬件物理加速应该不会对图形渲染部分造成性能影响。


你是把 PPU+复杂效果的场景和 CPU+简单效果的场景比较后得出 PPU 拖慢速度的结论?
作者: itany    时间: 2008-8-14 20:16
原帖由 Edison 于 2008-8-14 19:45 发表


以 gt200 为例,它的每个 core 最多可以有 32 个 warp,每个 warp 有 32 个 thread ,这就是 1024 个thread per core,理论上可以掩藏 200+ 个周期的内存存取时间,而 ROP 完成 一个 32-bit (RGBA8) 的 4x MSAA  ...


谢谢指教……
作者: shu0202    时间: 2008-8-14 20:23
标题: 回复 46# Edison 的帖子
对比尖峰战士开启PPU后增加了爆炸后的碎片效果和表面脱落效果,这些效果甚至对3年前的支持SM3.0的硬件都不是什么头疼的事。事实上你在游戏中不碰任何东西开启PPU都会造成帧速下降,这不能作为区分复杂效果场景和简单效果场景的令人信服的依据。
作者: distance    时间: 2008-8-14 20:27
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2008-8-14 20:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: distance    时间: 2008-8-14 20:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: distance    时间: 2008-8-14 20:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: distance    时间: 2008-8-14 21:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2008-8-14 21:54
原帖由 shu0202 于 2008-8-14 20:23 发表
对比尖峰战士开启PPU后增加了爆炸后的碎片效果和表面脱落效果,这些效果甚至对3年前的支持SM3.0的硬件都不是什么头疼的事。事实上你在游戏中不碰任何东西开启PPU都会造成帧速下降,这不能作为区分复杂效果场景和简单效果场景的令人信服的依据。


在使用 PPU 的情况下, 程序员可能会设定一个物理运算的更新频率以确保场景中的物理效果、动画、键盘/鼠标动作响应保持一致,在初期的 PhysX 游戏中,这个更新频率会设置的比较低,此时就会出现即使没有复杂特效出现也会有速度下降的现象。

我记得更新 physx 驱动后,GRAW 的 fps 是有所提升的。

物理运算现在都是用省略的模型作计算,例如一个 10 万三角面的模型,实际用于物理计算的简化模型的 box 可能只有 1 百个不到,就当成是 800 个顶点好了, PCI 的带宽有 133MB/s,足够确保 10 万个顶点 30 fps 的传输,在物理运算的时候,以目前的规模看,总线带宽根本不是瓶颈,更何况现在的 PCIE 带宽有 4GB/s 以上。
作者: Bohr    时间: 2008-8-14 22:06
提示: 作者被禁止或删除 内容自动屏蔽
作者: harleylg    时间: 2008-8-14 22:40
原帖由 distance 于 2008/8/14 20:51 发表

不要静态的来看问题,游戏是在不断推陈出新的,也许几个月后比crisis要求还高的游戏就出来了。gpu再发展,总有那么几款游戏让它跑起来吃力,这些硬件杀手也总是受到发烧友的追捧。换言之,gpu再快你也不能说它有富 ...


不是静态看问题,对于显卡的发展,我是这样看的:
1、总体来看,到现在为止显卡的硬件发展速度快于游戏的速度。想想当年的Voodoo到现在的G200,分辨率提升了,效果丰富了,纹理、模型更真实了,但是FPS还是上去了。
2、在很长一段时间内,1920X1200会是一个极限分辨率,因为30“以上的显示器对于桌面应用来说已经偏大了,26~27应该是不需要做颈部运动的一个合理尺寸。而对于28以下的显示器来说,提升分辨率的意义不是很大,除非显示技术有重大的革新,但现在看到的资讯,似乎LCD/LED还会占很长一段时间。
3、画质和效果固然还可以进一步提高,不过相对于物理计算带来的效果,个人认为后者给用户带来的体验更好一点。稍微损失点画质去获得物理效果,个人觉得还是值得的。
4、当然,除了物理计算,还有一个也非常值得期待的特效:光线跟踪。但这个似乎对运算能力的要求更变态,至于如何取舍和发展,我想这是游戏厂商的事情了,但不管如何平衡,绝大部分的游戏厂商还是会让高端显卡的用户获得一个可接受的游戏性能的。

4~5倍是根据现在CPU和GPU的理论浮点计算能力计算的,这还算是非常保守的数据了,事实上CPU能用于物理计算的资源很有限,另外相对于GPU,CPU的实际浮点运算能力和理论值得差距比GPU大得多。NV给出的数据是14倍。

[ 本帖最后由 harleylg 于 2008-8-14 22:49 编辑 ]
作者: msmme    时间: 2008-8-15 01:27
原帖由 Edison 于 2008-8-14 19:45 发表


以 gt200 为例,它的每个 core 最多可以有 32 个 warp,每个 warp 有 32 个 thread ,这就是 1024 个thread per core,理论上可以掩藏 200+ 个周期的内存存取时间,而 ROP 完成 一个 32-bit (RGBA8) 的 4x MSAA  ...



以E版的理论来说。。。。。N卡想拼A卡的话。。。永远只有显存容量更大些才有希望了。。。:shifty:
作者: Edison    时间: 2008-8-15 01:29
原帖由 msmme 于 2008-8-15 01:27 发表
以E版的理论来说。。。。。N卡想拼A卡的话。。。永远只有显存容量更大些才有希望了。。。:shifty:

我没这样的理论,不要把你的所有想法都往我这里栽,承受不了,这里讨论的是物理运算,因此也请不要尝试转移话题,你可以就你提出的其他问题另行开新的主题。
作者: distance    时间: 2008-8-15 02:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: msmme    时间: 2008-8-15 02:07
原帖由 distance 于 2008-8-15 02:05 发表

显卡的硬件发展速度如果快于游戏发展速度,就意味着玩家不用升级硬件了,也就意味着新硬件没人买了,这是硬件厂商不能容忍的。“显卡的硬件发展速度快于游戏”这种现象会出现,但只会阶段性的短暂出现。好莱坞电影 ...




你这个话对头。。。。。硬件永远只有更新,而无够用。。。赞。。{happy:]
作者: shu0202    时间: 2008-8-15 09:33
标题: 回复 54# Edison 的帖子
老大比我理解深刻多了!可是如果物理运算只用简化模型,比如老大提到的800个顶点,用CPU运算也绰绰有余了,GPU的物理加速不是多此一举么?并且为什么这点运算量再CPU上跑还是很费力?
作者: fifalan    时间: 2008-8-15 11:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: chipman    时间: 2008-8-15 14:13
原帖由 lzy651 于 2008-8-14 17:15 发表
迟早物理加速卡会重新复活出来的!~~
不会是CPU,不会是GPU,他们都不时最适合的
物理加速卡如果有 nv和INTEL的那个集成规模,那甩这两家几条马路是肯定的事

就看谁能握到广泛支持的标准,物理加速卡就由谁演变


物理卡还能复活?
CPU确实不适合,因为他更像是一种控制密集型的处理器,另外晶体管大量消耗在CACHE上,
GPU把大量的晶体管应用在(ALU)上,并行化和可编程性提高后更像是流处理器,当然适合大规模的数值计算。
以后肯定是GPU负责物理加速的趋势,只不过还需要时间。
作者: Edison    时间: 2008-8-15 15:59
Pentium 以后的 x86 主流桌面处理器都是超标量流水线的,Cyrix 6X86 后的主流桌面 x86 处理器都是具备OoOE,Pentium 4 还有 SMT 支持和 SSE2 支持,因此说 CPU 是串行执行是完全不正确的。

GPU 的 ISA 一点都不比 CPU 简单甚至更复杂,具体的可以看看 R600ISA.pdf,光是 shader 的算术指令就远远不止于加减乘,其除法是倒数实现。

顶点规模和运算规模并不能简单地直接挂钩,关键是物理运算基本上就是碰撞侦测这样的运算以及一大堆为了确保运算结果可以达到预期效果的封装功能。
作者: harleylg    时间: 2008-8-15 20:56
原帖由 distance 于 2008/8/15 02:05 发表

显卡的硬件发展速度如果快于游戏发展速度,就意味着玩家不用升级硬件了,也就意味着新硬件没人买了,这是硬件厂商不能容忍的。“显卡的硬件发展速度快于游戏”这种现象会出现,但只会阶段性的短暂出现。好莱坞电影 ...


你说的没错,不过问题是物理计算、光线跟踪就是很好的消耗显卡计算资源、提示游戏画面真实感的途径。




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4