|
计算机体系结构的基本原理是,任何软件能够实现的,硬件都能够实现,相反也成立,这被成为硬件软件等效原理。这一原理只是功能等效,性能来说,良好优化和设计的硬件通常要比同样水平的软件快很多,同样,开发周期长,开发的成本,也要高不少,体系结构研究的重点就是从需要出发,寻求最佳的软硬件平衡点,在一定的成本约束下,获得最高的性能。
GPU 中也是一样,在目前统一渲染成为主题的今天,US 和Fixed Function 是配合的,当我们重点看SP 的数量的时候,其实GPU 性能的很大程度是由Fixed Function 来完成的,看起来nVidia 和AMD 的SP 设计思路很大不同,但是他们的Fixed Function 差异可能更大,而更隐蔽,如果有条件,做一下DX10 的Profiling,可以发现相同价位的显卡,在DX API 的具体函数表现是不同的,这个差异就来自两方面,SP 的特性和Fixed Function 共同决定的,当然也和整个GPU 的层次架构有关系,这是GPU 优化的主要工作基础,从Profiling 的结果可以分析出瓶颈和问题。
说到Fixed Function,其实PS3 是个很好的例子,PS3 中Cell 不仅仅充当主处理器,而且还兼有GPU 的部分功能,Fixed Function 由RSX 做,Cell 最大的问题是PPU 的性能太低,结构太简单,制约了整体性能,对编程的要求就很高了,从实验看,PPU 喂饱两个SPU 就很勉强了,对于6个甚至8个SPU 的情况,SPU 饥饿的情况太多。Larrabee 如果采用Cell+RSX 的设计,可能设计周期可以短不少。 |
|