|
英特尔图形媒体加速器(GMA)950显卡内核
1202倒装芯片球栅格阵列(1202-Ball FCBGA)封装的945G GMCH集成GMA950 (Graphics Media Accelerator 950) 256位显示图形核心,默认运行频率为400MHz,具有四条图形处理流水线,10.6GB/s的内存带宽,1.6 GPixel/s与1.6 GTexel/s的填充率,动态显存技术(DVMT)3.0 支持高达224MB的显存,并可根据需要动态分配系统内存。
GMA950是上一代GMCH整合图形功能的GMA900的升级版本,核心运行频率有所提升。GMA900具有四条图形处理流水线,运行频率最高为333MHz,8.5GB/s的内存带宽,1.3 GPixel/s与1.3 GTexel/s的填充率。支持Direct X 9以及OpenGL 1.4。但GMA950的3D支持特性方面没有改变,GMA950仍然支持2.0版本的Pixel Shader,但缺乏硬件T&L和Vertex Shader功能,顶点渲染和几何变换、光影部分仍然需要由CPU来运算。
GMA 950的结构
GMA950/900图形流水线采用了新的Zone(区域)渲染技术,它的几何变形与光影处理仍然由CPU完成。图形处理流水线能够完成区域转换(Zone Conversion),三角形设定几何转换,材质处理引擎,往帧缓存里写入像素。
Zone Conversion是新加入的功能,它主要是把区域渲染技术加入3D处理流水线,在Zone Conversion步骤,三角形被存储在同一个内存区域。因此所有关联的三角形被存储在内存中同一个区域中。这样,一个单独的Zone会在同一个时间被处理。
像素预处理操作,这是第二个区域渲染技术和传统3D图形流水线技术的主要区别,因为一个时间内仅有一个zone被渲染,所有的深度计算(三角形深度,Z轴)都在同一个芯片中(on-chip)完成,避免了分离的深度缓存。同样的,所有像素混合操作也可以在同一芯片中完成。因此每个区域的像素仅仅被写入一次。此外一个中间的Z(Intermediate Z)测试被加到ZRT3渲染路径,中间的Z处理可以抛弃不显示的像素,它可以减少材质带宽。
GMA 950/900具有四条像素处理流水线,而之前的Extreme Graphics 2仅有一条像素流水线。GMA 950可以同时处理四个像素,加强流水线并行处理能力是所有现代图形处理器的共通点和流水线组织方式。GMA 950的每个像素处理流水线具有一个材质采样单元,它可以在每个时钟周期完成一次材质贴图。GMA 950在硬件上支持DirectX 9像素着色器,这意味着那些采用了Shader Model 2.0的游戏可以在GMA 950上运行,而且不会出现问题或者有品质上的损失。
Intel的GMA 950/900使用了tile(片段,Fragment)基础的架构——第三代区域渲染技术(Zone Rendering Technology 3),这是Intel的专门创建的术语。在图像渲染之前,驱动首先等待,直到应用程序提供全部需要渲染的多边形。然后,生成每个三角形的tile列表(tile是Intel的术语,实际上它就是着色流水线中的Fragment,也就是包含像素的矩形,是像素流水线处理的基本单元。Fragment还包括了材质地址,色彩,透明度,法线等信息)。随后,当进行帧渲染时,图形处理器一个tile接一个tile的渲染,直到整个帧被渲染。
这个操作具有明显的优点和缺点,使用小的fragments,tiles,允许有效的使用GPU的Cache来存储处理的tile,以及在其上进行操作。
渲染一个tile操作,在帧创建处理过程中GPU绝对不会返回。考虑到tile具有一个较小的尺寸,帧缓存和Z缓存的片段符合这个tile,它可以完全调入GPU的Cache中。因此,图形处理器可以在芯片中“on-die”中完成全部运算,也就是不需要再从内存中调用数据了。而使用缓存的性能肯定是优于使用内存的性能。完成tile渲染之后,包括tile的帧缓存和Z缓存被写入到系统内存。帧缓存和Z缓存的Cache可以减轻内存总线的负担,提高数据传输的性能。这对于集成图形处理器来说是非常重要的,因为集成图形处理核心与CPU是共享内存总线的。Intel GMA 950/900有一个特别的单元用于检验Z轴的值,通过Z检测可以剔除那些不可见的像素,减少无效渲染,这是现代图形处理器都具备的基本功能。Z检测可以帮助GMA 950/900减少不必要的工作(材质或者着色器处理),去除不可见的像素可以提高渲染场景的效率,它反应了对象重叠的级别(或者重写像素的数量)。
对于以tile基础架构来说是不利的是它如何处理几何数据,为了正确创建多边形列表,tile架构图形处理器需要等待全部几何数据,成功创建帧,接着,它开始渲染场景(scene)。传统的GPU架构在接受数据后开始处理几何数据流和渲染场景。这需要排列多边形和为每个tile创建队列,要求符合顶点处理的流水线操作算法。也许这就是Intel在GMA 950/900中放弃硬件T&L和顶点着色器的原因,几何数据象多边形排序可以由CPU高效的完成。GMA 950/900没有全屏抗锯齿功能,实际上,在驱动的控制面板上没有提供这项功能。的确,FSAA对于集成图形处理器来说并不是特别重要,因为FSAA对性能的影响太严重。GMA 950/900支持四倍各向异性材质过滤,但是各向异性过滤不能同时结合三线性过滤。
GMA 950的内存分配方式
GMA 950支持3.0版的动态显存技术DVMT,当需要时,系统内存可以成为“图形内存”,操作系统和GPU可以通过几个平衡而有效的路径共享系统内存。
图形核心需要的内存数量被划分成两个部分,首先是一个较小的部分——预分配内存(Preallocated Memory ),这是GPU的领地,操作系统不能访问它。你可以在BIOS中设置这个内存区域的大小:1MB或者8MB。
另一部分是GMA 950/900的DVM技术,这个DVMT模式支持:
1、在Fixed模式,一个固定尺寸的系统内存片段被分配给图形处理器,它仅用于图形核心,这个尺寸是64或者128MB。
2、在DVMT模式中,图形核心驱动使用系统内存就好象其它操作系统组件或者应用程序一样,假如一个“重载”的3D游戏被启动,需要更多的内存用于材质,几何数据等,当没有其它内存消耗量区大的程序运行时,它可以自动为图形核心分配所需的内存,在这个模式中,最多可以被分配224MB内存(包括预分配的内存)。
3、在“Fixed+DVMT”模式,图形处理器获得固定尺寸的64MB内存(预分配的内存)和最高64MB的动态分配内存。这个模式保证至少有64MB内存可以被图形处理器使用,可能的话,最多可以使用128MB的内存。
Advanced Digital Display 2+
GMA950另一方面的增强是视频应用领域,除了微调强化了HDTV播放品 |
|