POPPUR爱换

标题: GT200系列显卡超频的一个误区 [打印本页]

作者: Asuka    时间: 2009-3-30 19:29
标题: GT200系列显卡超频的一个误区
本帖最后由 Asuka 于 2009-3-30 19:31 编辑

在论坛上看到大部分玩家,OC GT200的时候都是简单的拉高频率了事。

实际上,如果要榨取最高的性能,这种做法是无效的。G80以后NV所有的GPU,如果要靠超频来在游戏中获得最高性能,必须合理的控制各个频率之间的比值。



和以往的GPU不同,NV从Tesla(G80)开始引入了新的架构,GPU部件被划分为计算和访存两个部分,Tesla的核心思想就是将计算和访存两种互相干扰的特性分开来,通过multi-Threading和各种on-chip cache将延迟和带宽需求分解并掩盖掉。

当计算部分摆脱访存的束缚后,可以很轻松的提升性能。对于ALU来说,提升性能最直观的方法就是提高时钟频率。

以G80架构为例,如下图(图片引用自后藤俊茂的海外IT周评):

[attach]1018956[/attach]

淡蓝色部分是核心层(计算),工作在1.35GHz;粉红色部分是外围部件(访存),工作在575MHz。

从设计角度来说,因为multi-thread和cache的存在,外围部件(主要包括TMU、ROP、tex cache)对于频率的敏感性已经变得较低,因为访存本身就是一个延迟极长的动作。但是对于核心层来说,它所执行的是于周期小、密集度高的算术指令,而且大部分都属于存储器无关的操作,因此提升核心层的硬件工作频率,在一定范围内,获得的效能提升将是线性的。

就程序需求角度来说,也可以得到同样的结论。从DX8、DX9、DX10一路走来,PC图形渲染单元的硬件发展本质在于绕开存储器墙,通过算术计算获得更加出色的效果。而PC游戏也迎合了这一趋势,新一代的PC游戏相对于前辈,都将硬件需求的重心放到了GPU的算术运算能力方面。因此,从理论上讲提高游戏帧数最好的办法就是提高GPU的算术运算能力。

GT200开放给用户调整的频率包括core(nvclk)、shader(hotclk)、memory(memclk),分别对应核心层、外围层和本地显存的频率。从上面的描述可知,最影响性能的是shader频率;memory频率只要不构成瓶颈,对性能也无关痛痒;而core频率几乎不影响性能,当然你把它降得太低也是不行的。

一般来说nvclk和hotclk是绑定的,期间有一个特定的比例关系,提升nvclk,hotclk也同比例获得提升。但是也可以通过rivatuner等工具解锁。在分开调节的时候,因为始终发生器的关系,hotclk实际上都是27的整数倍,而且不能低于nvclk的2倍。



在超频角度来说,毫无疑问同步提升三个频率获得的性能提升是最大的。但是站在显卡的角度,因为发热、供电设计的影响实际上我们只能在core和shader之间选取一个最高频率。

因此,结论就是,选择获得shader而不是整体频率的极限,可以获得最高的效能。
作者: Asuka    时间: 2009-3-30 19:30
占二楼

我将在以后更新实例来说明问题
作者: godlike    时间: 2009-3-30 19:46
这是所有gf8gh9系列的超频误区吧
作者: Demonhunter    时间: 2009-3-30 20:01
从来不超显卡的路过~~~~~~~~支持技术贴~~~~~

话说很多人确实以为超A和超N卡是一样的,N其实要复杂一些
作者: abc175    时间: 2009-3-30 20:03
看你玩什么游戏了,,越真实的游戏对渲染要求越高,,当然是超频他了。。
8过同样部分游戏对渲染要求不高的,,很多网络游戏都这样,,提高常规3D运算速度是最好的选择。。
作者: Asuka    时间: 2009-3-30 20:08
看你玩什么游戏了,,越真实的游戏对渲染要求越高,,当然是超频他了。。
8过同样部分游戏对渲染要求不高的,,很多网络游戏都这样,,提高常规3D运算速度是最好的选择。。
abc175 发表于 2009-3-30 20:03


个人认为,绝大多数网络游戏,GTX260这个级别的卡,降频使用更实在
作者: 侏罗纪跑步龙    时间: 2009-3-30 20:22
很不错,站位学习
作者: 无敌二阶堂    时间: 2009-3-30 20:34
不大懂。。。占位。。。慢慢学习
作者: Azl2    时间: 2009-3-30 20:40
明日香版主 每次看你的帖子都能学到不少的东西 十分感谢!!我是个小白, 虽然不太懂,是不是意思就是说260+级别显卡core频率的高低对现在的游戏来说影响很小了,提升shader才可以使FPS 得到最明显的提升。ATI的显卡是不是也是一样的呢?但是ATI没有异频...有没有对常规3D运算要求很高的游戏呢?比如WAR3如果除去AI的因数,在变态的RPG地图里面出现极其大量的单位的时候这个时候需要的就是core频率了么?
作者: godlike    时间: 2009-3-30 20:44
不如放出比较实用的各个显卡core/shader比例,比如260+/98gtx+/98gt/96gt
作者: fevaoctwh    时间: 2009-3-30 20:47
提示: 作者被禁止或删除 内容自动屏蔽
作者: 紫夜星辰    时间: 2009-3-30 21:04
略知一点,不发表什么意见。。。
作者: Asuka    时间: 2009-3-30 21:23
一概而论总是错的,每个游戏对硬件的需求应该是不一样的吧~~~水桶理论中,实际性能应该是最差的那个环节的性能。
LZ不如把主流游戏的硬件需求中,显卡的某个瓶颈性能放出来,然后让我们超瓶颈,这样的提升才是最 ...
lzy651 发表于 2009-3-30 21:03


简单的说,老游戏,又想要性能提升的话,OC时就不要去掉频率绑定,让core和shader一起升
作者: Asuka    时间: 2009-3-30 21:25
本帖最后由 Asuka 于 2009-3-30 21:26 编辑
明日香版主 每次看你的帖子都能学到不少的东西 十分感谢!!我是个小白, 虽然不太懂,是不是意思就是说260+级别显卡core频率的高低对现在的游戏来说影响很小了,提升shader才可以使FPS 得到最明显的提升。ATI的显卡 ...
Azl2 发表于 2009-3-30 20:40


看你要玩什么游戏了

一般不需要超频的

ATI的显卡架构不同,shader和外围是绑定在一起的,直接超核心频率就可以了
作者: bigpao007    时间: 2009-3-30 21:25
GT200开放给用户调整的频率包括core(nvclk)、shader(hotclk)、memory(memclk),分别对应核心层、外围层和本地显存的频率。


这句后面的 三个层 顺序是不是错了哦,  按照LZ的意思,  这个顺序应该是

CORE 对应 外围层
SHADER 对应 核心层
MEMORY 对应 显存.

这样才能解释通 提高 SHADER频率 等于  提高 核心计算能力.


感觉 这个设计 方案是不是来源于FWQ 的CPU 架构哦,  扫存 和 计算分开进行 ,支持同步和异步.

但 G80 及以后的 架构 是不是能支持 异步呢??

下面重点来了, 请LZ 看下哦.{:4_175:}

如果  G80 及以后的架构 在 外围数据 和 核心计算区数据的传递中 只能同步, 那么 肯定就存在一个比例使 CORE 和 SHADER 达到最佳效果, 如果要提高效能, 则必须同步提高 CORE 和 SHADER.

如果 支持 异步的话, 那 提高 SHADER 就能 提高效能, 符合LZ 观点.
作者: Asuka    时间: 2009-3-30 21:30
这句后面的 三个层 顺序是不是错了哦,  按照LZ的意思,  这个顺序应该是

CORE 对应 外围层
SHADER 对应 核心层
MEMORY 对应 显存.

这样才能解释通 提高 SHADER频率 等于  提高 核心计算能力.


感觉 这 ...
bigpao007 发表于 2009-3-30 21:25


core对应外围部件、shader对应核心....

没办法,NV的MODS程序里就是这么命名的,很别扭


异步的话,当然支持了,你用NV system tools或者rivatuner都可以给频率绑定解锁啊
作者: Asuka    时间: 2009-3-30 21:36
下面重点来了, 请LZ 看下哦.{:4_175:}

如果  G80 及以后的架构 在 外围数据 和 核心计算区数据的传递中 只能同步, 那么 肯定就存在一个比例使 CORE 和 SHADER 达到最佳效果, 如果要提高效能, 则必须同步提高 CORE 和 SHADER.

如果 支持 异步的话, 那 提高 SHADER 就能 提高效能, 符合LZ 观点.

bigpao007 发表于 2009-3-30 21:25


固定的比例是不存在的

因为不同程序、不同场景所用的ALU:tex比例不同
作者: bigpao007    时间: 2009-3-30 21:37
core对应外围部件、shader对应核心....

没办法,NV的MODS程序里就是这么命名的,很别扭


异步的话,当然支持了,你用NV system tools或者rivatuner都可以给频率绑定解锁啊
Asuka 发表于 2009-3-30 21:30


恩, 第一个问题 解决了.

你搞错了我说的 同步异步的意思.... {:4_188:}

我的意思不是 频率方面的异步,

1:你说 外围负责数据的传递,  SHADER 负责计算, 那么  SHADER 计算 也是需要数据的,  SHADER 读取数据<br> 的时候 需要考虑到 CORE在传递的时延么???  是这个异步同步的意思哦.

2:如果 CORE 存在 时间片的问题, 那么在 时间片的中间阶段, SHADER 却需要数据, 那么 SHADER 是不是能<br>得到数据呢???

3:如果CORE 的 时延 在上升阶段 和 下降阶段 都是分开计算的, 而且 在同一个阶段内 只能允许SHADER进行<br>一种操作的话, 那么 可以看成  SHADER 和 CORE 的读取 必须 同步 而且不能互斥.


4:另 某些计算是不是 不需要在送入 CORE 然后在到显存, 就可以直接传到 接口进行显示了.
作者: bennysx    时间: 2009-3-31 00:21
期待后续教程,受教了
作者: helpyyl    时间: 2009-3-31 00:44
从来不超显卡的飘过。
作者: Asuka    时间: 2009-3-31 01:37
你搞错了我说的 同步异步的意思....

我的意思不是 频率方面的异步,

1:你说 外围负责数据的传递,  SHADER 负责计算, 那么  SHADER 计算 也是需要数据的,  SHADER 读取数据的时候 需要考虑到 CORE在传递的时延么???  是这个异步同步的意思哦.

2:如果 CORE 存在 时间片的问题, 那么在 时间片的中间阶段, SHADER 却需要数据, 那么 SHADER 是不是得到数据呢???

3:如果CORE 的 时延 在上升阶段 和 下降阶段 都是分开计算的, 而且 在同一个阶段内 只能允许SHADER进行一种操作的话, 那么 可以看成  SHADER 和 CORE 的读取 必须 同步 而且不能互斥.

4:另 某些计算是不是 不需要在送入 CORE 然后在到显存, 就可以直接传到 接口进行显示了.
bigpao007 发表于 2009-3-30 21:37


首先,我所描述的核心层主要是指streaming multiprocessor内部的部件,包括SP、各种cache、dispatch、reg file和crossbar等

外围部件主要指TMU、纹理缓存、ROP和外部的crossbar总线

它们之间并不是简单的“计算”和“传递”关系。说起来有点复杂,你可以做如下理解:

为了完成一个大的任务(图形渲染),GPU中需要有许多部件,这些部件将整个大任务分解成许多步骤去执行,这些步骤的周期并不是相等的。有些步骤的周期比较长,比如tex fetch;有些步骤周期很短,比如add、mul这种算数操作。为了能更加方便的获得性能提升,NV从tesla架构开始,在GPU内把这两种操作的时钟分离开来。周期短的放到一起,适宜于提升频率,这就是hotclk(shader clock)部分;周期长的放到一起,利于multi-threading掩盖延迟,这就是nvclk(core clock)部分。另外还有一些诸如纹理缓存、渲染后端(ROP)、总线(crossbar)等辅助部件,这些和nvclk部分共用时钟,它们加在一起被称为外围部件。

关于你提到的数据等待操作问题,因为现在的GPU都是基于multi-threading结构的,因此不存在你说的那些情况

你可以参考cho的文章了解下GPU结构:http://www.pcinlife.com/article/ ... 13601612d533_1.html
作者: konamiandlmh    时间: 2009-3-31 02:03
活跃......
作者: wy80828    时间: 2009-3-31 08:16
技术贴,帮顶了!!!
作者: mako    时间: 2009-3-31 08:26
个人认为,绝大多数网络游戏,GTX260这个级别的卡,降频使用更实在
Asuka 发表于 2009-3-30 20:08


赞同这个观点
作者: go@    时间: 2009-3-31 08:42
没玩过显卡超频{wink:]
作者: liling99    时间: 2009-3-31 08:51
搞不明白,显卡从不超频的顶个先!
版主最好搞点游戏实际测试一下做个对比。
原版、只超core、只超shader和只超显存的得分,当然超频的比例应该相同。
作者: cloud1977    时间: 2009-3-31 09:08
太专业了,看不懂,纯帮顶算了
作者: aibo    时间: 2009-3-31 11:00
看看

俺GTX280太热,刚把频率降下去
作者: aibo    时间: 2009-3-31 11:04
另外问一下版主

GTX280能不能修改bios降压?
作者: jhg1159    时间: 2009-3-31 11:13
本帖最后由 jhg1159 于 2009-3-31 11:30 编辑

:lol::lol:  Shader好像是54的整倍数
54整倍数的“规律”,只对1000MHz以上的Shader频率段适用
G92/G84  核心和Shader频率1:2.7的比率,G80/G200 核心和Shader频率1:2.5的比率.
作者: bigpao007    时间: 2009-3-31 11:20
看看

俺GTX280太热,刚把频率降下去
aibo 发表于 2009-3-31 11:00


这个级别了, 建议别降压, 如果能降的话 , NV早就降了, 毕竟 降压 除了 可以减少发热外, 还能直接的减少功耗




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4