POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3643|回复: 30
打印 上一主题 下一主题

GT200系列显卡超频的一个误区

[复制链接]
跳转到指定楼层
1#
发表于 2009-3-30 19:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 Asuka 于 2009-3-30 19:31 编辑

在论坛上看到大部分玩家,OC GT200的时候都是简单的拉高频率了事。

实际上,如果要榨取最高的性能,这种做法是无效的。G80以后NV所有的GPU,如果要靠超频来在游戏中获得最高性能,必须合理的控制各个频率之间的比值。



和以往的GPU不同,NV从Tesla(G80)开始引入了新的架构,GPU部件被划分为计算和访存两个部分,Tesla的核心思想就是将计算和访存两种互相干扰的特性分开来,通过multi-Threading和各种on-chip cache将延迟和带宽需求分解并掩盖掉。

当计算部分摆脱访存的束缚后,可以很轻松的提升性能。对于ALU来说,提升性能最直观的方法就是提高时钟频率。

以G80架构为例,如下图(图片引用自后藤俊茂的海外IT周评):



淡蓝色部分是核心层(计算),工作在1.35GHz;粉红色部分是外围部件(访存),工作在575MHz。

从设计角度来说,因为multi-thread和cache的存在,外围部件(主要包括TMU、ROP、tex cache)对于频率的敏感性已经变得较低,因为访存本身就是一个延迟极长的动作。但是对于核心层来说,它所执行的是于周期小、密集度高的算术指令,而且大部分都属于存储器无关的操作,因此提升核心层的硬件工作频率,在一定范围内,获得的效能提升将是线性的。

就程序需求角度来说,也可以得到同样的结论。从DX8、DX9、DX10一路走来,PC图形渲染单元的硬件发展本质在于绕开存储器墙,通过算术计算获得更加出色的效果。而PC游戏也迎合了这一趋势,新一代的PC游戏相对于前辈,都将硬件需求的重心放到了GPU的算术运算能力方面。因此,从理论上讲提高游戏帧数最好的办法就是提高GPU的算术运算能力。

GT200开放给用户调整的频率包括core(nvclk)、shader(hotclk)、memory(memclk),分别对应核心层、外围层和本地显存的频率。从上面的描述可知,最影响性能的是shader频率;memory频率只要不构成瓶颈,对性能也无关痛痒;而core频率几乎不影响性能,当然你把它降得太低也是不行的。

一般来说nvclk和hotclk是绑定的,期间有一个特定的比例关系,提升nvclk,hotclk也同比例获得提升。但是也可以通过rivatuner等工具解锁。在分开调节的时候,因为始终发生器的关系,hotclk实际上都是27的整数倍,而且不能低于nvclk的2倍。



在超频角度来说,毫无疑问同步提升三个频率获得的性能提升是最大的。但是站在显卡的角度,因为发热、供电设计的影响实际上我们只能在core和shader之间选取一个最高频率。

因此,结论就是,选择获得shader而不是整体频率的极限,可以获得最高的效能。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
 楼主| 发表于 2009-3-30 19:30 | 只看该作者
占二楼

我将在以后更新实例来说明问题
回复 支持 反对

使用道具 举报

3#
发表于 2009-3-30 19:46 | 只看该作者
这是所有gf8gh9系列的超频误区吧
回复 支持 反对

使用道具 举报

4#
发表于 2009-3-30 20:01 | 只看该作者
从来不超显卡的路过~~~~~~~~支持技术贴~~~~~

话说很多人确实以为超A和超N卡是一样的,N其实要复杂一些
回复 支持 反对

使用道具 举报

5#
发表于 2009-3-30 20:03 | 只看该作者
看你玩什么游戏了,,越真实的游戏对渲染要求越高,,当然是超频他了。。
8过同样部分游戏对渲染要求不高的,,很多网络游戏都这样,,提高常规3D运算速度是最好的选择。。
回复 支持 反对

使用道具 举报

6#
 楼主| 发表于 2009-3-30 20:08 | 只看该作者
看你玩什么游戏了,,越真实的游戏对渲染要求越高,,当然是超频他了。。
8过同样部分游戏对渲染要求不高的,,很多网络游戏都这样,,提高常规3D运算速度是最好的选择。。
abc175 发表于 2009-3-30 20:03


个人认为,绝大多数网络游戏,GTX260这个级别的卡,降频使用更实在
回复 支持 反对

使用道具 举报

7#
发表于 2009-3-30 20:22 | 只看该作者
很不错,站位学习
回复 支持 反对

使用道具 举报

8#
发表于 2009-3-30 20:34 | 只看该作者
不大懂。。。占位。。。慢慢学习
回复 支持 反对

使用道具 举报

9#
发表于 2009-3-30 20:40 | 只看该作者
明日香版主 每次看你的帖子都能学到不少的东西 十分感谢!!我是个小白, 虽然不太懂,是不是意思就是说260+级别显卡core频率的高低对现在的游戏来说影响很小了,提升shader才可以使FPS 得到最明显的提升。ATI的显卡是不是也是一样的呢?但是ATI没有异频...有没有对常规3D运算要求很高的游戏呢?比如WAR3如果除去AI的因数,在变态的RPG地图里面出现极其大量的单位的时候这个时候需要的就是core频率了么?
回复 支持 反对

使用道具 举报

10#
发表于 2009-3-30 20:44 | 只看该作者
不如放出比较实用的各个显卡core/shader比例,比如260+/98gtx+/98gt/96gt
回复 支持 反对

使用道具 举报

头像被屏蔽
11#
发表于 2009-3-30 20:47 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

12#
发表于 2009-3-30 21:04 | 只看该作者
略知一点,不发表什么意见。。。
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2009-3-30 21:23 | 只看该作者
一概而论总是错的,每个游戏对硬件的需求应该是不一样的吧~~~水桶理论中,实际性能应该是最差的那个环节的性能。
LZ不如把主流游戏的硬件需求中,显卡的某个瓶颈性能放出来,然后让我们超瓶颈,这样的提升才是最 ...
lzy651 发表于 2009-3-30 21:03


简单的说,老游戏,又想要性能提升的话,OC时就不要去掉频率绑定,让core和shader一起升
回复 支持 反对

使用道具 举报

14#
 楼主| 发表于 2009-3-30 21:25 | 只看该作者
本帖最后由 Asuka 于 2009-3-30 21:26 编辑
明日香版主 每次看你的帖子都能学到不少的东西 十分感谢!!我是个小白, 虽然不太懂,是不是意思就是说260+级别显卡core频率的高低对现在的游戏来说影响很小了,提升shader才可以使FPS 得到最明显的提升。ATI的显卡 ...
Azl2 发表于 2009-3-30 20:40


看你要玩什么游戏了

一般不需要超频的

ATI的显卡架构不同,shader和外围是绑定在一起的,直接超核心频率就可以了
回复 支持 反对

使用道具 举报

15#
发表于 2009-3-30 21:25 | 只看该作者
GT200开放给用户调整的频率包括core(nvclk)、shader(hotclk)、memory(memclk),分别对应核心层、外围层和本地显存的频率。


这句后面的 三个层 顺序是不是错了哦,  按照LZ的意思,  这个顺序应该是

CORE 对应 外围层
SHADER 对应 核心层
MEMORY 对应 显存.

这样才能解释通 提高 SHADER频率 等于  提高 核心计算能力.


感觉 这个设计 方案是不是来源于FWQ 的CPU 架构哦,  扫存 和 计算分开进行 ,支持同步和异步.

但 G80 及以后的 架构 是不是能支持 异步呢??

下面重点来了, 请LZ 看下哦.{:4_175:}

如果  G80 及以后的架构 在 外围数据 和 核心计算区数据的传递中 只能同步, 那么 肯定就存在一个比例使 CORE 和 SHADER 达到最佳效果, 如果要提高效能, 则必须同步提高 CORE 和 SHADER.

如果 支持 异步的话, 那 提高 SHADER 就能 提高效能, 符合LZ 观点.
回复 支持 反对

使用道具 举报

16#
 楼主| 发表于 2009-3-30 21:30 | 只看该作者
这句后面的 三个层 顺序是不是错了哦,  按照LZ的意思,  这个顺序应该是

CORE 对应 外围层
SHADER 对应 核心层
MEMORY 对应 显存.

这样才能解释通 提高 SHADER频率 等于  提高 核心计算能力.


感觉 这 ...
bigpao007 发表于 2009-3-30 21:25


core对应外围部件、shader对应核心....

没办法,NV的MODS程序里就是这么命名的,很别扭


异步的话,当然支持了,你用NV system tools或者rivatuner都可以给频率绑定解锁啊
回复 支持 反对

使用道具 举报

17#
 楼主| 发表于 2009-3-30 21:36 | 只看该作者
下面重点来了, 请LZ 看下哦.{:4_175:}

如果  G80 及以后的架构 在 外围数据 和 核心计算区数据的传递中 只能同步, 那么 肯定就存在一个比例使 CORE 和 SHADER 达到最佳效果, 如果要提高效能, 则必须同步提高 CORE 和 SHADER.

如果 支持 异步的话, 那 提高 SHADER 就能 提高效能, 符合LZ 观点.

bigpao007 发表于 2009-3-30 21:25


固定的比例是不存在的

因为不同程序、不同场景所用的ALU:tex比例不同
回复 支持 反对

使用道具 举报

18#
发表于 2009-3-30 21:37 | 只看该作者
core对应外围部件、shader对应核心....

没办法,NV的MODS程序里就是这么命名的,很别扭


异步的话,当然支持了,你用NV system tools或者rivatuner都可以给频率绑定解锁啊
Asuka 发表于 2009-3-30 21:30


恩, 第一个问题 解决了.

你搞错了我说的 同步异步的意思.... {:4_188:}

我的意思不是 频率方面的异步,

1:你说 外围负责数据的传递,  SHADER 负责计算, 那么  SHADER 计算 也是需要数据的,  SHADER 读取数据<br> 的时候 需要考虑到 CORE在传递的时延么???  是这个异步同步的意思哦.

2:如果 CORE 存在 时间片的问题, 那么在 时间片的中间阶段, SHADER 却需要数据, 那么 SHADER 是不是能<br>得到数据呢???

3:如果CORE 的 时延 在上升阶段 和 下降阶段 都是分开计算的, 而且 在同一个阶段内 只能允许SHADER进行<br>一种操作的话, 那么 可以看成  SHADER 和 CORE 的读取 必须 同步 而且不能互斥.


4:另 某些计算是不是 不需要在送入 CORE 然后在到显存, 就可以直接传到 接口进行显示了.
回复 支持 反对

使用道具 举报

19#
发表于 2009-3-31 00:21 | 只看该作者
期待后续教程,受教了
回复 支持 反对

使用道具 举报

20#
发表于 2009-3-31 00:44 | 只看该作者
从来不超显卡的飘过。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-21 11:24

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表