POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 9667|回复: 138
打印 上一主题 下一主题

G80 是 32 管的

[复制链接]
跳转到指定楼层
1#
发表于 2006-11-8 08:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不论怎么吹,也不能否认一个事实: G80 的 4D 处理能力 (也就是顶点和色彩的基本单位) 为 32 个每周期

看看现在的评测大吹什么 R580 只有 48 shader 而 G80 是 128 processor ... 不同的单位,能比么

希望大家 YY 不要过头,看清事物的本质。G80 激进的设计在相当一段时间的游戏里体现不出优势的,就像

当年的 NV30 那样,专门优化以后可以很快,不优化就慢到死,1D 的 array 跑当前的 shader 性能不会好到哪去的

期望 NV 的驱动小组能加大优化的力度,不然现在的局面 GTS 都被 XTX 干掉了

GTS 是 96 processor,4D 处理能力只有 24 / cycle 而且没有独立的 VS 单元,虽然灵活度高,但是资源不足
2#
发表于 2006-11-8 09:00 | 只看该作者
原帖由 Illuminati 于 2006-11-8 08:28 发表
不论怎么吹,也不能否认一个事实: G80 的 4D 处理能力 (也就是顶点和色彩的基本单位) 为 32 个每周期

看看现在的评测大吹什么 R580 只有 48 shader 而 G80 是 128 processor ... 不同的单位,能比么

希望 ...


我实在是无法理解你在看着G80实际性能和X1950XTX CF相当的情况下是如何得出这样的分析结果的。
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2006-11-8 09:03 | 只看该作者
一个简单的 pixel shader:

tex2d r0, s0, t0
mov r1, c1
mad r0, r0, r1, c0
mov oC0, r0

对于传统双 4D ALU 的 pixel shader 单元可以两周期完成 tex2d 一周期,mad 一周期

而在 G80 看来要 5 周期完成,G80 的驱动会把 shader 翻译成这样


tex2d r0, s0, t0
mad r0.x, r0.x, r1.x, c0.x
mad r0.y, r0.y, r1.y, c0.y
mad r0.z, r0.z, r1.z, c0.z
mad r0.w, r0.w, r1.w, c0.w

其实最后一条指令在绝大多数情况下可以省略,可是如果程序不指定,driver 不能强制省略。所以如果想充分发挥 1D 的优势,原始程序必须这样写

tex2d r0, s0, t0
mov r1, c1
mad r0.xyz, r0, r1, c0
mov oC0, r0

所以 NV 只能继续从 driver 作特定 shader 的侦测与替换来完成优化,这到底是否作弊,就没有一个决切的说法了...
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2006-11-8 09:07 | 只看该作者
G80 要想在现有的游戏中发挥能力,就必须替换每一个可能的 shader,并且由写驱动的开发人员手动优化

而 G80 要想在未来的游戏中发挥能力,则必须教育开发人员写出类似 r0.xyz 而不是简单的 r0 的代码

反过来看 R600,如果继续用 4D vector,则 1D/4D 速度没有区别 (先不考虑 co-issue),R600 肯定会像 R300 一样让程序员写代码写的轻松

所以究竟未来的游戏会写成什么样,要取决开发人员的态度了

勤奋的开发人员 == G80 跑的快

一般开发人员 == R600 跑的快
回复 支持 反对

使用道具 举报

5#
发表于 2006-11-8 09:11 | 只看该作者
:lol:  
lz不要忘了频率,1350的内部频率怎么说也是一大进步。
回复 支持 反对

使用道具 举报

6#
发表于 2006-11-8 09:13 | 只看该作者
勤奋的开发人员 == G80 跑的快

一般开发人员 == R600 跑的快


:p 是不是可以理解为:大作,G80跑得快, 平庸的小作坊的产品,R600跑得快。。:lol:
回复 支持 反对

使用道具 举报

ikinari 该用户已被删除
7#
发表于 2006-11-8 09:13 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

8#
发表于 2006-11-8 09:21 | 只看该作者
看来这里的ProA都忽略了G80的shader频率比G70提高了一倍有余的事实。
回复 支持 反对

使用道具 举报

9#
 楼主| 发表于 2006-11-8 09:26 | 只看该作者
频率当然是速度的主要原因,如果频率下来了,那可真是连 R580 都不如了


有意思的是 G80 和 R600 的软件卡发策略完全相反,NV 给钱就优化成 1D/2D/3D,结果 G80 跑的快,AMD 给钱就都用 4D,G80 哭死

说道头来还是砸钱的问题
回复 支持 反对

使用道具 举报

su27upgrade 该用户已被删除
10#
发表于 2006-11-8 09:38 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

11#
发表于 2006-11-8 09:41 | 只看该作者
4D的并行度就那么容易保证么。。
回复 支持 反对

使用道具 举报

12#
发表于 2006-11-8 09:44 | 只看该作者
原帖由 Illuminati 于 2006-11-8 09:03 发表
一个简单的 pixel shader:

tex2d r0, s0, t0
mov r1, c1
mad r0, r0, r1, c0
mov oC0, r0

对于传统双 4D ALU 的 pixel shader 单元可以两周期完成 tex2d 一周期,mad 一周期

而在 G80 看来要 5 周期 ...

太牛了!
我佩服阿!

这些指令我都快忘了....
回复 支持 反对

使用道具 举报

13#
发表于 2006-11-8 09:44 | 只看该作者
4d操作在shader里能有多少,co-issue也不是100%的
回复 支持 反对

使用道具 举报

14#
发表于 2006-11-8 09:45 | 只看该作者
应该用高级语言比如c写shader,让厂家的编译器作汇编级的优化
回复 支持 反对

使用道具 举报

15#
发表于 2006-11-8 09:46 | 只看该作者
:blink: 楼主忘了g80的shader是倍频的。
回复 支持 反对

使用道具 举报

16#
 楼主| 发表于 2006-11-8 09:46 | 只看该作者
不是容易不容易的问题,而是开发人员的态度问题

大家开发了十来年的 3d,都是用的 SIMD,所以给人们留下的印象就是 2D/3D/4D 一样快,也就是额外的计算资源是 "免费" 的

而这种开发理念在 G80 上来了一个 180 度大转弯,确实需要好好适应一下。

光这样还不算问题,至少没有出来的游戏还有改进的余地

但是问题就在现有的游戏中。现有的游戏都是这样开发的,因为既然 4D 是免费的,在这个浮躁的年代,根本没有人会多花时间在 “仅仅让代码看起来更漂亮” 上面

所以 G80 跑 DX9 title 估计不会从他的架构上沾到多大的便宜

有趣的是,G80 的设计理念是减少晶体管浪费,但是如果优化不得当,那浪费反而要大的多
回复 支持 反对

使用道具 举报

17#
发表于 2006-11-8 09:47 | 只看该作者
反正GF8800无对手的日子还有好多个月,又不急,慢慢的卖 #。谁强谁弱那是几个月也可能是以后都不会再发生了的事了。目前,只能说GF8800是地球上最快的卡,不用管他有几条腿!
回复 支持 反对

使用道具 举报

18#
 楼主| 发表于 2006-11-8 09:51 | 只看该作者
用 HLSL 写可以从一定程度上减少浪费,不过写过 HLSL 的人因该都有这样的经验

一个 nD 的 vector,到底该选几 n ? 不能 100% 肯定的话,都会选 float4 吧,而且写运算的时候,下面哪一个更方便?

a = b + c, 100% 正确的结果

a.xy = b + c,还需要仔细调试哪些 channel 是有用的,不然会得出错误结果

现在的程序员这么懒,开发效率高,代码效率低,绝大多数人都回去选一 1 种的,最后的重担都落在了 NV 驱动开发人员肩膀上
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
19#
发表于 2006-11-8 09:52 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

20#
 楼主| 发表于 2006-11-8 09:54 | 只看该作者
赫赫,你说 EA 开发出来跑的效率超级低下的引擎,不是一样大卖

这个世界还是懒人多

如果这样就算不及格,那全世界及格的还真没几个
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2026-6-3 10:38

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表