G80 是 32 管的

Illuminati · 发表于 2006-11-8 09:56

建议 NV 搞一个 the way it's meant to be played 认证

游戏想通过认证必须把 shader 提交 nvidia 做检查，通过 1/2/3D 优化 (姑且这么叫) 的才能合格:loveliness:

只看该作者 · 发表于 2006-11-8 09:58

提示: 作者被禁止或删除内容自动屏蔽

ayanamei · 发表于 2006-11-8 09:59

原帖由 Illuminati 于 2006-11-8 09:46 发表
不是容易不容易的问题，而是开发人员的态度问题

大家开发了十来年的 3d，都是用的 SIMD，所以给人们留下的印象就是 2D/3D/4D 一样快，也就是额外的计算资源是 "免费" 的

而这种开发理念在 G80 ...

我倒觉得是减少 4D这种依存性  以适应不同的应用
G80不单纯是一块GPU

而且SIMD也不是100%好用
4D ALU FLOP/S  多数时候都是是虚的

1D ALU在大量4D 操作的时候  性能会受影响是必然的
但是这个能占到多少比例是关键

而且NV必然也同样注意到了这个问题  所以才提高了 Shader单元的频率
最后折算下来虽然峰值Flop/s 有所下降但是可吃到的资源更多
但是不可否认 Scalar构架 Flop/s 要稳定而且可靠
相对Vector限制颇多

Illuminati · 发表于 2006-11-8 10:02

G80 还是有胜算的：

对于已经出来的游戏： Shader 替换大法

对于还没出来的游戏：砸钱大法

哈哈开玩笑的，别介意

ayanamei · 发表于 2006-11-8 10:04

原帖由 yehaku01 于 2006-11-8 10:01 发表

呵呵。G80其实就象P4那样高频低能。这样的架构对游戏软件和驱动的依赖性太强了。
如果不优化很难跑顺畅的。

完全不是一个概念的东西

只看该作者 · 发表于 2006-11-8 10:05

提示: 作者被禁止或删除内容自动屏蔽

Illuminati · 发表于 2006-11-8 10:08

那按道理 NFS10 应该在 NV30 上都跑的不慢了:lol:

ayanamei · 发表于 2006-11-8 10:09

原帖由 Illuminati 于 2006-11-8 10:08 发表
那按道理 NFS10 应该在 NV30 上都跑的不慢了:lol:

NV30 有多少执行资源呢　＃不光是寄存器的问题吧　＃

toshibacom · 发表于 2006-11-8 10:10

原帖由 Illuminati 于 2006-11-8 09:56 发表
建议 NV 搞一个 the way it's meant to be played 认证

游戏想通过认证必须把 shader 提交 nvidia 做检查，通过 1/2/3D 优化 (姑且这么叫) 的才能合格:loveliness:

既然NV的驱动可以搞定，那么游戏厂商为什么需要浪费时间自己去做1/2/3D 优化？NV可以给钱让游戏厂商优化，也可以把这些钱给驱动编写组作为加班费，可以一样达到效果。只要最终效果好，管他通过什么手段实现。

Illuminati · 发表于 2006-11-8 10:13

驱动替换 shader 代码，会被认为是 “不道德” 的行为，以前 “驱动作弊” 闹得还不够么

只看该作者 · 发表于 2006-11-8 10:14

提示: 作者被禁止或删除内容自动屏蔽

Illuminati · 发表于 2006-11-8 10:18

我比较好奇的是遇到 nD 操作，G80 的 processor 是用多个单元单周期完成还是单个单元多周期完成

估计后者比较容易实现。这样的话，如果能再飚频率上去，比如跑 4 倍频，速度就能接近 4D SIMD 的水平了

atigo · 发表于 2006-11-8 10:20

半年前nv的“首席科学家”还有本版的专家们就已经论证过这个问题，但US+dynamic branch是未来趋势，高频+数量+优化应该能得到更高的performance,更大的flexibility,未来是光明的，哈哈

原帖由 Illuminati 于 2006-11-8 08:28 发表
不论怎么吹，也不能否认一个事实： G80 的 4D 处理能力 (也就是顶点和色彩的基本单位) 为 32 个每周期

看看现在的评测大吹什么 R580 只有 48 shader 而 G80 是 128 processor ... 不同的单位，能比么

希望 ...

ayanamei · 发表于 2006-11-8 10:21

FP16　＃
我在想要这么多半径度是照顾谁的？
NV3X? arithmetic:tex 这样的比例 NV3X有戏么？

Illuminati · 发表于 2006-11-8 10:22

高频+数量+优化

怎么看怎么像 Netburst...

Intel 已经碰壁了，不知道 GPU 什么时候碰壁

只看该作者 · 发表于 2006-11-8 10:23

提示: 作者被禁止或删除内容自动屏蔽

Illuminati · 发表于 2006-11-8 10:23

原帖由 ayanamei 于 2006-11-8 10:21 发表
FP16　＃
我在想要这么多半径度是照顾谁的？
NV3X? arithmetic:tex 这样的比例 NV3X有戏么？

其实 NV40 也是跑半精度要快一些，不是 ALU 的问题，是寄存器资源的问题

ayanamei · 发表于 2006-11-8 10:25

原帖由 Illuminati 于 2006-11-8 10:18 发表
我比较好奇的是遇到 nD 操作，G80 的 processor 是用多个单元单周期完成还是单个单元多周期完成

估计后者比较容易实现。这样的话，如果能再飚频率上去，比如跑 4 倍频，速度就能接近 4D SIMD 的水平了

话说Vertex 来说是典型的Vector 但是据测试。。G80跑这个也是快得比较离谱的说
VertexShader light test 1个-8 个性能无损失 1 light的时候就比NV40快了4倍。。8Light的时候就30多倍了。。
没记错数字的话

ayanamei · 发表于 2006-11-8 10:26

原帖由 Illuminati 于 2006-11-8 10:23 发表

其实 NV40 也是跑半精度要快一些，不是 ALU 的问题，是寄存器资源的问题

NV40的rigister情况不是很清楚不是比较Free的说么
具体情况不清楚这方面还有限制的话那么好吧　＃
多数情况下FP16也够用。。

toshibacom · 发表于 2006-11-8 10:27

原帖由 Illuminati 于 2006-11-8 10:13 发表
驱动替换 shader 代码，会被认为是 “不道德” 的行为，以前 “驱动作弊” 闹得还不够么

NV已经这么做过，并且坚定的人为这是“优化”，Futuremark最终在NV的压力面前也“承认”这是“优化”不是作弊，既然如此NV已经有前例，不会再被认为是“不道德”

帐号		自动登录	找回密码
密码			注册

RacingPHT 该用户已被删除	22^# 发表于 2006-11-8 09:58 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡

RacingPHT 该用户已被删除	26^# 发表于 2006-11-8 10:05 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡

RacingPHT 该用户已被删除	31^# 发表于 2006-11-8 10:14 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡

RacingPHT 该用户已被删除	36^# 发表于 2006-11-8 10:23 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡