POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Illuminati
打印 上一主题 下一主题

G80 是 32 管的

[复制链接]
21#
 楼主| 发表于 2006-11-8 09:56 | 只看该作者
建议 NV 搞一个 the way it's meant to be played 认证

游戏想通过认证必须把 shader 提交 nvidia 做检查,通过 1/2/3D 优化 (姑且这么叫) 的才能合格:loveliness:
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
22#
发表于 2006-11-8 09:58 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

23#
发表于 2006-11-8 09:59 | 只看该作者
原帖由 Illuminati 于 2006-11-8 09:46 发表
不是容易不容易的问题,而是开发人员的态度问题

大家开发了十来年的 3d,都是用的 SIMD,所以给人们留下的印象就是 2D/3D/4D 一样快,也就是额外的计算资源是 "免费" 的

而这种开发理念在 G80  ...

我倒觉得是减少 4D这种依存性  以适应不同的应用
G80不单纯是一块GPU

而且SIMD也不是100%好用
4D ALU FLOP/S  多数时候都是是虚的

1D ALU在大量4D 操作的时候  性能会受影响是必然的
但是这个能占到多少比例 是关键

而且NV必然也同样注意到了这个问题  所以才提高了 Shader单元的频率
最后折算下来虽然 峰值Flop/s 有所下降 但是可吃到的资源更多
但是不可否认 Scalar构架 Flop/s 要稳定而且可靠
相对Vector限制颇多
回复 支持 反对

使用道具 举报

24#
 楼主| 发表于 2006-11-8 10:02 | 只看该作者
G80 还是有胜算的:

对于已经出来的游戏: Shader 替换大法

对于还没出来的游戏: 砸钱大法


哈哈 开玩笑的,别介意
回复 支持 反对

使用道具 举报

25#
发表于 2006-11-8 10:04 | 只看该作者
原帖由 yehaku01 于 2006-11-8 10:01 发表


呵呵。G80其实就象P4那样高频低能。这样的架构对游戏软件和驱动的依赖性太强了。
如果不优化很难跑顺畅的。

完全不是一个概念的东西
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
26#
发表于 2006-11-8 10:05 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

27#
 楼主| 发表于 2006-11-8 10:08 | 只看该作者
那按道理 NFS10 应该在 NV30 上都跑的不慢了:lol:
回复 支持 反对

使用道具 举报

28#
发表于 2006-11-8 10:09 | 只看该作者
原帖由 Illuminati 于 2006-11-8 10:08 发表
那按道理 NFS10 应该在 NV30 上都跑的不慢了:lol:

NV30 有多少执行资源呢 #不光是寄存器的问题吧 #
回复 支持 反对

使用道具 举报

29#
发表于 2006-11-8 10:10 | 只看该作者
原帖由 Illuminati 于 2006-11-8 09:56 发表
建议 NV 搞一个 the way it's meant to be played 认证

游戏想通过认证必须把 shader 提交 nvidia 做检查,通过 1/2/3D 优化 (姑且这么叫) 的才能合格:loveliness:

既然NV的驱动可以搞定,那么游戏厂商为什么需要浪费时间自己去做1/2/3D 优化?NV可以给钱让游戏厂商优化,也可以把这些钱给驱动编写组作为加班费,可以一样达到效果。只要最终效果好,管他通过什么手段实现。
回复 支持 反对

使用道具 举报

30#
 楼主| 发表于 2006-11-8 10:13 | 只看该作者
驱动替换 shader 代码,会被认为是 “不道德” 的行为,以前 “驱动作弊” 闹得还不够么
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
31#
发表于 2006-11-8 10:14 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

32#
 楼主| 发表于 2006-11-8 10:18 | 只看该作者
我比较好奇的是 遇到 nD 操作,G80 的 processor 是用多个单元单周期完成还是单个单元多周期完成

估计后者比较容易实现。这样的话,如果能再飚频率上去,比如跑 4 倍频,速度就能接近 4D SIMD 的水平了
回复 支持 反对

使用道具 举报

33#
发表于 2006-11-8 10:20 | 只看该作者
半年前nv的“首席科学家”还有本版的专家们就已经论证过这个问题,但US+dynamic branch是未来趋势,高频+数量+优化应该能得到更高的performance,更大的flexibility,未来是光明的,哈哈


原帖由 Illuminati 于 2006-11-8 08:28 发表
不论怎么吹,也不能否认一个事实: G80 的 4D 处理能力 (也就是顶点和色彩的基本单位) 为 32 个每周期

看看现在的评测大吹什么 R580 只有 48 shader 而 G80 是 128 processor ... 不同的单位,能比么

希望 ...
回复 支持 反对

使用道具 举报

34#
发表于 2006-11-8 10:21 | 只看该作者
FP16 #
我在想要这么多半径度是照顾谁的?
NV3X? arithmetic:tex 这样的比例 NV3X有戏么?
回复 支持 反对

使用道具 举报

35#
 楼主| 发表于 2006-11-8 10:22 | 只看该作者
高频+数量+优化

怎么看怎么像 Netburst...

Intel 已经碰壁了,不知道 GPU 什么时候碰壁
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
36#
发表于 2006-11-8 10:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

37#
 楼主| 发表于 2006-11-8 10:23 | 只看该作者
原帖由 ayanamei 于 2006-11-8 10:21 发表
FP16 #
我在想要这么多半径度是照顾谁的?
NV3X? arithmetic:tex 这样的比例 NV3X有戏么?


其实 NV40 也是跑半精度要快一些,不是 ALU 的问题,是寄存器资源的问题
回复 支持 反对

使用道具 举报

38#
发表于 2006-11-8 10:25 | 只看该作者
原帖由 Illuminati 于 2006-11-8 10:18 发表
我比较好奇的是 遇到 nD 操作,G80 的 processor 是用多个单元单周期完成还是单个单元多周期完成

估计后者比较容易实现。这样的话,如果能再飚频率上去,比如跑 4 倍频,速度就能接近 4D SIMD 的水平了

话说Vertex 来说是典型的Vector 但是据测试。。G80跑这个也是快得比较离谱的说
VertexShader light test  1个-8 个 性能无损失    1 light的时候就比NV40快了4倍。。8Light的时候 就30多倍了。。
没记错数字的话
回复 支持 反对

使用道具 举报

39#
发表于 2006-11-8 10:26 | 只看该作者
原帖由 Illuminati 于 2006-11-8 10:23 发表


其实 NV40 也是跑半精度要快一些,不是 ALU 的问题,是寄存器资源的问题

NV40的rigister情况不是很清楚  不是比较Free的说么
具体情况不清楚  这方面还有限制的话  那么好吧 #
多数情况下FP16也够用。。
回复 支持 反对

使用道具 举报

40#
发表于 2006-11-8 10:27 | 只看该作者
原帖由 Illuminati 于 2006-11-8 10:13 发表
驱动替换 shader 代码,会被认为是 “不道德” 的行为,以前 “驱动作弊” 闹得还不够么

NV已经这么做过,并且坚定的人为这是“优化”,Futuremark最终在NV的压力面前也“承认”这是“优化”不是作弊,既然如此NV已经有前例,不会再被认为是“不道德”
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2026-6-3 21:00

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表