G80 是 32 管的

ayanamei · 发表于 2006-11-8 12:58

原帖由 bamboo2006 于 2006-11-8 12:53 发表

别看前提，看题目，32条流水线？在说了，前提多了去的，别说硬要128/4=32，那么这贴不讨论也罢。

作Vector的时候的确是相当于传统的 32 Shader 而且只有一个ALU
他的帖子是以一Vector应用为背景基础的讨论结论自然也基于此
但是这是个极端的case

shu0202 · 发表于 2006-11-8 12:59

原帖由 来不及思考 于 2006-11-8 12:53 发表

那么多4D有P用
SIMD并行性能保证100%么
thread和register能抓得到同样的比例么

scalar可以*4， vector却不能/4
大部分情况下，我敢说当前G7X和R5XX那些FLOPS都是废的

那当初NV40不搞成1D？那样不是灵活性更大么？也能设计更多的运算单元？

shu0202 · 发表于 2006-11-8 13:01

原帖由 ayanamei 于 2006-11-8 12:51 发表

和关联性没啥关系
1D ALU本来就是为了打破关联性

那如何利用L1和L2?

ayanamei · 发表于 2006-11-8 13:02

原帖由 shu0202 于 2006-11-8 13:01 发表

那如何利用L1和L2?

构架图上Cache之间都是互相连接的
这个就验证了 128sp 可以完成高度自由度工作

只看该作者 · 发表于 2006-11-8 13:03

提示: 作者被禁止或删除内容自动屏蔽

ayanamei · 发表于 2006-11-8 13:05

原帖由 shu0202 于 2006-11-8 12:59 发表

那当初NV40不搞成1D？那样不是灵活性更大么？也能设计更多的运算单元？

没有先进的threading manage技术作支持的时候这么做GPU阻塞会更严重
做到这点还需要大量的寄存器这样的晶体管开销不利于控制成本
你看r580塞了多少晶体管就知道了　＃r520 -r580 只提升了80m晶体管可见这些东西占了多少

shu0202 · 发表于 2006-11-8 13:06

原帖由 来不及思考 于 2006-11-8 13:03 发表

NV40没那么多闲晶体管
NV当时也没那么多闲钱烧

难道1D比4D设计更复杂？更占晶体管？

只看该作者 · 发表于 2006-11-8 13:07

提示: 作者被禁止或删除内容自动屏蔽

shu0202 · 发表于 2006-11-8 13:07

原帖由 ayanamei 于 2006-11-8 13:05 发表

没有先进的threading manage技术作支持的时候这么做GPU阻塞会更严重
做到这点还需要大量的寄存器这样的晶体管开销不利于控制成本
你看r580塞了多少晶体管就知道了　＃r520 -r580 只提升了80m晶体管可 ...

多谢指点！

shu0202 · 发表于 2006-11-8 13:10

我这次可是一看G80架构图上的L1和L2就傻眼了。NV为了获得充裕的运算资源真是不惜血本！

只看该作者 · 发表于 2006-11-8 13:11

提示: 作者被禁止或删除内容自动屏蔽

ayanamei · 发表于 2006-11-8 13:12

原帖由 shu0202 于 2006-11-8 13:10 发表
我这次可是一看G80架构图上的L1和L2就傻眼了。NV为了获得充裕的运算资源真是不惜血本！

这些东西是为了喂饱Tex fetch和Tex filter的
毕竟可是支持FP32 Textetch /filter啊...

ayanamei · 发表于 2006-11-8 13:13

原帖由 来不及思考 于 2006-11-8 13:11 发表
G80的DXT5 tex cache有128KB

相当暴力的说　＃=.=

Illuminati · 发表于 2006-11-8 13:14

再来一个问题，G80 得 TMU filter 是 1D 还是 4D 得... :unsure:

还有前面的讨论，我从来也没有说过 4D ALU 可以满负荷运作，我只是说 1D 跑当前的游戏，或者是为 R600 设计的游戏的时候，也永远达不到满负荷运作罢了

还有我的标题是激进了点儿，可能让某些 Fans 反感，反感不要进来，我根本就没准备跟你们讨论(_(

ayanamei · 发表于 2006-11-8 13:16

原帖由 Illuminati 于 2006-11-8 13:14 发表
再来一个问题，G80 得 TMU filter 是 1D 还是 4D 得... :unsure:

还有前面的讨论，我从来也没有说过 4D ALU 可以满负荷运作，我只是说 1D 跑当前的游戏，或者是为 R600 设计的游戏的时候，也永远达不到满负 ...

TMU绝对还是4D的　＃一次tex动作总不能从RGBA中抓一个值出来。。

只看该作者 · 发表于 2006-11-8 13:17

提示: 作者被禁止或删除内容自动屏蔽

ayanamei · 发表于 2006-11-8 13:18

原帖由 来不及思考 于 2006-11-8 13:17 发表

不能满负荷的是4D吧

1D多跑几个周期根本无所谓啊，反正4个1D就是1个4D :blink:

综合来说这些利弊是比较容易看到的东西 NV悍然决定颠覆传统
至少可以肯定一点这样做肯定是利大于弊
另外！GPGPU的时代来临了
设计的时候不能光考虑图形这一块了

Travis · 发表于 2006-11-8 13:26

那个，Tex Unit究竟是1350MHz还是575MHz啊……
我看3DMark06 Multi-Tex Fillrate测试和575MHz * 32Tex的理论值相当吻合嘛

只看该作者 · 发表于 2006-11-8 13:32

提示: 作者被禁止或删除内容自动屏蔽

shu0202 · 发表于 2006-11-8 13:42

还是不太明白G80的1D设计在nD环境下的超强效能。等待更多细节……

帐号		自动登录	找回密码
密码			注册

来不及思考该用户已被删除	105^# 发表于 2006-11-8 13:03 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	108^# 发表于 2006-11-8 13:07 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	111^# 发表于 2006-11-8 13:11 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	116^# 发表于 2006-11-8 13:17 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	119^# 发表于 2006-11-8 13:32 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡