POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Illuminati
打印 上一主题 下一主题

G80 是 32 管的

[复制链接]
101#
发表于 2006-11-8 12:58 | 只看该作者
原帖由 bamboo2006 于 2006-11-8 12:53 发表


别看前提,看题目,32条流水线?在说了,前提多了去的,别说硬要128/4=32,那么这贴不讨论也罢。

作Vector的时候 的确是相当于传统的 32 Shader 而且只有一个ALU
他的帖子是以一Vector应用为背景基础的讨论  结论自然也基于此
但是这是个极端的case
回复 支持 反对

使用道具 举报

102#
发表于 2006-11-8 12:59 | 只看该作者
原帖由 来不及思考 于 2006-11-8 12:53 发表


那么多4D有P用
SIMD并行性能保证100%么
thread和register能抓得到同样的比例么

scalar可以*4, vector却不能/4
大部分情况下,我敢说当前G7X和R5XX那些FLOPS都是废的


那当初NV40不搞成1D?那样不是灵活性更大么?也能设计更多的运算单元?
回复 支持 反对

使用道具 举报

103#
发表于 2006-11-8 13:01 | 只看该作者
原帖由 ayanamei 于 2006-11-8 12:51 发表

和关联性没啥关系
1D ALU本来就是为了打破关联性

那如何利用L1和L2?
回复 支持 反对

使用道具 举报

104#
发表于 2006-11-8 13:02 | 只看该作者
原帖由 shu0202 于 2006-11-8 13:01 发表

那如何利用L1和L2?

构架图上Cache之间都是互相连接的
这个就验证了 128sp 可以完成高度自由度工作
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
105#
发表于 2006-11-8 13:03 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

106#
发表于 2006-11-8 13:05 | 只看该作者
原帖由 shu0202 于 2006-11-8 12:59 发表


那当初NV40不搞成1D?那样不是灵活性更大么?也能设计更多的运算单元?

没有先进的threading manage技术作支持的时候 这么做GPU阻塞会更严重
做到这点还需要大量的寄存器  这样的晶体管开销  不利于控制成本
你看r580塞了多少晶体管就知道了 #r520 -r580 只提升了80m晶体管 可见这些东西占了多少
回复 支持 反对

使用道具 举报

107#
发表于 2006-11-8 13:06 | 只看该作者
原帖由 来不及思考 于 2006-11-8 13:03 发表



NV40没那么多闲晶体管
NV当时也没那么多闲钱烧

难道1D比4D设计更复杂?更占晶体管?
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
108#
发表于 2006-11-8 13:07 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

109#
发表于 2006-11-8 13:07 | 只看该作者
原帖由 ayanamei 于 2006-11-8 13:05 发表

没有先进的threading manage技术作支持的时候 这么做GPU阻塞会更严重
做到这点还需要大量的寄存器  这样的晶体管开销  不利于控制成本
你看r580塞了多少晶体管就知道了 #r520 -r580 只提升了80m晶体管 可 ...

多谢指点!
回复 支持 反对

使用道具 举报

110#
发表于 2006-11-8 13:10 | 只看该作者
我这次可是一看G80架构图上的L1和L2就傻眼了。NV为了获得充裕的运算资源真是不惜血本!
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
111#
发表于 2006-11-8 13:11 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

112#
发表于 2006-11-8 13:12 | 只看该作者
原帖由 shu0202 于 2006-11-8 13:10 发表
我这次可是一看G80架构图上的L1和L2就傻眼了。NV为了获得充裕的运算资源真是不惜血本!

这些东西是为了喂饱Tex fetch和Tex filter的
毕竟可是支持FP32 Textetch /filter啊...
回复 支持 反对

使用道具 举报

113#
发表于 2006-11-8 13:13 | 只看该作者
原帖由 来不及思考 于 2006-11-8 13:11 发表
G80的DXT5 tex cache有128KB

相当暴力的说 #=.=
回复 支持 反对

使用道具 举报

114#
 楼主| 发表于 2006-11-8 13:14 | 只看该作者
再来一个问题,G80 得 TMU filter 是 1D 还是 4D 得... :unsure:

还有前面的讨论,我从来也没有说过 4D ALU 可以满负荷运作,我只是说 1D 跑当前的游戏,或者是为 R600 设计的游戏的时候,也永远达不到满负荷运作罢了

还有我的标题是激进了点儿,可能让某些 Fans 反感,反感不要进来,我根本就没准备跟你们讨论(_(
回复 支持 反对

使用道具 举报

115#
发表于 2006-11-8 13:16 | 只看该作者
原帖由 Illuminati 于 2006-11-8 13:14 发表
再来一个问题,G80 得 TMU filter 是 1D 还是 4D 得... :unsure:

还有前面的讨论,我从来也没有说过 4D ALU 可以满负荷运作,我只是说 1D 跑当前的游戏,或者是为 R600 设计的游戏的时候,也永远达不到满负 ...

TMU绝对还是4D的 #一次tex动作 总不能从RGBA中抓一个值出来。。
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
116#
发表于 2006-11-8 13:17 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

117#
发表于 2006-11-8 13:18 | 只看该作者
原帖由 来不及思考 于 2006-11-8 13:17 发表



不能满负荷的是4D吧

1D多跑几个周期根本无所谓啊,反正4个1D就是1个4D :blink:

综合来说 这些利弊是比较容易看到的东西 NV悍然决定颠覆传统
至少可以肯定一点 这样做肯定是利大于弊
另外 !GPGPU的时代来临了
设计的时候不能光考虑图形这一块了
回复 支持 反对

使用道具 举报

118#
发表于 2006-11-8 13:26 | 只看该作者
那个,Tex Unit究竟是1350MHz还是575MHz啊……
我看3DMark06 Multi-Tex Fillrate测试和575MHz * 32Tex的理论值相当吻合嘛
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
119#
发表于 2006-11-8 13:32 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

120#
发表于 2006-11-8 13:42 | 只看该作者
还是不太明白G80的1D设计在nD环境下的超强效能。等待更多细节……
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2026-6-3 12:36

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表