只需一步,快速开始
手机号码,快捷登录
原帖由 bamboo2006 于 2006-11-8 12:53 发表 别看前提,看题目,32条流水线?在说了,前提多了去的,别说硬要128/4=32,那么这贴不讨论也罢。
使用道具 举报
原帖由 来不及思考 于 2006-11-8 12:53 发表 那么多4D有P用 SIMD并行性能保证100%么 thread和register能抓得到同样的比例么 scalar可以*4, vector却不能/4 大部分情况下,我敢说当前G7X和R5XX那些FLOPS都是废的
原帖由 ayanamei 于 2006-11-8 12:51 发表 和关联性没啥关系 1D ALU本来就是为了打破关联性
原帖由 shu0202 于 2006-11-8 13:01 发表 那如何利用L1和L2?
原帖由 shu0202 于 2006-11-8 12:59 发表 那当初NV40不搞成1D?那样不是灵活性更大么?也能设计更多的运算单元?
原帖由 来不及思考 于 2006-11-8 13:03 发表 NV40没那么多闲晶体管 NV当时也没那么多闲钱烧
原帖由 ayanamei 于 2006-11-8 13:05 发表 没有先进的threading manage技术作支持的时候 这么做GPU阻塞会更严重 做到这点还需要大量的寄存器 这样的晶体管开销 不利于控制成本 你看r580塞了多少晶体管就知道了 #r520 -r580 只提升了80m晶体管 可 ...
原帖由 shu0202 于 2006-11-8 13:10 发表 我这次可是一看G80架构图上的L1和L2就傻眼了。NV为了获得充裕的运算资源真是不惜血本!
原帖由 来不及思考 于 2006-11-8 13:11 发表 G80的DXT5 tex cache有128KB
原帖由 Illuminati 于 2006-11-8 13:14 发表 再来一个问题,G80 得 TMU filter 是 1D 还是 4D 得... :unsure: 还有前面的讨论,我从来也没有说过 4D ALU 可以满负荷运作,我只是说 1D 跑当前的游戏,或者是为 R600 设计的游戏的时候,也永远达不到满负 ...
原帖由 来不及思考 于 2006-11-8 13:17 发表 不能满负荷的是4D吧 1D多跑几个周期根本无所谓啊,反正4个1D就是1个4D :blink:
本版积分规则 发表回复 回帖后跳转到最后一页
广告投放或合作|网站地图|处罚通告|
GMT+8, 2026-6-3 12:36
Powered by Discuz! X3.4
© 2001-2017 POPPUR.