只需一步,快速开始
手机号码,快捷登录
Fermi管线中有专门负责双精度运算的DP向量单元,运行目前的游戏它不能被充分利用;未来光线追踪游戏也许会采 ... shu0202 发表于 2009-12-3 10:08
Fermi的管线应该是分成两部分,一部分用于单精度运算,另一部分则是二者兼顾,而在双精度运算时,前者应该事 ... shu0202 发表于 2009-12-3 12:33
使用道具 举报
30亿+的晶体管默认SP频率跑到1700,老大你相信吗? 这样单双精度和NV官方数据差距太大了不说,以现在的良 ... zxjike 发表于 2009-12-3 13:37
嗯,我也觉得不可能差距太大,理论说Tesla 版本应该是最优秀的核心吧?差不多Tesla 能达到的频率也就是游 ... zxjike 发表于 2009-12-3 13:52
现在看来,这个ECC对SP频率会不会有影响还是未知数,个人估计只是对显存的速度和延迟影响更大一些吧。 zxjike 发表于 2009-12-3 13:58
L2 cache 对于寄存器溢出、游戏物理计算上会有非常大的助益。 Edison 发表于 2009-12-3 13:31
GPU内存Cache的ECC如果关闭的话如何实现我倒是很感兴趣,不大可能设计2款大芯片出来吧?我更倾向于这部分 ... zxjike 发表于 2009-12-3 14:08
显存可以通过显存控制器轻松实现,现在来看费米的显存不是通过增加显存颗粒来实现的硬ECC,而是通过牺牲显 ... zxjike 发表于 2009-12-3 14:24
Fermi管线中有专门负责双精度运算的DP向量单元,运行目前的游戏它不能被充分利用;未来光线追踪游戏也许会采用双精度算法,全速运转的DP单元会占用几乎所有数据资源,管线中另外的普通运算单元又会闲置。 ECC机制遍布于缓存和内存控制当中,当然要占用带宽而导致实际带宽降低…… shu0202 发表于 2009-12-3 10:08
我觉得L2 cache对于加速shader指令的处理/装载速度会有帮助,但对图形性能不一定有大的帮助,图形性能基本都在像素处理上;处理所有像素之前,shader指令只装载一次就好了,接下来就是等待像素处理。请E大指教。 gz_easy 发表于 2009-12-3 14:03
GPU multi-threading结构的本质是计算和访存的解耦,on-chip cache是非常重要的一个载体 Asuka 发表于 2009-12-3 15:10
费米再差也比5870好,NV出道以来唯一失败的核心是NV30! qf1919 发表于 2009-12-2 20:00
解耦关键靠并行计算的程序设计,如果代码里存在高度耦合,再好的构件也没用, 必须为多线程的硬件程序改写 ... gz_easy 发表于 2009-12-3 15:37
本版积分规则 发表回复 回帖后跳转到最后一页
广告投放或合作|网站地图|处罚通告|
GMT+8, 2025-9-7 20:15
Powered by Discuz! X3.4
© 2001-2017 POPPUR.