只需一步,快速开始
手机号码,快捷登录
原帖由 Edison 于 2008-8-12 12:56 发表 Telsa 的 4GB 版应该比较少会出现 PCIE 的瓶颈问题吧,除非是整天需要和 CPU 的数据进行密集而细小数据块的修改等动作。
使用道具 举报
原帖由 Prescott 于 2008-8-12 12:20 发表 其实我想说的就是,很多App并不适合CUDA这种模型 {lol:]
原帖由 shu0202 于 2008-8-17 10:16 发表 我也想问几个光栅器是什么意思?另外标量单元的效能怎样能媲美向量单元?除非是4倍的频率。
原帖由 RacingPHT 于 2008-8-17 10:28 发表 现在没有gpu是标量单元。即便是G80, 也是内部使用SIMD单元,然后使用横向shuffle给人以标量单元的感觉。 Larrabee也是这种设计。
原帖由 Edison 于 2008-8-17 14:01 发表 对于这种说法我问过 NVIDIA 的人,但是他们非常肯定地否定了这个说法,坚持 NV50 的 SP 是 scalar 架构,当然我倒是觉得更像是 super-scalar(MAD+MUL)。
原帖由 RacingPHT 于 2008-8-17 22:16 发表 我的说法可能有误,即G80也许根本不需要进行shuffle, 而是直接就对象素组进行scalar操作。 SP确实scalar, 但是SP根本就不是一个独立的处理器, 即没有独立的PC。既然一组SP共享一个PC, 那么这完全就是Vector SIM ...
本版积分规则 发表回复 回帖后跳转到最后一页
广告投放或合作|网站地图|处罚通告|
GMT+8, 2025-8-28 23:52
Powered by Discuz! X3.4
© 2001-2017 POPPUR.