POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
12
返回列表 发新帖
楼主: eeerrr
打印 上一主题 下一主题

关于G80架构的一个问题

[复制链接]
21#
发表于 2009-4-20 20:30 | 只看该作者
這個限制是為了配合硬體設計,畢竟G80它底層是4D SIMD unit的綁定,所以這些和issue time slot關係比較大。
回复 支持 反对

使用道具 举报

22#
发表于 2009-4-27 13:55 | 只看该作者
我上来学习。。。好高深,看不大懂
回复 支持 反对

使用道具 举报

23#
发表于 2009-4-29 01:19 | 只看该作者
我上来学习。。。好高深,看不大懂.看高手们讲解。
回复 支持 反对

使用道具 举报

24#
发表于 2009-5-6 09:46 | 只看该作者
這個限制是為了配合硬體設計,畢竟G80它底層是4D SIMD unit的綁定,所以這些和issue time slot關係比較大。
Eji 发表于 2009-4-20 08:30 PM

能请E大说具体些么?小弟想知道,4D变成1D*4是在编译器上实现的还是在硬件上提供了将多个1D打包装入4D一起运算来实现逻辑上的1D*4?那么不同指令之间的延迟怎么解决呢?
肯请E大不吝赐教,谢谢!
回复 支持 反对

使用道具 举报

25#
发表于 2009-5-6 11:51 | 只看该作者
其实 G80 或者 GT200 的 front-end 细节大家知道的并不多,只是从执行的效果来看,可以看作是 scalar 的效果。
回复 支持 反对

使用道具 举报

26#
发表于 2009-5-6 12:51 | 只看该作者
其实 G80 或者 GT200 的 front-end 细节大家知道的并不多,只是从执行的效果来看,可以看作是 scalar 的效果。
Edison 发表于 2009-5-6 11:51 AM

那这样说的话,G80所谓的标量设计就全是逻辑层面的东西,也就是说,只是程序员看到的结构,而真正的硬件实现的方法是4D SIMD,这也正是英伟达设计的巧妙之处了吧?感觉这个具体操作方法可是商业机密了,呵呵
回复 支持 反对

使用道具 举报

27#
发表于 2009-5-6 20:23 | 只看该作者
那这样说的话,G80所谓的标量设计就全是逻辑层面的东西,也就是说,只是程序员看到的结构,而真正的硬件实现的方法是4D SIMD,这也正是英伟达设计的巧妙之处了吧?感觉这个具体操作方法可是商业机密了,呵呵
complexmind 发表于 2009-5-6 12:51


这个解释也初学者很合适:〉
相当于一种封装。不过要是把4D改成8D,那就圆满了。至少在图形模型下这个解释没有问题。

在CUDA模式下,还需要更深入的理解。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-25 06:29

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表