|
本帖最后由 ic.expert 于 2009-8-12 12:58 编辑
不然就是空中楼阁~~ 做体系结构是要理解本质,每块芯片的体系结构都不同,为什么Intel使用了集总保留站,而AMD用了分布保留站~?为什么NV4X到NV50的功耗会变化那么大?为什么CUDA里面会多了一个Shared Memory,而不使用其他的线程通讯方法,在图形模式下真的没有这个设备么?等等等等。
量化至少要读个四五遍再说~~
关于Shared Memory,我相信很多人都会回答“没有!”。这个答案对于写CUDA程序的人,我是可以理解的。但是,如果是做GPU Arch的人,那就大大不应该了,因为情况并没有这么简单,说好听了体系结构永远都是一种权衡的艺术,说不好听了体系结构就是一个和稀泥的活儿。 |
|