|
从内部互联的角度,CPU 和GPU 的差距是显著的,CPU 的双核多核,理论上都没有内部互联,而通过共享cache 来交换数据,好处是简单透明,坏处是没有显式的数据交换,共享内存来交换数据,就要考验MC 和Cache 的数据共享机理了。AMD 04年推出的HT,到现在尚没有开花结果,期望QPI 能有广泛应用。
GPU 的互联其实也不很早,从US 开始,GPU 内部的组织,如同CUDA 的Cluster 描述,就是一个类似cluster 结构,互联的成本越来越高,Larrabee 的ring bus 可能是其在GPU 上折戟沉沙的关键原因。
相比较而言,CUDA 的层次结构,要好很多,这样在TPC SM 各层如果能够动态从组,有可能形成更加灵活的通用计算平台,这样可以极大降低CUDA 可编程性的困难。现在AMD 在做GPU 的multi-core,而从基础架构看,nVidia CUDA 架构更适合multi-core 设计,看nVidia 什么时候动手了,我想产品上应该至少在开发状态了。 |
|