POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3353|回复: 5
打印 上一主题 下一主题

many core 互联和GPU 架构

[复制链接]
跳转到指定楼层
1#
发表于 2009-8-16 11:44 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
从内部互联的角度,CPU 和GPU 的差距是显著的,CPU 的双核多核,理论上都没有内部互联,而通过共享cache 来交换数据,好处是简单透明,坏处是没有显式的数据交换,共享内存来交换数据,就要考验MC 和Cache 的数据共享机理了。AMD 04年推出的HT,到现在尚没有开花结果,期望QPI 能有广泛应用。
GPU 的互联其实也不很早,从US 开始,GPU 内部的组织,如同CUDA 的Cluster 描述,就是一个类似cluster 结构,互联的成本越来越高,Larrabee 的ring bus 可能是其在GPU 上折戟沉沙的关键原因。
相比较而言,CUDA 的层次结构,要好很多,这样在TPC SM 各层如果能够动态从组,有可能形成更加灵活的通用计算平台,这样可以极大降低CUDA 可编程性的困难。现在AMD 在做GPU 的multi-core,而从基础架构看,nVidia CUDA 架构更适合multi-core 设计,看nVidia 什么时候动手了,我想产品上应该至少在开发状态了。
2#
发表于 2009-8-16 13:36 | 只看该作者
目前还没有看到 Larrabee 的游戏实测数据,怎么会那么快就能判断出它折戟沉沙

Fermi 在层次架构的改进会是比较大的。

还有就是,我觉得在 GPU 上以多核为目标似乎有点画蛇添足,实际上做一个简单的 scheduling 或者增加一个简单的 CPU 就很足够了。
回复 支持 反对

使用道具 举报

3#
发表于 2009-8-16 15:37 | 只看该作者
这放在这个版有损本论坛形象啊
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2009-8-16 15:42 | 只看该作者
2# Edison
内部数据吧,Larrabee 24C能够达到GTX280 的游戏性能,就很满意了。
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2009-8-16 15:46 | 只看该作者
2# Edison
这里的多核不是目标,而只是手段,片上互联的成本,如果能够以相对简单的层次化网络替代,可以把效率提高而成本相对不高。
回复 支持 反对

使用道具 举报

6#
发表于 2009-8-16 15:54 | 只看该作者
以目前来说,多核 GPU 的好处可能就是可以"暴力"的方式跑多个 kernel 而已。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-5-2 10:02

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表