POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
12
返回列表 发新帖
楼主: CC9K
打印 上一主题 下一主题

如果NV得不到X86授权,但得到AVX指令的授权

[复制链接]
21#
发表于 2010-8-13 00:23 | 只看该作者
那你的意思是分布式计算可以代替大型主机?
InfiniBand这种延迟优先(当然带宽也不低)的互联可以去领便当 ...
brl 发表于 2010-8-12 23:30


有些不对吧~~~
即使是单节点内部,延迟大虽然对性能也有一定程度的影响,但很多情况下总有方法去隐藏。例如PCIE延迟大,那我可以想办法提高计算密集度,或者计算和数据传输overlap;DRAM延迟大,有缓存机制,GPU里有shared memory等减少外存访问次数的机制;执行流水线和访存延迟大,GPU里就搞了硬件轮换机制去隐藏延迟。总之所做的一切就是尽量让带宽和吞吐量接近理论值。
可以再看看DRAM和总线的发展历程:DRAM从SDRAM发展到现在DDR3,延迟没多大改进,带宽却翻了N倍。总线从PCI-AGP-PCIE,同样延迟没什么改进,也是带宽翻N倍。
回复 支持 反对

使用道具 举报

22#
发表于 2010-8-13 00:24 | 只看该作者
AVX对CUDA的编程模型来说是倒退
darkstorm 发表于 2010-8-11 22:14


其实两者都不是一个层次的东西
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-14 16:10

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表