那你的意思是分布式计算可以代替大型主机?
InfiniBand这种延迟优先(当然带宽也不低)的互联可以去领便当 ...
brl 发表于 2010-8-12 23:30 ![]()
有些不对吧~~~
即使是单节点内部,延迟大虽然对性能也有一定程度的影响,但很多情况下总有方法去隐藏。例如PCIE延迟大,那我可以想办法提高计算密集度,或者计算和数据传输overlap;DRAM延迟大,有缓存机制,GPU里有shared memory等减少外存访问次数的机制;执行流水线和访存延迟大,GPU里就搞了硬件轮换机制去隐藏延迟。总之所做的一切就是尽量让带宽和吞吐量接近理论值。
可以再看看DRAM和总线的发展历程:DRAM从SDRAM发展到现在DDR3,延迟没多大改进,带宽却翻了N倍。总线从PCI-AGP-PCIE,同样延迟没什么改进,也是带宽翻N倍。 |