|
一般科学计算最多是受内存带宽限制,延时可以想办法隐藏掉。
上面那个4B/flops还不是最极端的。
缓存解决了延时和带宽两个问题,主流处理器内存带宽从没有做到和缓存差不多的时候。
日本的矢量机通常有较多的register,缓存=0。
cray新设计的矢量机从x1开始倒是焊上了cache,估计是懒得解决延时的问题,而且还会便宜不少。
原帖由 Prescott 于 2007-11-26 23:45 发表 ![]()
内存带宽和延时可不一样,缓存主要还是解决延时的问题。内存可以做到带宽和缓存差不多,但是却永远没办法做到延时差不多。 |
|