|
|
原帖由 来不及思考 于 2007-7-21 00:22 发表 ![]()
cache的hit rate,主要依赖的是时间区域性和空间区域性,这两点在GPU上的环境都不具备
GPU的绝大多数对外部存储器的读取请求(定址),都是发生在计算之后,是没有办法进行预测和prefetch的
因此GPU不会配 ...
为什么说在GPU上不具备?
没有cache是不可想象的,就算有multi-thread也不可能掩盖从memory到GPU那么长的延时,照你说gpu 是基于cache miss设计的, 如果没有prefetch, 那么你算算要多少个thread才够 |
|