|
本帖最后由 ic.expert 于 2009-8-13 16:57 编辑
关键是他如何能够让HW很好的加速FPL风格的Shading Language~~ 以及如何和现有的Application之间作过渡~~。反正现在的CUDA上面是跑不了很高效的FPL的。LRB有這个能力,但是效率上FPL不是LRB的强项,LRB的强项在于片内NUMA,而片外Message Passing/NUMA ~ 而FPL在很多Functional Calculation之间的数据传输都是是Regular Stream Fashion的。不过这不代表支持Pure FPL处理器就是一个Stream Processor,毕竟有些访问也需要 Random Accsss/Irregular Stream形式,比如在MIPMAP上做Texture Fetch,或是H264中的Movtion Estimation等运算都不是Regular Data Access,当然,这也分Application不同而不同,不能一棒子打死。所以如何兼容FPL这需要仔细权衡GPU Arch。
我现在正做么一个GPU Arch Simulator。不过还没有完成,大牛如果有高见,还要多多批评:〉下面是那个开源Simulator的链接
http://www.opengpu.org/bbs/viewthread.php?tid=558&extra=page%3D1 |
|