原帖由 RacingPHT 于 2008-8-8 14:36 发表 ![]()
这个在Larrabee中有提到:
"Because thread or task scheduling is under programmer control,
tasks that operate on these data structures can be dynamically rebundled
to maintain SIMD efficiency. For example, a ray tracer’s
secondary reflection rays may be re-bundled differently than the
primary camera rays that generated them."
SIMD束可以进行重新打包,以提高SIMD单元的利用率。
不过这个做法是有程序员进行的,而不是硬件执行。硬件可能提供比较便利的ISA来进行支持。
有關聯性的thread 打包起來執行的意思嗎?
這讓我想到GT200的warp vote.... 避免分支造成必須循序執行的狀況。
Larrabee也有mask register來做類似的工作。
話說對share memory/scratchpad我是有點意見,programmer會比較喜歡無腦的cache還是要自己分配的scratchpad? |