|
回复 #61 RacingPHT 的帖子
1. en, reasonable.
2. 如果512bit SIMD为真,那Larrabee的单精度peak可以是51.2Gflops@1.6G,当然在找到512bit宽的数据并行度之前,这个数字只是浮云。如果拿这个当被除数peak,Larrabee也太吃亏了点。:p
3. 如果是同样的任务,PPE和SPE都充分优化,这种情况怎么会发生呢?SPE当然沾了LS的光,数据和指令带宽应该都不是问题,但是PPE的cache也不是摆设啊。
5. 这个有没有实际的指令序列或者源代码可以研究? |
|