|
原帖由 Prescott 于 2007-12-7 10:51 发表 ![]()
记住,G90的518GFLOPS来自于MADD和MUL的dual issue,如果指令比例不均匀,或者没有MADD,518GFLOPS打个对折都是客气的。即便是G100要想达到象G90这种类型的2TFLOPS,芯片规模起码要加大4倍。
LRB的512bit SIMD可以 ...
dual issue难以填满的话, vector也不容易吧 (即便都是图形处理这种应用)? 还有就是NV的thread强的多, LRB只有100多个, 人家可是成千上万啊. G100我不知道是怎么做的, 是否是和G9x一个思路不清楚, 总归不会没有一点进化吧, 芯片规模好像LRB也不小. 另外基于X86的东西, 终归有无数的兼容性要考虑, 是正确选择么? 兼容以前的软件, 在图形市场, 真的重要么
软件上可能也有问题:
比图形的话, LRB的驱动能赶上NV的?
比通用(高性能)计算的话: CUDA我感觉比CT要好, 至少在现阶段 (MS已经在standford和UCLA开课了, ecosystem逐渐建立中).
总体说来, 我对LRB 1不太乐观 |
|