GT300(該叫GF100了)最後重整shader unit規模,減少register file這點看起來蠻棒的....
單一SM的warp數量有增有減沒錯,但是贅肉刪一刪之後還是讓他們塞進了full-speed DP,然後還有cache hierarchy。
話說很有趣的是,現在GF100的register file和shared memory/L2 cache的總和各自比較起來,幾乎剛好1:1....
Register file = 32bit x 524288 = 2MB
shared memory + L1 cache + L2 cache = 1024KB + 768KB
可以看得出來NVIDIA想求面面俱到啊....XD
(當然32core的Larrabee就有8MB了) |