|
原帖由 Eji 于 2008-3-11 21:33 发表 ![]()
唔,我既然這篇寫要說好話,我就很不希望作出"批評"....不過要寫的話還是可以寫一些。
今天我們可以從G94看到,NVIDIA的結構效率是高得多的,而且電晶體的數量也比較少。
die size會比較大,單純是因為NVIDI ...
"比方說,RV770到底是4bank x 40個shader,還是5bank x 32個shader?還是8bank x20個shader、甚至是10bank x16個shader?毫無疑問地,更改幅度必然會受到bank數影響而越來越大,而以盡量不更改設計來考量的話,4x40顯然是最可能的;而且不管是哪種更改,分支變化其實都是一樣的(成長到160個pixel or vertex per branch)....
然後NVIDIA目前的分支粒度,還是維持在32個pixel or 16個vertex。因為registerfile是成對的,所以G8x/G9x的規模其實光看電晶體數量就已經讓人覺得要比ATIR5x0目前的延伸好上太多,因為它的規模每一份的效率都是一定的,ATI的強化卻總是會把架構上的缺陷越挖越大,你要維持分支粒度、提升性能的同時又不提升規模,唯一的方式就是從memory hierarchy來下工夫,天下沒有白吃的午餐啊。"
但不能隻增加shader數目而不改變bank數量啊.......雖然多塞shader顯得容易,可是不改進仲裁器,threading資源就遠遠不夠,不是說AMD每個simd都有分支unit么???強化這部分到底能挽救多少呢? |
|