原帖由 Eji 于 2008-6-25 20:26 发表
CFAA大部分都可以由ROP完成了,所以可以這麼說(大半不是shader AA)。
ATI 自己也這麼說、那麼能變快應該就是這個原因吧。
----
回過頭來說,很多人很關心的是R870 or RV770X2能不能打倒GT200之類的勝負,我 ...

这么说24SP/TPC x 6TPC似乎是个不错的选择,若此规模可以满足"55nm工艺下整合NVIO2“的话,GT200体系还有的玩:单路版切入9800GTX+与GTX 260之间的空档,2-way版正面同R700交锋。当然达成以上假设主要还得看55nm究竟为GT200调高了多少Shader上限。毕竟8TPC版的260对HD4870就够呛,缩成6TPC若还没有高频Shader帮助的话想必凶多吉少——55nm会是GT200体系的救世主吗?
原帖由 shu0202 于 2008-6-25 22:42 发表
NV的做法是提升每条US的灵活性和效能,逼对手用大量传统低效资源来和自己硬拼,从而拖垮对手。
AMD则是用数量换取效能,堆积大量效能较低但是结构简单的管线来从资源量上压过对手。
原帖由 shu0202 于 2008-6-25 23:09 发表
在工艺和资源都处于劣势的情况下NV继续维持标量架构的规模快速增长显然是不太可能了,NV必须在效能和资源密集度上取得平衡,但是NV是否来得及在较短时间内解决这个问题还是未知数。DX11的竞争迫在眉睫,DX10这一部分已经出现很大的危机,这种麻烦搞不好会影响下一代架构。
从RV770的表现来看,AMD有能力在45nm工艺上实现资源再反倍并且维持相对较低的成本,这对NV现有的东西是致命的威胁。
原帖由 水银 于 2008-6-25 20:56 发表
Larrabee不是many core,作为图形运算X86比shader多出来的众多指令有何意义?
larrabee会不会有个把X86指令拆成Shader能执行的简单指令呢,就像CICS to RISC那样
原帖由 shu0202 于 2008-6-25 22:58 发表
AMD疯狂扩充运算资源并未对外围设计造成沉重负担,反而游刃有余,除了纹理单元相应扩充之外,RV770只将线程分配部分的仲裁器和定序器增加了20个,这就足以维持160条管线的效能,这和GT200在线程调度上扩大的规模简直是天壤之别。
而且运算单元的强力扩充反而弥补了R600资源调度僵化的缺陷,10组TPC和GT200处于同一水平。NV反而将每组16PS变成了每组24PS来维持一个合理的规模。
原帖由 shu0202 于 2008-6-25 22:58 发表
AMD疯狂扩充运算资源并未对外围设计造成沉重负担,反而游刃有余,除了纹理单元相应扩充之外,RV770只将线程分配部分的仲裁器和定序器增加了20个,这就足以维持160条管线的效能,这和GT200在线程调度上扩大的规模简直 ...
原帖由 jhj9 于 2008-6-25 23:42 发表
我认为Larrabee的问题是在于到底有多少Fixed Unit,如果setup、rop、tmu都用x86跑,整体效率未免不足,这也是为什么用CPU来软渲染性能低下的原因之一。
原帖由 1empress 于 2008-6-25 23:58 发表
可能性很小吧 tsmc的55nm没法冲频率,但成本好看一些,
GT200就算做成55nm,频率冲不高的话,效能也很可疑
话说起来离DX11发布还有1年半,算是还有一次更新高端DX10产品的空间,双方全新设计应该都是留 ...
原帖由 1empress 于 2008-6-25 22:54 发表
3array x 8way SIM"T"(2x4D ALU with SFU、1D gather &scatter)
是4D shader ?
原帖由 我奏是马甲 于 2008-6-26 03:08 发表
eji……这个低级错误……rv670是55nm啊……何况跳过45nm直接40nm是tsmc自己的意思。
http://publish.it168.com/2008/0328/20080328037701.shtml
原帖由 我奏是马甲 于 2008-6-26 03:06 发表
GTX280/260现在不卖或变成火星卡的话,GT200b出来前情况就大了。而且从g92b的情况看来,55nm根本对功耗没有什么帮助,98GTX+居然功耗能秒掉90nm的88GTX,g92都没搞定的状况下GT200把宝都押在55nm上太不明智了。
原帖由 我奏是马甲 于 2008-6-26 04:57 发表
未必。RV670是什么时候出来的?tsmc40nm是什么时候宣布的?到今年11月的话55nm都实用一年,40nm宣布9个月了。年底前一定不能推出太武断了。gt200上55nm面积和770也依然是两个级别,对NV最快的方法是优化好G92的55nm版,出g92b2……解决得了功耗和拱频率的问题,和770还是可以一拼的
至于96GX2当笑话看看可以,即使55nm也有19X左右的面积,双PCB 19XX2的面积对4870?还不如大力气把96GT得到的经验来改进g92,其实更应该说是GT200的中端版GT240。如果240的128SP到160SP能优化到96GT X2的级别,那才有戏看
原帖由 我奏是马甲 于 2008-6-26 04:13 发表
就算转制程不麻烦,g92b现在这个状况,明眼人都知道55nm除了减成本带不来太多东西了。
eji讨论下GT200的中端大概性能系数?这点好像比较重要……不过话又说回来,如果GT200的中端做到55nm下300MM内,很难想象性能 ...
原帖由 Eji 于 2008-6-26 11:39 发表
不知道耶,和G8x/G9x相比,GT200系的TPC最大的修改就是register file整個double。
但是和高複雜度的share memory相比,其實從32KB擴大到64KB的register file並不會讓我覺得TPC整個會double.....
只是因為SM也增 ...
原帖由 Eji 于 2008-6-25 20:03 发表
G80的每個SM有24warp、共計16個SM,即384個warp、但每個warp由於只有32個threads,所以總計其實也是12288個thread
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |