原帖由 G81 于 2006-11-3 12:13 发表
从各种资料来看,G80就是顶点,像素渲染分离的.G80那128个 渲染单元其实是128个可执行1D操作的ALU,R600是64个可执行4D操作的ALU.G80的设计初衷就是要把渲染单元"打散",以量取胜,现在的G71是24*2个4D AL ...
原帖由 G81 于 2006-11-3 12:13 发表
从各种资料来看,G80就是顶点,像素渲染分离的.G80那128个 渲染单元其实是128个可执行1D操作的ALU,R600是64个可执行4D操作的ALU.G80的设计初衷就是要把渲染单元"打散",以量取胜,现在的G71是24*2个4D AL ...
原帖由 killpmp 于 2006-11-3 12:22 发表
现在还在说G80是分离架构的那是脑子烧坏掉的表现
G80是不折不扣的统一渲染架构,统一程度比R600和C1还要彻底,128个Stream Processor可以任意指派做PS/VS/GS的任务,根本就不存在Shader这个概念
G80的设计初 ...
原帖由 yehaku01 于 2006-11-3 12:26 发表
在微软的DX10支持下R600将是最接进DX10硬件统一渲染架构的GPU
而且以后的Vista平台上开发的游戏也更能和R600相容。G80的技术已经落后了。
看看新出的NSF10就知道了。以后这样的平台开发的游戏会更多。:loveliness:
原帖由 saintangel 于 2006-11-3 12:11 发表
以ROP衡量性能完全无稽之谈
楼主脑袋被门夹了吧
NV40/R420也都是内建16个ROP,从NV40-G71 ROP数量可没有任何提升
原帖由 G81 于 2006-11-3 12:36 发表
ROP的数量为24个话标志着G80每个时钟周期可以处理24个像素,而之前的G71以及G70都是内建16个ROP单元,而ROP的数量决定着显示卡的最终效率,因此从ROP单元来看G80并没有太强,也不是之前估计的32个。
原帖由 zl841226 于 2006-11-3 12:38 发表
晕,搞的好象ROP想做几个做几个一样。:wacko:
原帖由 G81 于 2006-11-3 12:36 发表
ROP的数量为24个话标志着G80每个时钟周期可以处理24个像素,而之前的G71以及G70都是内建16个ROP单元,而ROP的数量决定着显示卡的最终效率,因此从ROP单元来看G80并没有太强,也不是之前估计的32个。
原帖由 ayanamei 于 2006-11-3 12:39 发表
现在的应用都是密集Shader型,给你32个ROP同样是无米下炊
真正左右性能的是Shader,而ROP数量只是一个峰值像素输出值而已
原帖由 G81 于 2006-11-3 12:45 发表
关键就是G80每个时钟周期只能处理24个像素,遭遇到了瓶径,而ROP的数量就是那个瓶径
原帖由 killpmp 于 2006-11-3 12:22 发表
现在还在说G80是分离架构的那是脑子烧坏掉的表现
G80是不折不扣的统一渲染架构,统一程度比R600和C1还要彻底,128个Stream Processor可以任意指派做PS/VS/GS的任务,根本就不存在Shader这个概念
G80的设计初 ...
原帖由 大死人花 于 2006-11-3 12:48 发表
请问G80所谓的“统一程度”那里比R600和C1还要彻底?
原帖由 ayanamei 于 2006-11-3 12:47 发表
事实上 现在复杂Shader 一个像素处理可能就需要若干的周期 甚至上百个周期
你ROP在Shader完成之前就是闲置的 你要那么多ROP干什么?
你真以为在什么情况下图形卡每周期都能输出8个以上像素? 莫名其妙
原帖由 dennis 于 2006-11-3 12:50 发表
C1 的Shader不是彻底打散的,只能是16个一组进行分配。G80是完全打散的,可以任意分配。
原帖由 G81 于 2006-11-3 12:51 发表
反正ROP的数量和CPU的FSB一样,是多多益善!总不至于越少越好?你说是吗?:lol:
原帖由 zl841226 于 2006-11-3 12:54 发表
R580是48个PIXEL SHADER ?还有48个4D+1D ALU?w00t)
原帖由 G81 于 2006-11-3 12:51 发表
反正ROP的数量和CPU的FSB一样,是多多益善!总不至于越少越好?你说是吗?:lol:
原帖由 ayanamei 于 2006-11-3 13:02 发表
现在游戏都是走Shader密集线路
够用就好了 再多就是浪费 为对性能没啥影响的东西多花钱又意义么
ROP的重要性远远不如CPU的FSB OK?
原帖由 大死人花 于 2006-11-3 12:52 发表
G80是128个能处理1D的ALU?还是128个Shader?
原帖由 G81 于 2006-11-3 13:13 发表
我只知道瓶子里的水在多,瓶口太小也出不来。
原帖由 dennis 于 2006-11-3 13:13 发表
2样都有w00t)
事实上,把G80里面的执行单元说成Shader显然低估了它。G80里面Stream Processor能做的事情已经远远超过C1里面Shader的范畴
原帖由 G81 于 2006-11-3 13:24 发表
原帖由 ayanamei 于 2006-11-3 13:17 发表
那你怎么推断出24ROP就“太小”呢
因为G80惊人的38.4Gpixel/s的這個fillrate
原帖由 dennis 于 2006-11-3 13:13 发表
2样都有w00t)
事实上,把G80里面的执行单元说成Shader显然低估了它。G80里面Stream Processor能做的事情已经远远超过C1里面Shader的范畴
原帖由 shu0202 于 2006-11-3 13:32 发表
半年后就会有人说G80是DX10残废卡。
原帖由 G81 于 2006-11-3 13:34 发表
现在就是产费的
原帖由 dennis 于 2006-11-3 13:13 发表
2样都有w00t)
事实上,把G80里面的执行单元说成Shader显然低估了它。G80里面Stream Processor能做的事情已经远远超过C1里面Shader的范畴
原帖由 ayanamei 于 2006-11-3 13:02 发表
现在游戏都是走Shader密集线路
够用就好了 再多就是浪费 为对性能没啥影响的东西多花钱又意义么
ROP的重要性远远不如CPU的FSB OK?
原帖由 shu0202 于 2006-11-3 13:32 发表
半年后就会有人说G80是DX10残废卡。
原帖由 大死人花 于 2006-11-3 13:38 发表
是不是以前显卡中Shader > ALU,而G80是一个 ALU > ’传统意义的shader‘ ?G80的1D ALU能处理VS/PS/GS?
那R600中的shader和ALU有是什么情况?
另外论计算能力是不是如下?
G80是 128*1*1350
...
原帖由 大死人花 于 2006-11-3 13:38 发表
是不是以前显卡中Shader > ALU,而G80是一个 ALU > ’传统意义的shader‘ ?G80的1D ALU能处理VS/PS/GS?
那R600中的shader和ALU有是什么情况?
另外论计算能力是不是如下?
G80是 128*1*1350
...
原帖由 zl841226 于 2006-11-3 13:42 发表
R580的不是4D+1D的ALU,而是一个PSU内,1个4DALU一个1D ALU~~~~:wacko:
ALU就是基本运算单元,你那个SHADER>ALU什么意思呀:wacko:
原帖由 zl841226 于 2006-11-3 13:42 发表
R580的不是4D+1D的ALU,而是一个PSU内,1个4DALU一个1D ALU~~~~:wacko:
ALU就是基本运算单元,你那个SHADER>ALU什么意思呀:wacko:
原帖由 zl841226 于 2006-11-3 13:42 发表
R580的不是4D+1D的ALU,而是一个PSU内,1个4DALU一个1D ALU~~~~:wacko:
ALU就是基本运算单元,你那个SHADER>ALU什么意思呀:wacko:
原帖由 dennis 于 2006-11-3 12:50 发表
C1 的Shader不是彻底打散的,只能是16个一组进行分配。G80是完全打散的,可以任意分配。
原帖由 zl841226 于 2006-11-3 14:04 发表
问下这个为什么是1D+3D??:huh::huh:
原帖由 clawhammer 于 2006-11-3 12:20 发表
原来显示器上所有像素的工作都是由ROP完成的
原来ROP=显卡
原来ROP数量=绝对性能
原帖由 G81 于 2006-11-3 12:13 发表
从各种资料来看,G80就是顶点,像素渲染分离的.G80那128个 渲染单元其实是128个可执行1D操作的ALU,R600是64个可执行4D操作的ALU.G80的设计初衷就是要把渲染单元"打散",以量取胜,现在的G71是24*2个4D AL ...
原帖由 G81 于 2006-11-3 12:51 发表
反正ROP的数量和CPU的FSB一样,是多多益善!总不至于越少越好?你说是吗?:lol:
原帖由 G81 于 2006-11-3 12:45 发表
关键就是G80每个时钟周期只能处理24个像素,遭遇到了瓶径,而ROP的数量就是那个瓶径
原帖由 Edison 于 2006-11-3 14:25 发表
ROP的作用就是吐出结果像素或者中间像素,多少个ROP意味着每个周期能吐出多少个像素,24个ROP就是每个周期吐出24个pixel,G80@575MHz就是13.8GPixles/s
现在的ROP都具备MSAA能力,在"像素操作"的计 ...
原帖由 G81 于 2006-11-3 12:51 发表
反正ROP的数量和CPU的FSB一样,是多多益善!总不至于越少越好?你说是吗?:lol:
原帖由 G81 于 2006-11-3 15:37 发表
问题在于24个ROP每个周期只能吐出24个象素,是否多余的象素就被浪费了呢?
原帖由 ayanamei 于 2006-11-3 13:26 发表
峰值Fillrate只是一个理论值 不等于性能
现阶段
最后能够实现多少Fillrate取决于Shader复杂度 和Shader单元是否足够强劲
你对图形就一点概念都没有 就别来鹦鹉学舌
原帖由 ayanamei 于 2006-11-3 15:48 发表
:wacko: 靠 你知不知道这个填充律是怎么出来的
什么乱七八糟的 怎么会出现多余的像素 !#
原帖由 G81 于 2006-11-3 15:37 发表
问题在于24个ROP每个周期只能吐出24个象素,是否多余的象素就被浪费了呢?
原帖由 G81 于 2006-11-3 15:52 发表
g71 有 16 rop,但是却有着 24条象素流水线,由于一次只能吐出16个象素,那么另外的8个不是浪费了么?
原帖由 G81 于 2006-11-3 15:52 发表
g71的ROP有16个,但是却有着 24条象素流水线,由于一次只能吐出16个象素,那么另外的8个不是浪费了么?
原帖由 ayanamei 于 2006-11-3 15:55 发表
你有没有看我上面说的话
24个shader 但是每个shader不可能一个周期就完成 至少大部分都需要很多个周期
所以16个ROP基本上在实际游戏中是没多大可能每个周期能输出16个像素的
ROP在现在的应用中多数时间 ...
原帖由 zl841226 于 2006-11-3 15:57 发表
你还真以为是管.线呀,一根一根的w00t) w00t)
原帖由 G81 于 2006-11-3 15:59 发表
如果16个ROP没可能输出16个象素,那NV设计那么多shader是吃屎的?
原帖由 G81 于 2006-11-3 15:59 发表
如果没可能,那NV设计那么多shader是吃屎的?
原帖由 ayanamei 于 2006-11-3 16:06 发表
正因为Shader不能够Pre cyc完成
所以才需要Shader单元 > ROP单元数倍的设计
不同的quad的PS在执行的Shader有可能是不同的 所以不同的Quad输出的周期也是不同的 所以多个Shader是交错着输出给ROP的
...
原帖由 G81 于 2006-11-3 16:09 发表
shader number>rop number 多少是最佳?
原帖由 ayanamei 于 2006-11-3 16:10 发表
看软件走势...这个比例只会越来越大
ROP应该会在24这个规模停留很久
除非以后1080i 4xAA 16xAF 成为主流 ROP规模才可能需要继续提高
原帖由 G81 于 2006-11-3 16:13 发表
据说,G80 有 512bit MC ,是否有 32个ROP呢?
原帖由 ayanamei 于 2006-11-3 16:14 发表
现在G80没有512BIT 这个规格
原帖由 G81 于 2006-11-3 16:15 发表
eji说过有
原帖由 大死人花 于 2006-11-3 16:25 发表
当初X1300不是ROP太少很被6600GT压制么?
原帖由 大死人花 于 2006-11-3 16:25 发表
当初X1300不是ROP太少很被6600GT压制么?
原帖由 大死人花 于 2006-11-3 16:25 发表
当初X1300不是ROP太少很被6600GT压制么?
原帖由 jhj9 于 2006-11-3 16:30 发表
X1300只是ROP少吗?
TMU也少,Shader效率也低。
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |