原帖由 ZJRS 于 2007-2-21 01:19 发表
您还是没明白我的意思,我的意思是说,C1的SHADE在执行PS操作时操作会大于4D吗?一般不都是3D+1D的4D方式吗?如果是3 ...
原帖由 hourousha 于 2007-2-21 01:40 发表
LS又理解错了,ZJRS问的是C1在执行PS时是否能够4D+1D并发的问题,
他认为C1在执行PS时,4D+1D的并发会缩水为3D+1D或者4D+0D什么的,从而,C1性能在执行PS时缩水……
原帖由 hourousha 于 2007-2-21 01:40 发表
LS又理解错了,ZJRS问的是C1在执行PS时是否能够4D+1D并发的问题,他认为C1在执行PS时,4D+1D的并发会缩水为3D+1D或者4D+0D什么的,从而,C1性能在执行PS时缩水……
原帖由 ayanamei 于 2007-2-21 01:53 发表
=.= 其实这些东西都不是真正左右性能的 塞满这样的操作来达到peak不现实
但是8VS+24PS VS 48US 落差还是肯定有的
差距在US ,thread.register file等更主要的东西上 虽然C1这些东西都还不是很明了
C1可 ...
原帖由 ZJRS 于 2007-2-21 02:13 发表
=.= 其实这些东西都不是真正左右性能的 塞满这样的操作来达到peak不现实
但是8VS+24PS VS 48US 落差还是肯定有的
差距在US ,thread.register file等更主要的东西上 虽然C1这些东西都还不是很明了
C1可以操 ...
原帖由 ZJRS 于 2007-2-21 02:35 发表
呵呵,我也很差异这个大部分时间 2xALU都是无效的这个结论怎么来的呢.
原帖由 ZJRS 于 2007-2-21 02:35 发表
呵呵,算了,我也不想和你说什么了,我先把我要弄懂的再说.

原帖由 ZJRS 于 2007-2-21 01:59 发表
各位能详细的解答下小弟的问题吗?#19楼说的不全是,你也理解错了,我没有说4D+0D,可能是我没有表述清楚.还有如果真的是4D+1D不会变成3D+1D那么多出的1D矢量可以执行什么呢?这里是我最不理解的 ...
原帖由 Eji 于 2007-2-21 13:51 发表
喔,你是這個意思啊。
那麼答案是:沒錯,會空下來。
基本上4D+1D的兩個unit,最大指令數就是2個OP,可以接受1個1D與1D/2D/3D/4D。
如果送進去的指令是1D+3D的話,那麼就是由1D 與 4D unit去接受這兩個 ...
原帖由 ZJRS 于 2007-2-21 14:08 发表
我还想问个问题就是,在大多数情况下4D+1D的方式会有多少效率,在大多数情况下会充分利用4D+1D吗?应该都是3D+1D这样的吧.所以我认为在大多数情况下我认为在处理PS程序时4D+1D不会 ...
原帖由 Eji 于 2007-2-21 13:51 发表
所以,如果今天是三個指令,如3D + 1D + 1D、或是 2D+2D+1D 的話,那4D+1D的單元是無法一個cycle吃下去的。
原帖由 ZJRS 于 2007-2-21 14:49 发表
还有是不是PC的多数显卡在处理mad r0,r0,r1,v0 rsq r2.w,r3.w时,是否是用2个周期来完成,而C1可以一个周期来完成?
原帖由 ZJRS 于 2007-2-21 15:01 发表
还有大家也说了,而我的意思也表述了,PS的操作最大为4D,那这事,一个4D矢量处理不就完成了,而另一个1D这时应该没有作用啊。而大家误会我co-issue的问题,我想我还是说下,我并不是说4D+1D中的1 ...
原帖由 hourousha 于 2007-2-21 15:42 发表
这种问题本是应该在2003年底gz就已经解决的问题,冏……
原帖由 ZJRS 于 2007-2-21 16:10 发表
我不想在和你再弄什么了,你愿意解答下就解答下,不愿意就算了,我没勉强你,还有不要老误解我的意思.我没有讨论co-issue的问题,我上面说过了.你要非认为我在和你说co-issue的问题我也没办法.可能我也没懂你 ...
原帖由 graphiccard 于 2007-2-21 06:26 发表
回主题
要是PC下有GOW,用高配跑的效果绝对比叉烧包360下跑出来的效果好很多
原帖由 ZJRS 于 2007-2-21 16:21 发表
如果PS指令如果大多数情况下需要额外处理其他1D指令,我想大部分PC显卡也早就在其PS部分使用了4D+1D这种方式.我喜欢说峰值但是也是正常情况下的。你所说4D+1D也根本是是经常出现,所以我说他代表 ...
原帖由 hourousha 于 2007-2-21 16:50 发表
我还告诉你,RSX的‘峰值’的‘非常规性’比C1还要高。因为前者还要保证没有TMU操作,明白?哦,想必你是明白不了的……
原帖由 hourousha 于 2007-2-21 17:18 发表
哪里来这么多mini ALU,无非就是ALU和SFU之类的外加个nrm_pp单元,还有就是指令发射宽度问题……
原帖由 graphiccard 于 2007-2-21 14:41 发表
斑竹
这个是在co-issue失效的情况下,还是任何情况下呢?
要是是任何情况下的话,那搞成4D+1D~那不是很没有多大意义么?:unsure:
原帖由 ZJRS 于 2007-2-21 17:29 发表
呵呵,你可以指责我错误啊,我就你提出我的错误有异议不可以?我需要对你负什么则?就是峰值又怎样?我就算 32*5*2*500=160GFLOPS,那也没有RSX高啊.
原帖由 hourousha 于 2007-2-21 15:33 发表
对于3D+1D的运算单元,上述指令需要2周期来执行。
对于4D+1D的运算单元,上述指令需要1周期来执行。
对于RSX是24x(4D+4D),所以上述指令对于一条完整的RSX的PS流水线,在没有纹理贴图操作时,可以一周期完成 ...
原帖由 Eji 于 2007-2-21 19:45 发表
嗯.... 我記得RSX是兩個 4D+1D ?
原帖由 yxmmxy 于 2007-2-21 20:42 发表
别说PC了,任何能玩游戏的机器目前都没有比GOW好的游戏
原帖由 hourousha 于 2007-2-21 19:49 发表
我记得只有后藤大爷还是西川二叔的文章中这么写过一次……
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |