POPPUR爱换

标题: PConline说G80的每个SP都能并行计算MADD/MUL,峰值浮点520GFLOPS [打印本页]

作者: rongronglulu    时间: 2006-11-8 23:42
标题: PConline说G80的每个SP都能并行计算MADD/MUL,峰值浮点520GFLOPS
思考兄曾经在这里提出疑问的,对G80的shader能力。
http://we.pcinlife.com/viewthrea ... mp;highlight=shader


结果,虽然是1D的,但是太平洋说是能并行MADD/MUL,所以浮点能力应该是
128*(1*2+1)flops*1.35GHz=518.4GFLOPS
和太平洋说的520恰好符合:lol:

各位大大觉得对吗:a)
作者: skywalker_hao    时间: 2006-11-8 23:45
不是pconline说的,是nv自己说的
至于那个3xx的说法,最早出现在b3d
作者: rongronglulu    时间: 2006-11-8 23:50
这么说是思考兄当年提的问题早就解决了?我还以为没解决呢:a)
作者: 来不及思考    时间: 2006-11-9 00:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: rongronglulu    时间: 2006-11-9 09:33
顶上去!
发现PCinlife的评测中怎么还是345.6GFLOPS???
还有X1950怎么变成249.6GFLOPS了??



都错了吧!
作者: rongronglulu    时间: 2006-11-9 09:38
是太平洋错了
还是pcinlife错了

cho解释一下阿
作者: rongronglulu    时间: 2006-11-9 09:51
技术性的问题就没人理的:mad:
作者: 阿蓝2代    时间: 2006-11-9 10:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-11-9 10:11
当然345.6GFLOPS才是正确的答案,实际测试是311GFLOPS。
作者: rongronglulu    时间: 2006-11-9 11:37
原帖由 Edison 于 2006-11-9 10:11 发表
当然345.6GFLOPS才是正确的答案,实际测试是311GFLOPS。

那X1900xtx呢?这位那么变那么少了??

实际上不是应该是
48*((3d+1d)+(3d+1d)*2)=374.4GFLOPS吗?
以前pcinlife的文章也提到过是这个值,现在怎么变249.6了??
作者: pliflier    时间: 2006-11-9 11:47
518GF是算成了co-issue的结果吧,从图上看G8没有co-issue
作者: Illuminati    时间: 2006-11-9 11:47
pop 这破文章,竟然说 G80 是 64 TMU

其实应该是 32 TMU, 64 TFU
作者: Edison    时间: 2006-11-9 11:50
R580的主ALU是48*(3D+1D)*2FLOP/cycle,次ALU在是做modifier用的。

在实际的测试中R580的GFLOPS是182.5GLOPS。
作者: RacingPHT    时间: 2006-11-9 12:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: zl841226    时间: 2006-11-9 12:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-11-9 12:06
原帖由 RacingPHT 于 2006-11-9 12:02 发表
cho怎么测出来的?
nv的PDF自己说是520G呀.


GPUBench的指令issue测试。

B3D的测试结果和我一样。
作者: RacingPHT    时间: 2006-11-9 12:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-11-9 12:14
原帖由 RacingPHT 于 2006-11-9 12:09 发表
哪个issue测试只能得出相同指令的co-issue, 如果不同指令的issue是不能测的吧.
不过修改一下他的代码应该可以.


反正目前是看不到双MUL的存在。

MUL测试出来是155.8712 BIPS,除以1.35GHz就是115,接近128 SP而不是256 MUL ALU。
作者: RacingPHT    时间: 2006-11-9 12:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-11-9 12:16
G80的co-issue只存在于组合成MAD的单个MUL+单个ADD,这是目前的结果。
作者: RacingPHT    时间: 2006-11-9 12:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-11-9 12:23
如果有空,你可以写个严谨一点的指令发射能力测试,我跑跑看,这样更好。
作者: RacingPHT    时间: 2006-11-9 12:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: clawhammer    时间: 2006-11-9 12:40
7900GTX ROP 24个?
弄错了吧:wacko: :wacko:
作者: 阿蓝2代    时间: 2006-11-9 14:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: RacingPHT    时间: 2006-11-9 15:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: rongronglulu    时间: 2006-11-10 00:25
原帖由 Edison 于 2006-11-9 11:50 发表
R580的主ALU是48*(3D+1D)*2FLOP/cycle,次ALU在是做modifier用的。

在实际的测试中R580的GFLOPS是182.5GLOPS。

什么叫做modifier用的?能解释一下吗
作者: rongronglulu    时间: 2006-11-10 00:25
原帖由 RacingPHT 于 2006-11-9 15:25 发表
借个地方放放~
刚写的issue测试程序。

有人测好了吗?
G80的结果如何??
作者: rongronglulu    时间: 2006-11-10 13:49
顶上去。。。。
作者: RacingPHT    时间: 2006-11-10 13:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: ft5555    时间: 2006-11-10 14:05
前两个附件ti4200    300g/s               :wacko:
作者: RacingPHT    时间: 2006-11-10 14:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: rongronglulu    时间: 2006-11-10 14:47
原帖由 RacingPHT 于 2006-11-10 13:56 发表
结果是, 目前OpenGL和D3D都没有发现co-issue的迹象.

你的那个测试不对吧
你还是做了MAD MAD迸发呀

应该是MAD MUL迸发!
作者: rongronglulu    时间: 2006-11-10 16:30
顶上去~~~~~~~~~~~~~~
作者: rongronglulu    时间: 2006-11-10 17:08
RacingPHT去哪里了
作者: RacingPHT    时间: 2006-11-10 17:13
提示: 作者被禁止或删除 内容自动屏蔽
作者: rongronglulu    时间: 2006-11-10 17:38
原帖由 RacingPHT 于 2006-11-10 17:13 发表
你有时间顶贴,不如好好看一下那个测试顶上的一行字吧

我看过亚,都是mad!
作者: rongronglulu    时间: 2006-11-10 17:43
原帖由 RacingPHT 于 2006-11-10 17:13 发表
你有时间顶贴,不如好好看一下那个测试顶上的一行字吧


你指的是那个press a,s?我按了没反应!
作者: rongronglulu    时间: 2006-11-10 17:51
RacingPHT解释一下,那个为什么按A,S都没有反应的
作者: rongronglulu    时间: 2006-11-10 17:59
搞定了,输入法的问题

RacingPHT能解释一下,后面两个压缩包有什么区别吗?
作者: RacingPHT    时间: 2006-11-10 18:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2006-11-10 19:23
按照Uttaa的说法,那个MUL应该是指SFU。
作者: rongronglulu    时间: 2006-11-10 23:05
原帖由 RacingPHT 于 2006-11-10 18:11 发表
目前以最后一个包为准。
现在有问题,NV的卡没有发现ADD + ADD的co-issue.

最后一个也没有ADD+ADD的co-issue
我在6600GT上测的。
作者: jhj9    时间: 2006-11-11 00:23
7900GS的测试结果:

Shader = MAD_MAD_1D_Issue
Issue Rate: 48.13G instr/s

Shader = ADD_ADD_1D_Issue
Issue Rate: 46.74G instr/s

Shader = MUL_MUL_1D_Issue
Issue Rate: 47.07G instr/s

Shader = MAD_ADD_1D_Issue
Issue Rate: 46.77G instr/s

Shader = MAD_MUL_1D_Issue
Issue Rate: 47.05G instr/s

Shader = MAD_MAD_4D_Issue
Issue Rate: 24.15G instr/s

Shader = ADD_ADD_4D_Issue
Issue Rate: 23.76G instr/s

Shader = MUL_MUL_4D_Issue
Issue Rate: 24.28G instr/s

Shader = MAD_ADD_4D_Issue
Issue Rate: 24.24G instr/s

Shader = MAD_MUL_4D_Issue
Issue Rate: 24.24G instr/s
作者: rongronglulu    时间: 2006-11-11 07:46
原帖由 jhj9 于 2006-11-11 00:23 发表
7900GS的测试结果:

Shader = MAD_MAD_1D_Issue
Issue Rate: 48.13G instr/s

Shader = ADD_ADD_1D_Issue
Issue Rate: 46.74G instr/s

Shader = MUL_MUL_1D_Issue
Issue Rate: 47.07G instr/s

Sh ...

你的7900GS流水线,频率是多少??
作者: RacingPHT    时间: 2006-11-11 10:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: aixiangsui2012    时间: 2012-1-27 17:54
看来近几年进步不大啊




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4