POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
12
返回列表 发新帖
楼主: 3dfxfover
打印 上一主题 下一主题

ATI和NV构架效率问题

[复制链接]
21#
发表于 2008-6-22 01:50 | 只看该作者
显而易见的问题
这代ati的芯片设计本身就有问题
低能架构
扶不起来的阿斗
回复 支持 反对

使用道具 举报

22#
发表于 2008-6-22 07:25 | 只看该作者
原帖由 zuiniubi 于 2008-6-22 01:50 发表
显而易见的问题
这代ati的芯片设计本身就有问题
低能架构
扶不起来的阿斗

:p PCI经典的结论
回复 支持 反对

使用道具 举报

jackpeng33 该用户已被删除
23#
发表于 2008-6-22 08:14 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

24#
发表于 2008-6-22 08:36 | 只看该作者
其实应该比较 效能/集体管
多少个sp实现方式不同,需要的资源不同
回复 支持 反对

使用道具 举报

25#
发表于 2008-6-22 09:24 | 只看该作者
800:320性能达不到2.5:1很正常,类似的例子已经非常多了。当年4×2结构的fx30/35被8×1的R300整翻就是例子了。两路cpu并行也远达不到1cpu×2的性能,sli/cf也都一样。
我觉得这次ati的失误类似于fx30.指令并行的效果本来就有非常大的弹性,估计很多时候,尤其是theway游戏里面,能够并行的指令比较有限,最坏的情况下是320/5=64打128,再加上频率低的影响。
至于800对320,会不会是因为并行程度增高导致的进一步恶化?还是真的没有塞进去?还是内存总线变化了?俺就不清楚了,高人拿证据吧
回复 支持 反对

使用道具 举报

kamuiyay 该用户已被删除
26#
发表于 2008-6-22 10:12 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

27#
发表于 2008-6-22 20:34 | 只看该作者
之所以在这里说了这么多,其实主要还是觉得,过去时我们能简单通过管线数目、显存带宽、辅助晶体管数目就能大致推测一个显卡的性能。
而到了DX10时代,这个标准确变得很主观 很模糊 很难把握:
1. 没有测试,我们什么都推测不到。
2. 同样硬件,一个驱动就是天翻地覆的变化,"神 - 油"背后到底干了什么。
3. 厂家越来越喜欢玩弄概念,没有解决实质的问题而单单喊了很多口号,我们是否有必要为这些概念买单。

不只是我一个人关注这个问题。
http://www.equn.com/forum/viewthread.php?tid=18626&page=1#pid248708
看到一个有意思的回复:
Hi All,

I read a debate going on in the forums as to why ATI core is givingless PPD compared to NVIDIA core. And I see many reasons givenincluding the wu's assigned are different (Definitely that also willimpact) as well as MAYBE NVidia core is NOT DOING Science work justCredit work (ONLY possible if someone has goofed up major whileProgramming - LESS LIKELY because I am sure lot of testing has occuredwithin fah stanford group before releasing the GPU beta to the world.)

For a long time (From the time AMD and NVIDIA came out with Unifiedshaders) I have had a thought in my mind, which seems to be playing outnow if the PPD results are valid (i.e no programming error some where).So let me start =>


EVERYONE has to REALIZE the difference in definition of SPs betweenATI/AMD and NVIDIA. To be frank I would say the way ATI named theirsingle SP has SP is a kind of JOKE (in some ways) compared to NVIDIA.

Based on what I have read about the NVIDIA and ATI GPU Architectures onthe Net (Haven't had time nor a ATI card at hand to write code toverify this yet)

IN NVIDIA __EACH SP__ is capable of doing either FP32 or Integer (ALL ops) or Special_functions.
WHILE
IN AMD __FOR EACH Group of 5 SPs ONLY ONE SP__ can do FP32 orInteger_MUL or Special function, while the other 4 SP can only doSIMPLE INTEGER operations.

So if the code is doing lot of FP operations or special functions orInteger_MUL IN EFFECT one gets only 1/5 th the number of SPs in ATI ascompared to what ATI claims as SPs i.e A ATI chip with 320 SPs is ineffect ONLY 64 SPs. So obviously a ATI performance will be only 50%compared to NVIDIA in the WORST CASE.

However in practice one would find that ATI GPUs will give bit moreperformance than the WORST CASE Mentioned above because IF one can mixthe FP32/IntegerMUL/Special_Functions with Simple_Integer ops then theother 4 SPs out of the 5 SP group in ATI can be utilized. Thusimproving over the WORST CASE which I mentioned.

SO BEFORE JUMPING AND CONCLUDING may be WE have to think of the realityinterms of what is ATI 320 SIMPLE SPs worth compared to NVIDIA 128 FULLSPs.

Note: Also one more thing which can aid ATI a bit could be the betterbranch/thread (i.e independent code) granularity in ATI compared toNVidia. But still the 128 Full SPs in NVidia vs 64 Full SPs in AMD/ATImay not help much for ATI wrt this granularity if the Vector sizes onwhich the operations are occuring are large.

Just my thoughts. Happy to get constructive feedback, even to theextent of telling that my thoughts are rubbish, provided it is backedtechnically. I am starting this thread mainly to understand the G80/G92core VS R600 core architecture/programming advantages/disadvantages.

Keep
HanishKVChanishkvc

这个人的推测倒是告诉了我们一个简单的换算公式,按照AMD的设计,如果继续把SP数目作为硬件指标进行对比的话,AMD和NVIDIA的实际比值是5:1
也就是说
3650的实际SP是120/5 = 24  对应 8600GT的SP数目为32 8500GT是16,3650性能刚好在两者之间
3850的实际SP是320/5= 64 对应 9600GT的SP数目为64,3850性能刚好类似于9600GT
4850的实际SP是800/5=160 超过了8800GT的112,8800GT完败,也超过了9800GTX的128,确实打得标准版的9800GTX无还手之力 只有推出超频版的9800GTX+来对抗
很有趣的是很现实的计算方法。
回复 支持 反对

使用道具 举报

kamuiyay 该用户已被删除
28#
发表于 2008-6-22 21:48 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

29#
发表于 2008-6-22 22:15 | 只看该作者
这样的帖子不得不支持
回复 支持 反对

使用道具 举报

30#
发表于 2008-6-22 22:23 | 只看该作者
有什么难想的````
9800GTX的运算能力简单理解是128 X1688=216XXX
4850因为是4D+1D的计算方式.5D其实就是2个SP
就是800/5 X2 X624=20000

同样算法3870和9600GT差不多.性能就是如此
回复 支持 反对

使用道具 举报

31#
发表于 2008-6-22 22:29 | 只看该作者
R600的shader unit是1D*5的VLIW,不是简单的4D+1D。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-12-1 18:08

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表