POPPUR爱换

标题: 昨夜好梦连连,祝各位都心平气和 好好反省自己 [打印本页]

作者: kidding    时间: 2007-2-1 16:32
标题: 昨夜好梦连连,祝各位都心平气和 好好反省自己
1。先说大家都关心的那个:上代旗舰R580是48/16/16/16 ATCZ ALU/TEX/COLOR/ZOUTPUT,而这代的玩意 梦中好像是 A多一点 T/C还是一样 Z么多一点
具体性能大概是这样地 并且不断优化中
2。5X Z  non-AA than R580
2。7 X FP16 blend fillrate than R580
3.9 X FP32 blend fillrate than R580
8 x FP16 filtering than R580
都是做梦 都是做梦 千万别当真
2。65UM的低档版128BITDX10显卡竟然用了GDDR4 和DIGIT PWM奢侈啊 PCB用了8层 太过分鸟
3。这代的旗舰注定用猴票版本了,即将大批量,目前没有采用更先进工艺的计划,这个也是做梦,胡扯的。
4。希望大家好好讨论,不用贬低对手,河蟹社会:loveliness:
作者: Edison    时间: 2007-2-1 16:46
R580不存在HW的fp filtering,是采用shader执行。

过去消耗在双线性过滤的操作 数是:4 multiplies+3 adds+2 subs=9 ops x4 channels = 36 ops,不考虑存取延迟等因素,大概需要9个周期完成一个pixel的texture bi-linear filtering。

现在8倍,就是大约1个(加上存取延迟或者别的因素=两个?)周期完成,所以肯定是硬件bi-linear fp texture filtering。
作者: 催化剂    时间: 2007-2-1 16:48
rv630

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr4@B101 PCB model

rv610

single pwm for gpu

256MB/128MB 64bit ddr2@B169 PCB medel
作者: phk    时间: 2007-2-1 16:49
原帖由 Edison 于 2007-2-1 16:46 发表
R580不存在HW的fp filtering,是采用shader执行。

过去消耗在双线性过滤的操作 数是:4 multiplies+3 adds+2 subs=9 ops x4 channels = 36 ops,大概需要9个周期完成一个pixel的texture bi-linear filtering ...


这么一说,R5XX的FP16 HDR AA是用shader方式实现的?我以前听Eji也是这么一说的,请教请教:)
作者: T.John    时间: 2007-2-1 16:49
快上市了,不用做梦了:lol:

原帖由 催化剂 于 2007-2-1 16:48 发表
rv630

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr4@B101 PCB model

rv610

single pwm for gpu

256MB/128MB 64bit ddr2@B169 PCB medel



这个够可以的

[ 本帖最后由 T.John 于 2007-2-1 16:50 编辑 ]
作者: phk    时间: 2007-2-1 16:50
原帖由 催化剂 于 2007-2-1 16:48 发表
rv630

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr4@B101 PCB model

rv610

single pwm for gpu

256MB/128MB 64bit ddr2@B169 PCB medel


和G86/84一样的MC位宽:huh:
作者: ayanamei    时间: 2007-2-1 16:51
原帖由 phk 于 2007-2-1 16:49 发表


这么一说,R5XX的FP16 HDR AA是用shader方式实现的?我以前听Eji也是这么一说的,请教请教:)


用Shader 作filter
作者: kidding    时间: 2007-2-1 16:57
催化剂童子估计是AIB厂商地,因为63/61已放出来了,哈哈 不过泻小米要泻的有艺术,不要被AMD抓住辫子,小心为妙
催童子看不到新旗舰地GERBER和SPEC,我这有,哪天私下探讨,哈
俺是奉旨泄密,没关系
作者: 我系高手!    时间: 2007-2-1 17:02
不知道gddr4/dpwm的价格如何,
如果贵的话,对普通消费者来说绝对不是好消息
作者: kidding    时间: 2007-2-1 17:06
GDDR4 是YY的
DPWM大批量买是有特惠的,实在不行就买NEXSEM和INTERSIL的货 便宜啊
真正大批量上市的肯定是各厂想方设法COST DOWN的版本 :loveliness:
作者: Edison    时间: 2007-2-1 17:06
从z roll-out能力来看,我认为这里的x是在812MHz上衡量的理论值。

R580的架构是16个render back-end,每个可以做到2 Zixel per cycle。

R580@650MHz的zixel roll out能力就是 16*2*650MHz=20800M zixle/second。

5倍就是20800*5=104000M zixle/second。

DX10的要求是做到8RT的MRT能力,假设R600具备8 Zixel per cycle的能力,per back end的Z-roll out能力就是,104000M zixle/second /8 = 13000M zixle/second。

这个时候,有16、24、32 render back end的选择。。

13000/16=812MHz
13000/24=541MHz
13000/32=406MHz

根据之前的报道,R600不可能低于700MHz的规格,可以估计出这里衡量的R600峰值规格应该是在812MHz*16(8 Zixel per cycle)或者812MHz*32(4 Zixel per cycle)的水平。


修正:

从z roll-out能力来看,我认为这里的x是在812MHz上衡量的理论值。

R580的架构是16个render back-end,non-AA的时候每个可以做到1 Zixel per cycle。

R580@650MHz的zixel roll out能力就是:16*1*650MHz=10400M zixle/second。

2.5倍就是10400M*2.5=26000M zixle/second。

DX10的要求是做到8RT的MRT能力,假设R600具备8 Zixel per cycle的能力,per back end的Z-roll out能力就是,26000M zixle/second /8 = 3250M zixle/second;倘若是4 Zixel per cycle,就是6500M zixle/second;倘若是2 Zixel per second,就是13000M zixle/second。

这个时候,有16、24、32 render back end的选择。。

noAA render back-end的能力为1 zixels per second、render back-end为32时的频率:26000/32= 812 MHz
noAA render back-end的能力为1 zixels per second、render back-end为16时的频率:26000/16= 1625 MHz
noAA render back-end的能力为1 zixels per second、render back-end为24时的频率:13000/24= 1083 MHz

noAA render back-end的能力为2 zixels per second、render back-end为32时的频率:13000/32= 406MHz
noAA render back-end的能力为2 zixels per second、render back-end为16时的频率:13000/16= 812MHz
noAA render back-end的能力为2 zixels per second、render back-end为24时的频率:13000/24= 542MHz

noAA render back-end的能力为4 zixels per second、render back-end为32时的频率:6500/16= 203MHz
noAA render back-end的能力为4 zixels per second、render back-end为16时的频率:6500/16= 406MHz
noAA render back-end的能力为4 zixels per second、render back-end为24时的频率:6500/24= 271MHz


根据之前的报道,R600不可能低于700MHz的规格,可以估计出这里衡量的R600峰值规格应该是在812MHz*32(1 Zixel per cycle)、812MHz*16(2 Zixel per cycle)的水平。

作者: phk    时间: 2007-2-1 17:09
原帖由 kidding 于 2007-2-1 17:06 发表
GDDR4 是YY的
DPWM大批量买是有特惠的,实在不行就买NEXSEM和INTERSIL的货 便宜啊
真正大批量上市的肯定是各厂想方设法COST DOWN的版本 :loveliness:


发布日期具体说说啊:wub:
作者: 催化剂    时间: 2007-2-1 17:12
G84

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr3@P40x PCB model
作者: xkm1948    时间: 2007-2-1 17:13
提示: 作者被禁止或删除 内容自动屏蔽
作者: 催化剂    时间: 2007-2-1 17:14
我是瞎猜的,谁知道猜得准不准呀,哈哈:lol:
作者: kidding    时间: 2007-2-1 17:27
:loveliness: CHO童子猜得真满准地,哈
催童子猜测能力更可观,把PCB编号的个位数都猜对了 不改行做6合彩真可惜:lol:
作者: phk    时间: 2007-2-1 17:31
原帖由 kidding 于 2007-2-1 17:27 发表
:loveliness: CHO童子猜得真满准地,哈
催童子猜测能力更可观,把PCB编号的个位数都猜对了 不改行做6合彩真可惜:lol:


老编之前报导双G说法,不攻自破:loveliness:
作者: kidding    时间: 2007-2-1 17:32
ELWIN童子 我这些消息都是听NV的童子说的 不知道准不准:p
作者: kidding    时间: 2007-2-1 17:35
破双G是没问题的,关键是良率控制在多少,这个P童子不要抓住别人辫子不放,一旦到65后猴版的600都有破G的版本鸟
:loveliness:
作者: niwei_123    时间: 2007-2-1 17:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: niwei_123    时间: 2007-2-1 17:43
提示: 作者被禁止或删除 内容自动屏蔽
作者: phk    时间: 2007-2-1 17:49
原帖由 kidding 于 2007-2-1 17:35 发表
破双G是没问题的,关键是良率控制在多少,这个P童子不要抓住别人辫子不放,一旦到65后猴版的600都有破G的版本鸟
:loveliness:


65nm的代号不叫R600w00t)
作者: kidding    时间: 2007-2-1 17:58
1。所以俺说猴版的600
2。NIWEI童子的预测好像和NV透露的不太一样 :loveliness:
作者: xkm1948    时间: 2007-2-1 18:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: fineday    时间: 2007-2-1 18:39
原帖由 kidding 于 2007-2-1 17:27 发表
:loveliness: CHO童子猜得真满准地,哈
催童子猜测能力更可观,把PCB编号的个位数都猜对了 不改行做6合彩真可惜:lol:

:p 搞不好PCB就是催化剂画的
作者: SpitDragon    时间: 2007-2-1 19:50
G84的PCB莫非是P406?
之前有报道暗示了
作者: 菜鸟来啦    时间: 2007-2-1 20:27
:huh: 只能来支持 看不懂
作者: 阿蓝2代    时间: 2007-2-1 20:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2007-2-1 20:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: 大死人花    时间: 2007-2-1 20:57
原帖由 来不及思考 于 2007-2-1 20:48 发表
第一步由RV570走出

这是什么意思?
作者: 来不及思考    时间: 2007-2-1 21:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-2-1 21:26
前面的算法可能有些问题。

non-AA的时候R580XTX实际测试是10.199 GPix/s,5倍就是50.995 GZix/s=50995M Zixel/s。

32 render back-end:50995M/s / 32 R-BE = 1593.59375M /s,这个时候的Render back-end数应该是2 zixels/cycle,频率是797MHz。

16 render back-end:50995M/s / 16 R-BE = 3187.1875M /s,这个时候的Render back-end数应该是4 zixels/cycle,频率同样是797MHz。

基本上,以这些资料看,R600的规格在800MHz正负5% 。

G80GTX实际测试是69.407 GPix/s z only (fw 96.94)。


见12楼修正
作者: clockrun    时间: 2007-2-1 21:26
看过很多测试,采用DDR4的1950xtx的确比DDR3的1900xtx快一点,可要是除去核心频率的不同,两者的差距并没有想象中的那么明显。再加上DDR4的价格……中低端采用DDR4怎么有点像自杀行为……
作者: 来不及思考    时间: 2007-2-1 21:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-2-1 21:38
原帖由 clockrun 于 2007-2-1 21:26 发表
看过很多测试,采用DDR4的1950xtx的确比DDR3的1900xtx快一点,可要是除去核心频率的不同,两者的差距并没有想象中的那么明显。再加上DDR4的价格……中低端采用DDR4怎么有点像自杀行为……


为什么这样说呢?

128bit 2GHz的成本说不定和266bit 1.2GHz的成本差不多甚至更低。
作者: clockrun    时间: 2007-2-1 22:11
现在DDR4的产量应该还比不上DDR3吧,价格应该也偏高。所以性价比不是很高啊……
不过要是把2Ghz起跳的DDR4用在中低端上面,还是有点看头的……至于高端顶级之类的,只能算是锦上添花了吧
作者: Edison    时间: 2007-2-1 22:15
4颗GDDR4的价格要比8颗GDDR3便宜,厂商订内存的时候,颗粒数是最大的成本指标,远高于频率。
作者: ase    时间: 2007-2-1 22:56
原帖由 Edison 于 2007-2-1 22:15 发表
4颗GDDR4的价格要比8颗GDDR3便宜,厂商订内存的时候,颗粒数是最大的成本指标,远高于频率。

这可不见得。
8颗DDR2的价格就便宜过4颗DDR3.
作者: Edison    时间: 2007-2-1 23:04
ic数只是成本之一,PCB呢?128bit和256-bit相差不少了。
作者: 54cainiao    时间: 2007-2-2 08:43
连低端的版本都要8层PCB 太奢侈了
作者: 阿蓝2代    时间: 2007-2-2 10:53
提示: 作者被禁止或删除 内容自动屏蔽
作者: kidding    时间: 2007-2-2 11:22
GDDR4  16*32现在价格还远高于10美元
而16*32的GDDR3大概6美元多
8*32的GDDR3是3美元多
CHO认为哪种方案便宜呢 ?哈
作者: zzhang    时间: 2007-2-2 13:29
原帖由 kidding 于 2007-2-2 11:22 发表
GDDR4  16*32现在价格还远高于10美元
而16*32的GDDR3大概6美元多
8*32的GDDR3是3美元多
CHO认为哪种方案便宜呢 ?哈

这得看频率吧,不一样的频率,价格可不是这么比的
作者: clawhammer    时间: 2007-2-2 13:35
原帖由 zzhang 于 2007-2-2 13:29 发表

这得看频率吧,不一样的频率,价格可不是这么比的

你头像看到就吓死人滴:funk: :funk:
作者: G70    时间: 2007-2-2 17:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: psc2001    时间: 2007-2-2 23:18
提示: 作者被禁止或删除 内容自动屏蔽
作者: 催化剂    时间: 2007-2-3 14:02
DDR4 没有4x32的规格
作者: graphiccard    时间: 2007-2-3 14:24
原帖由 Edison 于 2007-2-1 16:46 发表
R580不存在HW的fp filtering,是采用shader执行。

过去消耗在双线性过滤的操作 数是:4 multiplies+3 adds+2 subs=9 ops x4 channels = 36 ops,不考虑存取延迟等因素,大概需要9个周期完成一个pixel的textu ...



w00t)
原来如此哇
CHO的话记住了




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4