POPPUR爱换

标题: 为什么RV630比G84多了1亿晶体管性能却不怎么样? [打印本页]

作者: lqf3dnow    时间: 2007-6-14 19:43
标题: 为什么RV630比G84多了1亿晶体管性能却不怎么样?
UVD很费晶体管么?
256bit Ringbus很费晶体管么?

按照思考说的:
1,Ringbus延迟高,效率也不如Xbar,128bit的XBar布线很难么?
2,5D ALU比1D ALU要节省晶体管,24US比32SP很费晶体管么?

结果性能却比对手低,ATI是不是脑子进水了?
作者: 白家粉丝    时间: 2007-6-14 19:44
不懂,楼下的解释下看。
作者: saintangel    时间: 2007-6-14 19:53
不是RV630 hit G80吗?
作者: Edison    时间: 2007-6-14 19:54
多了audio tunel、VLD for VC-1、传说中的pcie 2.0 ready等等吧。
作者: lqf3dnow    时间: 2007-6-14 20:13
原帖由 Edison 于 2007-6-14 19:54 发表
多了audio tunel、VLD for VC-1、传说中的pcie 2.0 ready等等吧。

这些功能除了pcie2.0外RV610也支持,但RV610只有1.8亿晶体管
我不认为pcie2.0控制器会比上代规模大多少,那你说的这写功能要占据RV610一多半的晶体管有那么夸张么?

[ 本帖最后由 lqf3dnow 于 2007-6-14 20:14 编辑 ]
作者: cool_exorcist    时间: 2007-6-14 20:15
无敌声卡:funk:
作者: akcadia    时间: 2007-6-14 20:16
你可以拿5600来和9550对比```也是一样的``
作者: zyxel2008    时间: 2007-6-14 20:19
如果搞成“显/声/网/USB/1394/SATA/SCSI/DEBUG纠错”等全集成卡,这个创意也很好啊,是不是啊闻西?w00t)
作者: lqf3dnow    时间: 2007-6-14 20:19
原帖由 akcadia 于 2007-6-14 20:16 发表
你可以拿5600来和9550对比```也是一样的``

拿两个晶体管界别在一个数量级上

可RV630比G84多了近40%的晶体管
作者: 来不及思考    时间: 2007-6-14 20:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: 来不及思考    时间: 2007-6-14 20:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: aimbot    时间: 2007-6-14 20:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: cool_exorcist    时间: 2007-6-14 20:31
原帖由 zyxel2008 于 2007-6-14 20:19 发表
如果搞成“显/声/网/USB/1394/SATA/SCSI/DEBUG纠错”等全集成卡,这个创意也很好啊,是不是啊闻西?w00t)


要是能把CPU/南桥/北桥/硬盘/显示器一起搞进去就好了,只是现在的工业在成本范围内还做不到
作者: Dr.BT    时间: 2007-6-14 20:57
晶体管越多潜力越大

LZ怎么忘记这个了:huh:
作者: tootoo    时间: 2007-6-14 21:05
因为我不知道:a)
作者: 末日之刃    时间: 2007-6-14 21:16
原帖由 来不及思考 于 2007-6-14 20:22 发表
另外,RV630虽然晶体管多,但得益于AMD的新工艺,die size比G84还小一点,某厂又可以偷笑了 :shifty:

邪恶,说话老是说一半:shifty:
作者: jhc007    时间: 2007-6-14 21:18
不是说是声卡吗?
:huh:
作者: G70    时间: 2007-6-14 21:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: aibo    时间: 2007-6-14 22:59
lz被盗号了:blink:
作者: bolk001    时间: 2007-6-14 23:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-6-14 23:56
只要神dri上身,你就会看到多出的1亿晶体管的闪光点:)
作者: 天下18    时间: 2007-6-14 23:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: pharaohs1024    时间: 2007-6-15 00:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: saintangel    时间: 2007-6-15 00:53
原帖由 Elwin 于 2007-6-15 00:26 发表
RV530和G73也差不多,性能平均落后70%

这位RV630性能落后15%,当然要多点了~:p


你太恶毒了……在完美driver的驱动下,RV630一定是可以hit G80的!
作者: 7121518    时间: 2007-6-15 02:02
唉,又被逼疯了一位.
作者: Eji    时间: 2007-6-15 03:36
原帖由 lqf3dnow 于 2007-6-14 19:43 发表
UVD很费晶体管么?
256bit Ringbus很费晶体管么?

按照思考说的:
1,Ringbus延迟高,效率也不如Xbar,128bit的XBar布线很难么?
2,5D ALU比1D ALU要节省晶体管,24US比32SP很费晶体管么?


1. 佈線難度應該不是問題,但是產生的熱量和複雜度都容易讓crossbar出問題。

2. 5D ALU比1D ALU節省電晶體是"同樣做到一樣的規模時"比較節省,
或者是同樣的電晶體數可以做到比較大的理論性能,並不是說單5D Vector可以比1D scalar來得小。
這就造成了大略相同的電晶體、扣掉雙方都有的一堆雜七雜八的東西、R600的320D大幅超過NVIDIA的128D。

UVD的總規模和PureVideo2應該不會相去太遠。新增的HD-Audio因為沒有類比部分、功能也相當精簡,並不會過於複雜。
256bit Ringbus應該是wiring的問題,不是transistors的問題,照理說只是占die size但是不會占大量的管子。

所以我覺得這是架構思考上的邏輯問題。
當年NV30的VLIW也花了相當多精神,到NV40才比較有點成果(而且NV40應該算是靠SM3的話題性把X800打敗的吧),等到G70的時候硬體面的強化已經差不多把VLIW的帶來的問題點cover掉、軟體部份也培植得夠久了。
R600的VLIW也該花一定程度的時間才會有成果吧?

[ 本帖最后由 Eji 于 2007-6-15 03:41 编辑 ]
作者: saintangel    时间: 2007-6-15 04:44
Eji解释的很透彻啊
意思就是友商要到R800才能驱动成熟?
作者: Eji    时间: 2007-6-15 05:24
原帖由 Elwin 于 2007-6-15 04:52 发表
NV40强于R420除了Sm3.0,还靠每管线两个FP32 shader。每次跑pixel shader,NV40都能以低得多的频率得到更高的成绩。好像还能搞什么2D+2D,不是单纯的4D。


兩個FP32 shader應該不是比R420強的關鍵,NV4x/G7x的Shader ALU1與TMU共用指令單元的關係,如果shader較短的話TMU損失的那個cycle其實還是會很明顯,R420的TMU獨立、還有mini-ALU,僅論資源數量的話R4x0是有輸、但沒有輸太多;只是功能部分較弱則是很明顯的。

而且NV4x的時候Shader ALU2並沒有MAD的關係,指令其實偏向兩個ALU互補....直到G7x的時候兩個ALU才各自比較有獨立性。到SM3末期重點又加上分支密度之後G7x才因為register file資源不足敗下陣來,G8x則徹底改善這個問題。

考慮PS ALU數量(3D+1D+2D+2D,疑似還有輔助的Scalar、然後24組),如果當初以G7x為基礎增設register file來強化分支性能的話.... 很可能會比G8x規模還大,但是表現卻沒有比較好。
因為G7x的指令分派也靠VLIW來管制co-issue/dual-issue....儘管這個compiler從NV3x/4x發展到G7x足足三代,但是和完全硬體排列(不提供user干涉)的G8x單純scalar排程比起來效率還是很值得質疑。

考慮G8x的開發是比G7x還早著手的,NVIDIA應該是在NV4x就已經看到這個問題。所以同樣的問題發生在R600身上,只能說出來走的總是得還....

[ 本帖最后由 Eji 于 2007-6-15 05:34 编辑 ]
作者: aibo    时间: 2007-6-15 07:11
原帖由 Eji 于 2007-6-15 05:24 发表


兩個FP32 shader應該不是比R420強的關鍵,NV4x/G7x的Shader ALU1與TMU共用指令單元的關係,如果shader較短的話TMU損失的那個cycle其實還是會很明顯,R420的TMU獨立、還有mini-ALU,僅論資源數量的話R4x0是有 ...



e大的意思是,VILW已经out了?那R600岂不是最初就站错了队?可怜的孩子:sweatingbullets:
作者: 冰山    时间: 2007-6-15 07:26
原帖由 bolk001 于 2007-6-14 23:48 发表
加了许多功能自然大了不少,也排除,AMD保留了,等待给N卡最后一击。

不错,现在AMD全面领先出招连连,想怎么玩就怎么玩
作者: Eji    时间: 2007-6-16 04:36
原帖由 aibo 于 2007-6-15 07:11 发表
e大的意思是,VILW已经out了?那R600岂不是最初就站错了队?可怜的孩子:sweatingbullets:


唔,其實我不是這個意思....
VLIW最大的問題是效率,但是畢竟它還是一個相對之下很適合生產的結構。G7x因為還有Crossbar之類的的部分,R600已經全面改成Ringbus了。我是覺得生產性取向R600是比G7x徹底些。

簡單講就是說,雖然結構上的持續效率可能不能期待,但是只要它有比較好生產,兩倍大的規模沒辦法比較快,三倍大總有辦法吧?

G8x現在的問題就是擴充性,與Register file結合的TCP數量很難擴充,擴充就會大幅增加規模,G92目前看來就是G80兩倍左右的超大怪獸。要提升性能,比較保險的狀況是提升時脈,但是這會大幅提高耗電量。

目前因為ATI正好軟體部分是弱項(AMD並沒有資源改善這點),所以VLIW短期內很難提升效益,但是拖個兩代三代之後,雖然應該還是效率會比較差,但可能有機會在製程優勢的狀況下,把架構面比較優質的G8x延伸產品打敗也說不定。

實質上就是,現在GPU市場已經都開始轉向製造取向了,以前大家因為不受ISA限制所以可以玩的東西很多,現在API實質上只剩DirectX比較活躍,以後可能會越來越無聊....orz

[ 本帖最后由 Eji 于 2007-6-16 04:37 编辑 ]
作者: lacri    时间: 2007-6-16 11:37
Eji总是那么耐心,这样的人品和素质首先就让人服气。RX6XX性能如此之差,是不是部分和它集成声卡这种不务正业的行为有关?


PS:问下CHO,为什么用手机看帖总是很多乱码?
作者: gamekiller    时间: 2007-6-16 11:48
感觉主要原因是效率太低,就像1800XT,只能靠频率来弥补。
作者: Edison    时间: 2007-6-16 12:19
当初107M的R300也足以把125M的NV30碾得粉身碎骨,单纯看晶体管数字实在很无聊的,就好像Montecito,晶体管数量够庞大了吧,但是也未必能在绝大多数大家常见的应用上和晶体管规模小得多的Penryn对抗。




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4