POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Eji
打印 上一主题 下一主题

最近越看越有趣的R600 vs G8x

 关闭 [复制链接]
81#
发表于 2008-6-27 14:49 | 只看该作者
原帖由 Eji 于 2008-6-26 02:56 发表

(RV670/G92/G94都還是TSMC 65nm,沒有跳過去)

:blink: {sweat:] 你肯定?
回复 支持 反对

使用道具 举报

82#
 楼主| 发表于 2008-6-27 16:08 | 只看该作者
原帖由 R620 于 2008-6-27 14:33 发表
45nm才能拯救GT200:shifty:


救不了吧。
問題不是縮小或是發熱總量,而是耗能和性能、成本的比例....
回复 支持 反对

使用道具 举报

83#
 楼主| 发表于 2008-6-27 17:15 | 只看该作者
話說寫到後面有點偏了,我其實想寫的是CPU和GPU的整合:

我是覺得如果未來要走向數十個core的程度,是可以考慮ringbus和mesh network啦。

比方說,CPU和shader core都用ringbus 或 mesh連接,並且內附cache和一定程度的register file來對抗延遲;然後連到ROP、ROP這邊會有Texture L2和讓CPU使用的L3 cache,再看規模用crossbar和memory controller連接....

就和SPE靠MFC做位址轉換一樣,其實GPU core只要做類似的位址轉換就可以做出NUMA來,比方說這篇:

    https://www.cs.tcd.ie/Michael.Manzke/researPGraphics.html
    A Shared-Memory Hybrid Graphics Cluster for Visualisation and Video Processing [HPGraphics]
    https://www.cs.tcd.ie/Michael.Ma ... anzke_ERSA_2007.pdf

用SCI(Scalable Coherent Interface)的方式實作的NUMA介面,直接轉到AGP上頭,所以就可以替AGP的GPU做出NUMA;但是這顯然太多overhead、介面也太慢,但是如果把這樣的位址轉換單元作在TPC、processor array上的畫,就可以達到NUMA的平面記憶體定址才是,剩下的只要CPU core和co-processor core都能共享同一個記憶體定址協定,就可以混合各種不同的CPU core才是;不過ROP這種東西似乎就比較麻煩一點,一定得跟在記憶體控制器和次階快取系統上,這讓傳統CPU很難花這麼大的成本來實作....(為了達到高效率,ROP單元幾乎吃掉目前GPU約1/3~1/4的規模)
回复 支持 反对

使用道具 举报

84#
发表于 2008-6-27 17:30 | 只看该作者
技术贴!看看!
回复 支持 反对

使用道具 举报

85#
发表于 2008-6-27 17:52 | 只看该作者
原帖由 zhuoke 于 2008-6-26 05:04 发表
rop的增加让A卡这次在AA上出尽了风头

ROP维持在16个,没有增加,重新设计了
回复 支持 反对

使用道具 举报

86#
发表于 2008-6-27 17:52 | 只看该作者
好帖,认真拜读,顺便支持Eji。
回复 支持 反对

使用道具 举报

87#
发表于 2008-6-27 22:52 | 只看该作者
好贴
难的啊
PCI重现技术贴···
回复 支持 反对

使用道具 举报

ikinari 该用户已被删除
88#
发表于 2008-6-28 00:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

89#
发表于 2008-6-28 00:53 | 只看该作者
原帖由 Eji 于 2008-6-25 20:03 发表
G80的每個SM24warp、共計16SM,即384warp、但每個warp由於只有32threads,所以總計其實也是12288thread

虽然threadmanage 能够并发的总数是一样的
但是实际平行度还是不同
g8x                        r600
384 warps  vs       194wavefronts
warp size=32T       Wavefront size=64t

那么实际g8x 同时在运作的thread 是32T X16 SM =512Thread
而r600 是64t x4 block =256Thread
回复 支持 反对

使用道具 举报

90#
发表于 2008-6-28 01:34 | 只看该作者
原帖由 Eji 于 2008-6-27 16:08 发表


救不了吧。
問題不是縮小或是發熱總量,而是耗能和性能、成本的比例....


不是这个意思,我的意思是GT200受累于65nm导致主频与shader频率过低性能未能达到预期,目前看来GT200主要受困于shader频率与主频率,如用45nm来生产绝无此问题(_(
回复 支持 反对

使用道具 举报

91#
发表于 2008-6-28 11:20 | 只看该作者
现在都RV770 VS GT2XX的时代了,怎么还在谈R600 VS G8X?
回复 支持 反对

使用道具 举报

92#
发表于 2008-6-28 12:35 | 只看该作者

回复 103# eDRAM 的帖子

似乎说是RV770 vs G92b更合适?

如果说RV770 vs GT200的话成本上多少有些不对称
RV770是R600路线的补完,GT200是G80的后继,改动了一些东西,而相当一部分东西没改动。
回复 支持 反对

使用道具 举报

93#
发表于 2008-6-28 13:52 | 只看该作者
原帖由 superbad 于 2008-6-25 20:08 发表


AN一起完蛋INTEL一统江湖:funk:


顶这个
回复 支持 反对

使用道具 举报

94#
发表于 2008-6-29 00:07 | 只看该作者
估计GTX280是因为架构先天不足造成性能增长不大  想比于9800GX2没有什么优势{huffy:]
回复 支持 反对

使用道具 举报

95#
发表于 2008-6-29 00:10 | 只看该作者
RV770的ROP怎么还是16个啊:sweatingbullets:
回复 支持 反对

使用道具 举报

96#
发表于 2008-6-29 00:29 | 只看该作者
G92B完败:o
回复 支持 反对

使用道具 举报

97#
发表于 2008-8-30 16:40 | 只看该作者
进来好好学习一番{blush:] {blush:]
回复 支持 反对

使用道具 举报

98#
发表于 2008-12-22 23:17 | 只看该作者
原帖由 eDRAM 于 2008-6-28 11:20 发表
现在都RV770 VS GT2XX的时代了,怎么还在谈R600 VS G8X?

架构~~~:sweatingbullets:
回复 支持 反对

使用道具 举报

99#
发表于 2008-12-23 13:16 | 只看该作者
哎~ ~~
看INTEL的吧,我感觉AN这次都要被INTEL背后一刀
回复 支持 反对

使用道具 举报

100#
发表于 2009-1-18 14:48 | 只看该作者
帮顶一下!!!!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-11-24 01:11

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表