POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Eji
打印 上一主题 下一主题

替RV770說點好話

[复制链接]
61#
发表于 2008-3-13 11:42 | 只看该作者
原帖由 Edison 于 2008-3-13 00:07 发表

R600//RV670是4 shader array, 16*5 way superscalar shader per shader array。
http://www.pcinlife.com/article/graphics/2007-06-02/1180790746d363.html


明白了。
回复 支持 反对

使用道具 举报

62#
发表于 2008-3-13 11:48 | 只看该作者
原帖由 haifengx88 于 2008-3-13 09:16 发表
简单的说就是RV670是分4组SP,每组16个5D...
RV770分5组SP,每组32个5D...
以此类推:
RV630/635分3组,每组8个5D...
RV610/620分2组,每组4个5D...


这样的话RV770的效率不会比RV670好。性能大概和G92持平。
有意思的在这:
http://news.mydrivers.com/1/101/101293.htm

RV770比G92多数千万晶体管,但是相同制程核心面积更小。

回复 支持 反对

使用道具 举报

63#
 楼主| 发表于 2008-3-13 13:18 | 只看该作者
原帖由 haifengx88 于 2008-3-13 09:16 发表
简单的说就是RV670是分4组SP,每组16个5D...
RV770分5组SP,每组32个5D...
以此类推:
RV630/635分3组,每组8个5D...
RV610/620分2组,每组4个5D...


所以每個bank的 ALU數量應該要是16的倍數,比較合理....不過是5bank嗎?

原帖由 shu0202 于 2008-3-13 11:48 发表
这样的话RV770的效率不会比RV670好。性能大概和G92持平。
有意思的在这:
http://news.mydrivers.com/1/101/101293.htm

RV770比G92多数千万晶体管,但是相同制程核心面积更小。

well,"理論上" ring-bus 應該還是比較省空間啦....

[ 本帖最后由 Eji 于 2008-3-13 13:20 编辑 ]
回复 支持 反对

使用道具 举报

noble_long 该用户已被删除
64#
发表于 2008-3-13 14:40 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

65#
发表于 2008-3-13 15:27 | 只看该作者
显卡能帮助渲染的话就太棒了,cpu做ray tracing慢的让人想跳楼:-(。
而且,以pc游戏市场现状,高端显卡有点不值。nvidia能发展娱乐之外的应用会对显卡销售提供新的支持。
回复 支持 反对

使用道具 举报

66#
 楼主| 发表于 2008-3-13 16:03 | 只看该作者
原帖由 noble_long 于 2008-3-13 14:40 发表
DX10游戏相对于DX9而言,合适的分支粒度变化大不大?GS流行后对此有何影响?
如果变化大,NV会否调整TPC内SP数量或share memory的大小来抓这个sweet point,以及相应的时间点是一个有趣的问题。
加大share memory更多的是为了图形应用还是GPGPU?


我自己覺得加大share memory是對繪圖和GPGPU都有幫助....因為其實GPU適合的工作不論是繪圖或是GPGPU,類型都是類似的。
此外,R600其實也有一個steam-out cache,照理來說可以拿來做thread間的溝通。

DX10的分支粒度應該是更小,雖然VS/GS的粒度比較大;不過VS/GS的工作量目前沒有什麼成長的感覺....

原帖由 littlebird 于 2008-3-13 15:27 发表
显卡能帮助渲染的话就太棒了,cpu做ray tracing慢的让人想跳楼:-(。
而且,以pc游戏市场现状,高端显卡有点不值。nvidia能发展娱乐之外的应用会对显卡销售提供新的支持。


我是覺得ray tracing就算可以"變快",和rasterizer相比也不會快啦....
現在問題是娛樂之外的用途,需求也不大(作繪圖的人也沒那麼多),真的要推廣市場還是要像UI那樣遍地都有需求的用途比較有用處。

問題是性能需求多高呢?well,以電視目前Full-HD的解析度來說,可以推廣的空間應該還很大....

[ 本帖最后由 Eji 于 2008-3-13 16:07 编辑 ]
回复 支持 反对

使用道具 举报

67#
发表于 2008-3-13 16:49 | 只看该作者
顶完再看:lol:
回复 支持 反对

使用道具 举报

68#
发表于 2008-3-13 21:52 | 只看该作者
GT200不是192 1D SP。
回复 支持 反对

使用道具 举报

69#
发表于 2008-3-13 22:04 | 只看该作者
原帖由 empressgirlPCI 于 2008-3-13 21:58 发表
Edison
那么 GT200是多少个1D SP的?????

大家很快就会知道的 :rolleyes:
回复 支持 反对

使用道具 举报

70#
发表于 2008-3-13 22:26 | 只看该作者
原帖由 Eji 于 2008-3-12 15:12 发表


~1000M嗎....看起來像是現有的ALU規模,再加執行資源....果然NVIDIA比較重視procedure。

应该是破1000M的.
回复 支持 反对

使用道具 举报

头像被屏蔽
71#
发表于 2008-3-13 22:35 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

72#
发表于 2008-3-13 22:44 | 只看该作者
原帖由 empressgirlPCI 于 2008-3-13 21:58 发表
Edison
那么 GT200是多少个1D SP的?????


384SP  500mm的规模
回复 支持 反对

使用道具 举报

73#
发表于 2008-3-13 23:59 | 只看该作者
俺也来YY

G92对比G94,可以说就是64个sp的差别。

G92 330mm2 754M
G94 240mm2 505M

也就是说64个sp大概是250M个晶体管。

假设GT200其他都没有动,光增加sp了。那么以1000M的数量来算的话,最多也就192个sp了。
回复 支持 反对

使用道具 举报

74#
发表于 2008-3-14 00:03 | 只看该作者
原帖由 aibo 于 2008-3-13 23:59 发表
俺也来YY
G92对比G94,可以说就是64个sp的差别。
G92 330mm2 754M
G94 240mm2 505M
也就是说64个sp大概是250M个晶体管。
假设GT200其他都没有动,光增加sp了。那么以1000M的数量来算的话,最多也就192个 ...

G94增加了输出方面的单元整合,所以SP缩减的部分晶体管要比这个数字略大。
回复 支持 反对

使用道具 举报

75#
发表于 2008-3-14 00:45 | 只看该作者
:a) 什么时候GPU集成16M以上缓存,性能就好很多了
参考各类游戏机GPU
就连PS2那 200多M的GPU,带宽都是巨大的
回复 支持 反对

使用道具 举报

76#
发表于 2008-3-14 11:50 | 只看该作者
原帖由 sonicxz 于 2008-3-14 00:45 发表
:a) 什么时候GPU集成16M以上缓存,性能就好很多了
参考各类游戏机GPU
就连PS2那 200多M的GPU,带宽都是巨大的


大缓存意味着高成本!
回复 支持 反对

使用道具 举报

77#
发表于 2008-3-14 12:57 | 只看该作者
GT200应该仍是128个流处理器,但是不知道还是不是1D,也许只是管线内部作了加强,更复杂了而已。
回复 支持 反对

使用道具 举报

78#
发表于 2008-3-14 15:55 | 只看该作者
原帖由 shu0202 于 2008-3-14 12:57 发表
GT200应该仍是128个流处理器,但是不知道还是不是1D,也许只是管线内部作了加强,更复杂了而已。


GT200还是128个流处理器?:charles:
回复 支持 反对

使用道具 举报

79#
发表于 2008-3-14 23:58 | 只看该作者
原帖由 stcshy 于 2008-3-14 18:52 发表
如果9亿多晶体管的话
如果GT200有改进,那么只塞的下128SP
无大改进可以塞下160SP
最大的可能还是128SP


如果GT200还是128SP,NV怎么做产品宣传?:o
回复 支持 反对

使用道具 举报

80#
 楼主| 发表于 2008-3-15 01:38 | 只看该作者
> 我希望Nvidia GT200是256SP,128TF/TA,32ROP、512Bit-GMC、1G或2G-3GHz-GDDRV、第二代GigaThread、功耗低于300W!!!!!!!

低於300w好像達得到?目前聽說是250w....?
是不是第二代GigaThread就難說....

多少SP真的難說,不過至少應該是G8x的改良吧.... 根據以前UIUC那份CUDA for GPGPU的說法,這一代應該有1TFLOPS的單精度浮點、128GFLOPS的倍精度浮點。
文件上的原始數據是128GPUs @ 08spring、130TFLOPS sp、16TFLOPS DP;所以單GPU應該是1Tera+ FLOPS SP、128GFLOP DP。

但是怎麼算1TFLOPS真的不清楚,因為這份PDF裡面是把G80算成367GFLOPS,沒有計入所謂的missing-MUL。
所以最接近的應該是256個MAD SP跑2GHz;然後每兩個SFU合併起來跑一個DP MAD的話,256sp "可能"有32個DP-MAD,這樣在2GHz下會有128GFLOPS DP的數字;192SP的話,時脈就有必要拉到3GHz了。

不過也許這個數字本身就是幌子....XDa

[ 本帖最后由 Eji 于 2008-3-15 01:44 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-18 04:34

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表