POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Asuka
打印 上一主题 下一主题

R800和GF100的缓存层次结构对比

[复制链接]
81#
发表于 2010-4-11 16:19 | 只看该作者
来看看没有使用 tessellation 但是应用了 compute shader 的游戏 battlefield:




另一个例子,采用 compute shader 前后后 stalker cop 的性能表现:






在 DX11 时代,Compute Shader (也就是部分人认为没有意义的 GPGPU)的对游戏性能影响还是相当明显的。
回复 支持 反对

使用道具 举报

82#
发表于 2010-4-11 17:01 | 只看该作者
其实gpgpu这个概念没什么意义。除非能做成独立cpu。要不以后只要能完美支持dc和opcl的都算gpgpu。适应标准的卡才能生存下去。现在amd在这方面虽然比nv晚了一些,但是当dc和opcl大规模应用的时候,可能amd恰好能赶上。。。那么现在的落后其实就无所谓了。因为还没大规模应用。
回复 支持 反对

使用道具 举报

83#
发表于 2010-4-11 21:07 | 只看该作者
真希望索尼的PS4是power7+费米3的架构
回复 支持 反对

使用道具 举报

84#
发表于 2010-4-11 21:16 | 只看该作者
回复 支持 反对

使用道具 举报

85#
发表于 2010-4-11 21:17 | 只看该作者
gzeasy2006 发表于 2010-4-11 21:16


建议使用 poco.cn 作为图床。
回复 支持 反对

使用道具 举报

86#
发表于 2010-4-11 21:18 | 只看该作者
建议使用 poco.cn 作为图床。
Edison 发表于 2010-4-11 21:17



    什么意思?请解释一下
回复 支持 反对

使用道具 举报

87#
发表于 2010-4-11 21:30 | 只看该作者
不是明知

100nm以下的半导体没有明知
Asuka 发表于 2010-4-11 13:55

既然100nm以下的半导体没有明知,那你就没资格说TSMC*无*能*
回复 支持 反对

使用道具 举报

88#
 楼主| 发表于 2010-4-11 21:34 | 只看该作者
既然100nm以下的半导体没有明知,那你就没资格说TSMC*无*能*
chm128256_1 发表于 2010-4-11 21:30



好吧,你的语文老师无能
回复 支持 反对

使用道具 举报

89#
发表于 2010-4-11 22:00 | 只看该作者
当TSMC进入22纳米或者20纳米时代会有第二代高-K金属栅极的技术加入吗?
回复 支持 反对

使用道具 举报

90#
发表于 2010-4-11 22:03 | 只看该作者
那你觉得明知TSMC*无*能*还要去撞墙的NV就很有才? 这什么逻辑? 典型的护崽?
败就败了, ** and mo ...
brl 发表于 2010-4-11 12:55


觉得TSMC无能可以叫IBM代工啊,IBM以前就做过NV40啊
回复 支持 反对

使用道具 举报

91#
发表于 2010-4-11 22:28 | 只看该作者
觉得TSMC无能可以叫IBM代工啊,IBM以前就做过NV40啊
gzeasy2006 发表于 2010-4-11 22:03

恐怕,你付得起的IBM代工,最后是交给GF的
回复 支持 反对

使用道具 举报

92#
发表于 2010-4-11 22:44 | 只看该作者
当TSMC进入22纳米或者20纳米时代会有第二代高-K金属栅极的技术加入吗?
gzeasy2006 发表于 2010-4-11 22:00



rodamap上有,但是很明确是单组份的Hf氧化物,而且即便如此,说老实话论文也是几乎未见……
大家现在的兴趣都在大马士革栅极上,多组元high-k的资源在各家哪里都有了些许的下降
最后,我也不认为连Gate-first+ILD都搞不定同时自己现在的CMP还有一裤裆问题的TSMC有能力搞定Gate-last+CMP并最终完全掌控Gate-last,躲开深埋却遇到平整度,这不是按下葫芦起来瓢么,再说转向Gate-last还需要对Layout部分进行重新设计……
谁知道呢,也许TSMC可以让我意外一次也说不定呢
回复 支持 反对

使用道具 举报

93#
 楼主| 发表于 2010-4-11 22:48 | 只看该作者
惊喜的发现5850的compute shader性能超过与他相同图形性能的GTX285。

是否表明AMD 5系的GPGPU能力超过了G200?
纳尼? 发表于 2010-4-11 22:36


STALKER主要负载还是图形部分

纯计算的话,不容乐观



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

94#
发表于 2010-4-11 22:53 | 只看该作者
5870比4890倒是强了那么多?
明日香 发表于 2010-4-11 22:49

5870的苦力数远远多于4890
回复 支持 反对

使用道具 举报

95#
发表于 2010-4-11 22:57 | 只看该作者
惊喜的发现5850的compute shader性能超过与他相同图形性能的GTX285。

是否表明AMD 5系的GPGPU能力超过 ...
纳尼? 发表于 2010-4-11 22:36


5800 的 Directcompute 性能是比 GTX 285 快,很多 GT200 上实现的技术,5800 也做了,没做的则受到 Directcompute 11.0 约束着,加上 raw power 的关系,所以可以在这个 API 下跑得更快。
回复 支持 反对

使用道具 举报

96#
发表于 2010-4-11 23:04 | 只看该作者
反正我看不懂啦
回复 支持 反对

使用道具 举报

97#
发表于 2010-4-12 00:31 | 只看该作者
好吧,你的语文老师无能
Asuka 发表于 2010-4-11 21:34

好吧,你的语文和逻辑老师都无能!
我实在无法降低到某一层次了!
回复 支持 反对

使用道具 举报

98#
发表于 2010-4-12 00:32 | 只看该作者
480的这个786kb L2实际上包括了纹理,顶点,指令,数据的缓存.到底是给统一化了可以自由定义,还是只是宣传需要全给画成1个L2?

GDDR的工作方式跟主内存差距那么大,L2具体如何工作呢?
回复 支持 反对

使用道具 举报

99#
发表于 2010-4-12 00:38 | 只看该作者
我要看下限!

我要看下限!

--------------------------------

话说……480啥时候能到GZ各米人手中啊……
回复 支持 反对

使用道具 举报

100#
 楼主| 发表于 2010-4-12 01:44 | 只看该作者
本帖最后由 Asuka 于 2010-4-12 01:45 编辑
480的这个786kb L2实际上包括了纹理,顶点,指令,数据的缓存.到底是给统一化了可以自由定义,还是只是宣传需要全给画成1个L2?

GDDR的工作方式跟主内存差距那么大,L2具体如何工作呢?

los_parrot 发表于 2010-4-12 00:32


是统一的

GF100的L2工作模式有些类似CPU的L2/L3

内存和缓存的区别请搜索DRAM、SRAM
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-14 00:11

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表