POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Asuka
打印 上一主题 下一主题

R800和GF100的缓存层次结构对比

[复制链接]
21#
发表于 2010-4-8 16:00 | 只看该作者
nv的问题是设计的好却没真正提升竞争力,是不是像ati的细分曲面一样也要经历一个潜伏期呢
回复 支持 反对

使用道具 举报

22#
发表于 2010-4-8 18:40 | 只看该作者
AMD 的读和写的cache是分开的? constant cache 是 read only, export memory buffer 是cache还是? write only? 太多疑问。
回复 支持 反对

使用道具 举报

23#
发表于 2010-4-9 09:27 | 只看该作者
回复  Heidfeld


数据不准并不代表论点不准, 我从没宣称过数据精确. 况且我能错的不过两三个数字而已. 你可是整个论点都是错的.
GF100 Larrabee Cell P4 R600之流撞墙的撞墙夭折的夭折, 这是事实. 你想推翻那是没指望的. 理念先进的Alpha团队也不过落得了被收购的下场, 这也是事实. R600之后的衍生品670-870几乎代代成功. G80则是马甲遍地毫无可伸缩性--当然我不否认其商业成功.
brl 发表于 2010-4-9 09:11


错误的数据可以得出正确的结论

R600是工艺撞墙才死的

RV670很成功

G80毫无可伸缩性



……


百十来个字就蕴含了这么爆炸性的力量,这个世界怎么了……
回复 支持 反对

使用道具 举报

24#
发表于 2010-4-9 09:28 | 只看该作者
G80架构还是有伸缩性的,不过基本都是阉割运算单元,不像R600能翻好几倍
回复 支持 反对

使用道具 举报

25#
发表于 2010-4-9 09:34 | 只看该作者
G80架构还是有伸缩性的,不过基本都是阉割运算单元,不像R600能翻好几倍
anolen01 发表于 2010-4-9 09:28

找你这么说,G80基本都是阉割运算单元,那就是G80只有缩,何来伸?
回复 支持 反对

使用道具 举报

26#
发表于 2010-4-9 09:54 | 只看该作者
错误的数据可以得出正确的结论

R600是工艺撞墙才死的

RV670很成功

G80毫无可伸缩性



… ...
mooncocoon 发表于 2010-4-9 09:27


月神怎么也喜欢断章取义添油加醋啊,人家可没说R600“工艺”撞墙,RV670“”成功
回复 支持 反对

使用道具 举报

27#
发表于 2010-4-9 09:57 | 只看该作者
找你这么说,G80基本都是阉割运算单元,那就是G80只有缩,何来伸?
toshibacom 发表于 2010-4-9 09:34


兴许是非不能也,实不为也。G200不就是G80到GF100变身前的过渡阶段嘛,运算单元也翻倍了。
回复 支持 反对

使用道具 举报

28#
 楼主| 发表于 2010-4-9 10:00 | 只看该作者
回复  Heidfeld


数据不准并不代表论点不准, 我从没宣称过数据精确. 况且我能错的不过两三个数字而已. ...
brl 发表于 2010-4-9 09:11


错误的数据得不出正确的结论

你前面回复中这个结论就明显是错误的

没人说要原地踏步, 只是nVidia的设计明显的不合时宜. 多了50%的晶体管才这点性能提升.
只要RV870加强Tessellator的性能, 再稍微提下频率, GF100就几乎必败. 而AMD/ATi为此付出的代价将是相当的小.

brl 发表于 2010-4-8 14:09

   
从中可以看出你对GPU架构缺乏了解
回复 支持 反对

使用道具 举报

29#
 楼主| 发表于 2010-4-9 10:07 | 只看该作者
AMD 的读和写的cache是分开的? constant cache 是 read only, export memory buffer 是cache还是? write only? 太多疑问。

vrml 发表于 2010-4-8 18:40


constant cache在前端,肯定不能写

export memory buffer没有详细信息,我觉得它就是一个进行DRAM不规则写操作时的合并缓存

根据AMD的资料,RV870在执行计算时是没有"cache"这个概念的
回复 支持 反对

使用道具 举报

30#
发表于 2010-4-9 10:13 | 只看该作者
回复 26# CRAZY88
L1 是可以自定义shared memory 和cache 的比例。
回复 支持 反对

使用道具 举报

31#
发表于 2010-4-9 12:32 | 只看该作者
说实话,这样做没什么意义,一个半年就可以换的东西没必要提什么先进性。能拿出来卖的都肯定不是最先进的架构了。
回复 支持 反对

使用道具 举报

32#
发表于 2010-4-9 12:42 | 只看该作者
在这添油加醋的分明就是你呀!
Heidfeld 发表于 2010-4-9 10:04


哦,耳机老弟可以指明一下我哪里添油加醋?
回复 支持 反对

使用道具 举报

33#
发表于 2010-4-9 15:33 | 只看该作者
构架再先进也只有看下一代了 这一代GF100是失败的 DX10没优势 DX11的游戏没优势 唯独几个demo优势明显 地铁2003 大家一起悲剧 外带高功耗高热量高成本  还是期待费米构架的第二代产品吧
回复 支持 反对

使用道具 举报

34#
发表于 2010-4-9 16:06 | 只看该作者
constant cache在前端,肯定不能写

export memory buffer没有详细信息,我觉得它就是一个进行DRAM不 ...
Asuka 发表于 2010-4-9 10:07


也就是说AMD在执行计算(非图形)任务时是没有cache的? 如果export memory buffer只是用来合并写操作,那么它什么时候flush到DRAM中? 这个时候他会不会invalidate constant cache 中的值。如果不得话,constant cache中的值就和DRAM中的值不一致了,如何解决?
回复 支持 反对

使用道具 举报

35#
发表于 2010-4-9 18:46 | 只看该作者
理论再多都是白搭,实际效果呢?
ttl 发表于 2010-4-9 15:55

实际效果应该也还可以的
只不过是等应用广泛的时候这玩意儿早就过时了
回复 支持 反对

使用道具 举报

36#
发表于 2010-4-9 19:49 | 只看该作者
简单的把fermi当作GPU去看未免有侮辱的嫌疑~~~

fermi必将是里程碑式的产品~~~第一个有能力将RT带入realtime时代的架构~~~这个是未来互动式图形运算的必然技术~~~但它的运算规则已经超越了传统的3D绘制范畴~~~用今天的眼光和测试结果去衡量得不到正确的结论~~~

另外~~~竟然有人说提升Tessellation性能就如何如何~~~国内媒体谈及DX11必然谈及Tessellation~~~貌似这就是DX11的全部~~~貌似有了Tessellation就能让画质翻天覆地变化~~~可笑之极~~~我大胆预言~~~整个DX11时代~~~你甚至很难看到一个画面效果超越Crysis的游戏~~~欢迎挖坟~~~

Tessellation国内媒体称呼叫曲面细分~~~我都不知道这个词是怎么来的~~~那张显卡硬件支持nurbs绘制?没有曲面何来细分~~~换句话说细分又是另一种图形绘制标准~~~这两种都算不得多边形建模范畴内~~~还是老老实实的叫它在专业领域中被叫了几十年的"镶嵌"吧~~~

Tessellation其实就是一个图形绘制的中间步骤~~~它大体上是为了置换之类的效果做的前期准备~~~一个低面数的模型~~~要想通过置换达到高面数模型的效果~~~就必须提前产生足够多的多边形用以形变~~~产生效果的是置换而非Tessellation~~~只有Tessellation仅仅是相当于一次高级smooth而已~~~

当Tessellation自动产生了足够多的多边形后~~~你至少可以通过两种手段去控制它增加的多边形~~~一种是通过程序控制~~~比如很多demo里演示过的流体表面~~~通过程序去拟真是最方便的~~~另一种是通过贴图控制~~~比如你在heaven中看到的地面 房屋 墙壁这些~~~而贴图控制又可以有很多种~~~最佳的就像是做发现贴图一样~~~先建立高细节模型~~~然后烘焙出置换贴图~~~这种就比较复杂~~~另一种就是从彩色贴图中直接提取alpha通道去控制~~~一般而言地面之类的多用这种~~~快速而效果也可接受~~~

不过话说回来~~~这些操作也都未必是那么容易和能得到理想的效果~~~全在游戏制作方的能力和态度~~~没有这个为前提~~~Tessellation就是高级的smooth而已~~~任何都不代表~~~

再说回DX11~~~CS的意义远比Tessellation大的多~~~当API准备好了~~~fermi的设计如何算超前~~~NVIDIA是个有远见的公司~~~为了的realtime交互式图形绘制~~~走RT+光栅渲染的综合道路是必然的~~~这里要说明~~~就如同我不愿意神话Tessellation一样~~~RT也是没必要神话的~~~只要在需要它效果的时候采用才是正确和高效的~~~真正的电影级渲染也非全画面RT~~~有了这层判断~~~我们就能理解NVIDIA为什么提早将MentalImage收购~~~如果不知道这个公司的话自己去查~~~着重注意它旗下的MentalRay渲染器~~~RT类渲染器发展了几十年~~~统统是基于CPU的运算架构~~~几乎是不可能再做什么GPU移植了~~~所以CUDA CS甚至Stream才是它登场的前提~~~这些技术无一不是把GPU当作CPU来使用~~~或者某位说的GPGPU~~~

结论也就出来了~~~fermi只可能是里程碑~~~不是什么不切实际的超前设计~~~
回复 支持 反对

使用道具 举报

37#
发表于 2010-4-9 20:02 | 只看该作者
楼上的太高潮了吧?实时光线追踪还早着呢,到那时费米这个架构可能连低端都不用了。。。
回复 支持 反对

使用道具 举报

38#
发表于 2010-4-9 20:09 | 只看该作者
楼上的注意我行文中的措辞~~~全面RT是不现实~~~我讲的是RT+光栅~~~只有在必须RT才能表现效果的部分才用~~~真正的电影级制作也远远不是全部RT~~~甚至业内另一大扛鼎级渲染器RM也是很晚才支持RT~~~

而RT也非很多人想象中的那么恐怖~~~很多效果即使现在的CPU都可以做到realtime~~~极度耗费运算资源的那些效果可以通过参数的设定等手段尽量降低要求~~~甚至有些效果因为CUDA CS等的出现~~~可以如同电影制作一样~~~post render中合成而不一定要用RT去做~~~但这都是将GPU当作CPU去用的~~~fermi无论怎么看设计思路都是没错的~~~

重要的是趋势~~~fermi是沿着趋势做~~~
回复 支持 反对

使用道具 举报

39#
发表于 2010-4-9 20:17 | 只看该作者
估计十天半个月的出不来吧你说的那种游戏,等到出来了,可能都到了费米2和r1k上场了。。。
回复 支持 反对

使用道具 举报

40#
发表于 2010-4-9 20:20 | 只看该作者
具体到这类游戏什么时候能出来~~~我确实不知道~~~但是不能否认的是NVIDIA现在走出的这一步是正确的~~~它做好了准备~~~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-14 00:11

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表