POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Asuka
打印 上一主题 下一主题

R800和GF100的缓存层次结构对比

[复制链接]
61#
 楼主| 发表于 2010-4-10 18:25 | 只看该作者
如果对存储器层次架构做一个总结的话,AMD不彻底重新设计,在计算领域是没有竞争力的

但对于游戏图形而言,NV和AMD架构上区别造成的影响却不大
回复 支持 反对

使用道具 举报

62#
 楼主| 发表于 2010-4-10 18:31 | 只看该作者
gf100的图,L2跟内存是连在一起的,中间的MC是怎样的?gpc要通过L2去访问gobal memory?
los_parrot 发表于 2010-4-10 18:02



SM(GPR) <————> L1 <————> L2 <————> MC(DRAM)

从左至右,每一层存储器都是下一层的子集,就是所谓的多级缓存结构
回复 支持 反对

使用道具 举报

63#
发表于 2010-4-10 18:46 | 只看该作者
看清楚了
回复 支持 反对

使用道具 举报

64#
发表于 2010-4-10 19:03 | 只看该作者
作为看惯了x86 mpu的人,总觉得gf100的缓存好吝啬
尤其是L2和scratchpad
回复 支持 反对

使用道具 举报

65#
 楼主| 发表于 2010-4-10 19:04 | 只看该作者
作为看惯了x86 mpu的人,总觉得gf100的缓存好吝啬
尤其是L2和scratchpad
shadewither 发表于 2010-4-10 19:03



安腾和Power表示,x86的缓存容量属于儿童玩具
回复 支持 反对

使用道具 举报

66#
 楼主| 发表于 2010-4-10 19:06 | 只看该作者
GF100是典型的流式多处理器,应用环境和CPU交集很少
回复 支持 反对

使用道具 举报

67#
发表于 2010-4-10 19:06 | 只看该作者
安腾和Power表示,x86的缓存容量属于儿童玩具
Asuka 发表于 2010-4-10 19:04

white elephant不说,power的那种缓存性能……
回复 支持 反对

使用道具 举报

68#
 楼主| 发表于 2010-4-10 19:06 | 只看该作者
white elephant不说,power的那种缓存性能……
shadewither 发表于 2010-4-10 19:06



    P7很变态呀
回复 支持 反对

使用道具 举报

69#
发表于 2010-4-10 19:12 | 只看该作者
P7很变态呀
Asuka 发表于 2010-4-10 19:06

l3也就4M/core,nehalem也有2-3了
回复 支持 反对

使用道具 举报

70#
 楼主| 发表于 2010-4-10 19:16 | 只看该作者
l3也就4M/core,nehalem也有2-3了
shadewither 发表于 2010-4-10 19:12



    不能这样比呀,CPU整个体系可以说跟着"Cache hit"进行的布局,而GPU的整个体系都是为了"Cache miss"设计的
回复 支持 反对

使用道具 举报

71#
发表于 2010-4-10 19:36 | 只看该作者
回复 93# Asuka
请教一下,为什么fermi的功耗会那么大
从规格上来看不至于啊
回复 支持 反对

使用道具 举报

72#
发表于 2010-4-10 19:39 | 只看该作者
回复  Asuka
请教一下,为什么fermi的功耗会那么大
从规格上来看不至于啊
shadewither 发表于 2010-4-10 19:36


个人觉得fermi的功耗应该与工艺选择有更大关系。
回复 支持 反对

使用道具 举报

73#
发表于 2010-4-10 19:42 | 只看该作者
SM(GPR)  L1  L2  MC(DRAM)

从左至右,每一层存储器都是下一层的子集,就是所谓的多级缓存结构
Asuka 发表于 2010-4-10 18:31


L2后面是MC的话,灵活性并没有提高多少啊。如果gpc可以直接通过MC读写内存的话,这个L2才有实用价值。
回复 支持 反对

使用道具 举报

74#
发表于 2010-4-10 19:48 | 只看该作者
如果对存储器层次架构做一个总结的话,AMD不彻底重新设计,在计算领域是没有竞争力的

但对于游戏图形而言 ...
Asuka 发表于 2010-4-10 18:25


nvidia是希望gpu包打天下的,而amd的态度则很明确:fusion。按amd的意思,他们要做的远不是Llano那样集成gpu的cpu,未来说不定会出现 集成cpu的gpu。

如果cpu能接手部分工作,gpu用更复杂的设计来通用化就未必那么必要了
回复 支持 反对

使用道具 举报

75#
 楼主| 发表于 2010-4-10 20:01 | 只看该作者
回复  Asuka
请教一下,为什么fermi的功耗会那么大
从规格上来看不至于啊
shadewither 发表于 2010-4-10 19:36


总结就是6个字:

T S M C 无 能
回复 支持 反对

使用道具 举报

76#
 楼主| 发表于 2010-4-10 20:02 | 只看该作者
个人觉得fermi的功耗应该与工艺选择有更大关系。
spinup 发表于 2010-4-10 19:39



汗,从奔腾pro到现在,绝大多数经典处理器都采用的架构被您一杆子打翻了

老兄去搜索下cache在PC体系结构中的作用
回复 支持 反对

使用道具 举报

77#
发表于 2010-4-10 20:08 | 只看该作者
总结就是6个字:

T S M C 无 能
Asuka 发表于 2010-4-10 20:01

理解了
回复 支持 反对

使用道具 举报

78#
发表于 2010-4-11 13:31 | 只看该作者
貌似TSMC是性价比最高的……
回复 支持 反对

使用道具 举报

79#
 楼主| 发表于 2010-4-11 13:55 | 只看该作者
那你觉得明知TSMC*无*能*还要去撞墙的NV就很有才? 这什么逻辑? 典型的护崽?
败就败了, suck up and move on, 又不是没有下一回了. 又不是方向错了.
那10k的量作为旗舰还是能撑上一阵子的. 市场惯性也不是一朝一夕就能扳回来的.

brl 发表于 2010-4-11 12:55



不是明知

100nm以下的半导体没有明知
回复 支持 反对

使用道具 举报

80#
 楼主| 发表于 2010-4-11 13:56 | 只看该作者
我不知道你怎么得出我的结论是错误的这种结果的, 莫非您认为GF100没有撞墙? 它作为一款GPU不是很失败?
...RV8xx系补补几何单元用来对抗GTX4xx绰绰有余, 有什么不对. 架构落后是落后, 消费者不需要知道这些.
Unigine再强, 16个单元那么高的频率, 才能领先人家一个单元, 不也只能说效率低下么. 比ATi的SP对NV的SP效率还低下.
brl 发表于 2010-4-11 12:38


所以才说你不懂
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-14 00:11

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表