R800和GF100的缓存层次结构对比

Asuka · 发表于 2010-4-10 18:25

如果对存储器层次架构做一个总结的话，AMD不彻底重新设计，在计算领域是没有竞争力的

但对于游戏图形而言，NV和AMD架构上区别造成的影响却不大

Asuka · 发表于 2010-4-10 18:31

gf100的图,L2跟内存是连在一起的,中间的MC是怎样的?gpc要通过L2去访问gobal memory?
los_parrot 发表于 2010-4-10 18:02

SM(GPR) <————> L1 <————> L2 <————> MC(DRAM)

从左至右，每一层存储器都是下一层的子集，就是所谓的多级缓存结构

llkkoo007 · 发表于 2010-4-10 18:46

看清楚了

shadewither · 发表于 2010-4-10 19:03

作为看惯了x86 mpu的人，总觉得gf100的缓存好吝啬
尤其是L2和scratchpad

Asuka · 发表于 2010-4-10 19:04

作为看惯了x86 mpu的人，总觉得gf100的缓存好吝啬
尤其是L2和scratchpad
shadewither 发表于 2010-4-10 19:03

安腾和Power表示，x86的缓存容量属于儿童玩具

Asuka · 发表于 2010-4-10 19:06

GF100是典型的流式多处理器，应用环境和CPU交集很少

shadewither · 发表于 2010-4-10 19:06

安腾和Power表示，x86的缓存容量属于儿童玩具
Asuka 发表于 2010-4-10 19:04

white elephant不说，power的那种缓存性能……

Asuka · 发表于 2010-4-10 19:06

white elephant不说，power的那种缓存性能……
shadewither 发表于 2010-4-10 19:06

P7很变态呀

shadewither · 发表于 2010-4-10 19:12

P7很变态呀
Asuka 发表于 2010-4-10 19:06

l3也就4M/core，nehalem也有2-3了

Asuka · 发表于 2010-4-10 19:16

l3也就4M/core，nehalem也有2-3了
shadewither 发表于 2010-4-10 19:12

不能这样比呀，CPU整个体系可以说跟着"Cache hit"进行的布局，而GPU的整个体系都是为了"Cache miss"设计的

shadewither · 发表于 2010-4-10 19:36

回复 93# Asuka
请教一下,为什么fermi的功耗会那么大
从规格上来看不至于啊

spinup · 发表于 2010-4-10 19:39

回复 Asuka
请教一下,为什么fermi的功耗会那么大
从规格上来看不至于啊
shadewither 发表于 2010-4-10 19:36

个人觉得fermi的功耗应该与工艺选择有更大关系。

los_parrot · 发表于 2010-4-10 19:42

SM(GPR) L1 L2 MC(DRAM)

从左至右，每一层存储器都是下一层的子集，就是所谓的多级缓存结构
Asuka 发表于 2010-4-10 18:31

L2后面是MC的话，灵活性并没有提高多少啊。如果gpc可以直接通过MC读写内存的话，这个L2才有实用价值。

spinup · 发表于 2010-4-10 19:48

如果对存储器层次架构做一个总结的话，AMD不彻底重新设计，在计算领域是没有竞争力的

但对于游戏图形而言 ...
Asuka 发表于 2010-4-10 18:25

nvidia是希望gpu包打天下的，而amd的态度则很明确：fusion。按amd的意思，他们要做的远不是Llano那样集成gpu的cpu，未来说不定会出现集成cpu的gpu。

如果cpu能接手部分工作，gpu用更复杂的设计来通用化就未必那么必要了

Asuka · 发表于 2010-4-10 20:01

回复 Asuka
请教一下,为什么fermi的功耗会那么大
从规格上来看不至于啊
shadewither 发表于 2010-4-10 19:36

总结就是6个字：

T S M C 无能

Asuka · 发表于 2010-4-10 20:02

个人觉得fermi的功耗应该与工艺选择有更大关系。
spinup 发表于 2010-4-10 19:39

汗，从奔腾pro到现在，绝大多数经典处理器都采用的架构被您一杆子打翻了

老兄去搜索下cache在PC体系结构中的作用

shadewither · 发表于 2010-4-10 20:08

总结就是6个字：

T S M C 无能
Asuka 发表于 2010-4-10 20:01

理解了

yamhill · 发表于 2010-4-11 13:31

貌似TSMC是性价比最高的……

Asuka · 发表于 2010-4-11 13:55

那你觉得明知TSMC*无*能*还要去撞墙的NV就很有才? 这什么逻辑? 典型的护崽?
败就败了, suck up and move on, 又不是没有下一回了. 又不是方向错了.
那10k的量作为旗舰还是能撑上一阵子的. 市场惯性也不是一朝一夕就能扳回来的.

brl 发表于 2010-4-11 12:55

不是明知

100nm以下的半导体没有明知

Asuka · 发表于 2010-4-11 13:56

我不知道你怎么得出我的结论是错误的这种结果的, 莫非您认为GF100没有撞墙? 它作为一款GPU不是很失败?
...RV8xx系补补几何单元用来对抗GTX4xx绰绰有余, 有什么不对. 架构落后是落后, 消费者不需要知道这些.
Unigine再强, 16个单元那么高的频率, 才能领先人家一个单元, 不也只能说效率低下么. 比ATi的SP对NV的SP效率还低下.
brl 发表于 2010-4-11 12:38

所以才说你不懂

帐号		自动登录	找回密码
密码			注册