POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 6075|回复: 27
打印 上一主题 下一主题

Q9的12M缓存是没有用的?

[复制链接]
光辉的晨星 该用户已被删除
跳转到指定楼层
1#
发表于 2008-12-15 09:56 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
2#
发表于 2008-12-15 10:06 | 只看该作者
你朋友是对的,非共享的Cache当然只有当期核心可以用。
回复 支持 反对

使用道具 举报

AlcatrazX 该用户已被删除
3#
发表于 2008-12-15 10:09 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

光辉的晨星 该用户已被删除
4#
 楼主| 发表于 2008-12-15 10:19 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

5#
发表于 2008-12-15 11:47 | 只看该作者
其實i7的L2、L3的問題也是很多人有意見,像是為何每個核心的L2只有256K??
為何要增加L3??
與其增加L3讓四核共享,為何不把L2加大並且誏四核共享等等~~
這需要有這方面知識的人才能解釋{mellow:]
回复 支持 反对

使用道具 举报

6#
发表于 2008-12-15 11:58 | 只看该作者
原帖由 光辉的晨星 于 2008-12-15 10:19 发表
如果是这样的话,那I7的4X256K L2不等于就是调用单核心的话只能用到256K的L2?虽然8M的L3是共享的,但是256K的L2不是太少了吗?既然是原生4核心CPU,为什么不设计成单路1M或者更大L2,四核心共享?这样不是更有利于性能?


缓存的容量、延迟、带宽本来就难以都做得很好

多个核心访问共享缓存是要额外的增加一个访问接口,增加了延迟
而且,缓存的位宽是一定的,频率一定,带宽也是一定。
双核心每个核心就只有一半带宽,四核心就只有1/4. 这样核心就吃不饱了……

独立缓存只能被对应的核心使用,所以容量小,利用率相对差一些,但是带宽高、延迟小
共享缓存容量相对大了,但是延迟高带宽小
所以Nehalem会采用现在这样的设计
回复 支持 反对

使用道具 举报

7#
发表于 2008-12-15 17:55 | 只看该作者
我来认真学习,很想了解
回复 支持 反对

使用道具 举报

tangyi1314 该用户已被删除
8#
发表于 2008-12-15 18:01 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

9#
发表于 2008-12-15 18:08 | 只看该作者
原帖由 光辉的晨星 于 2008-12-15 10:19 发表
如果是这样的话,那I7的4X256K L2不等于就是调用单核心的话只能用到256K的L2?虽然8M的L3是共享的,但是256K的L2不是太少了吗?既然是原生4核心CPU,为什么不设计成单路1M或者更大L2,四核心共享?这样不是更有利于性能?


低延迟、高带宽

命中率的话,有Intel的缓存技术和L3撑着,不怕

不过喝奶的L2确实是小了点
回复 支持 反对

使用道具 举报

10#
发表于 2008-12-15 18:24 | 只看该作者
如果双核i7能够改回core2的缓存架构就好了...
回复 支持 反对

使用道具 举报

11#
发表于 2008-12-15 18:32 | 只看该作者
Core i7的L3延时与带宽与Core2的L2差不了多少,不是AMD那种堪比内存速度的糟糕的L3
回复 支持 反对

使用道具 举报

12#
发表于 2008-12-16 11:29 | 只看该作者
双芯片四核心的两个l2是非共享的
实际上运行中两l2中的内容是一样的
所以其实际相当于只有一个l2的容量

同样i7的构架形式是比较完美的
楼上已经有人解答了为什么每核心一份
至于i7的每核心l2为什么只有256kb
访谈intel时中华区总裁也回答过
设计时考虑过512kb
但是会带来很大的延迟提升
最终在现有技术上256kb是最合适的
i7的缓存可以认为是8.25m
比q9的6m大了很多了

搜下i7缓存测试的图
会发现i7的缓存带宽延迟都是不错的
i7的l3和q9的l2几乎相当

[ 本帖最后由 dinglingwsy 于 2008-12-16 11:31 编辑 ]
回复 支持 反对

使用道具 举报

13#
发表于 2008-12-16 11:43 | 只看该作者
原帖由 dinglingwsy 于 2008-12-16 11:29 发表
双芯片四核心的两个l2是非共享的
实际上运行中两l2中的内容是一样的
所以其实际相当于只有一个l2的容量

同样i7的构架形式是比较完美的
楼上已经有人解答了为什么每核心一份
至于i7的每核心l2为什么只有256kb
...


呵呵,国外某网站干脆说i7 就是在q9 的二级缓存和一级缓存中间插入了一级缓存
回复 支持 反对

使用道具 举报

头像被屏蔽
14#
发表于 2008-12-16 12:47 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

15#
发表于 2008-12-16 13:21 | 只看该作者
原帖由 dinglingwsy 于 2008-12-16 11:29 发表
双芯片四核心的两个l2是非共享的
实际上运行中两l2中的内容是一样的
所以其实际相当于只有一个l2的容量

同样i7的构架形式是比较完美的
楼上已经有人解答了为什么每核心一份
至于i7的每核心l2为什么只有256kb
...


基于核心间数据同步的考虑,i7的L3缓存包含了L2缓存的所有数据
这样一个核心在L3找不到的数据也不可能存在于其他三个核心的L2内
也就省去了请求其他核心的L2缓存数据的步骤,直接转入对内存的请求
所以i7一个核心最大能利用的L2+L3仍然是8M
回复 支持 反对

使用道具 举报

16#
发表于 2008-12-16 20:10 | 只看该作者

回复 1# 光辉的晨星 的帖子

4核本来就是给多核运算提供的方案。
单核心只能用到6M的L2
回复 支持 反对

使用道具 举报

17#
发表于 2008-12-17 01:13 | 只看该作者
学习学习,不发表意见{glare:]
回复 支持 反对

使用道具 举报

18#
发表于 2008-12-19 17:31 | 只看该作者
期待高手来谈谈
回复 支持 反对

使用道具 举报

19#
发表于 2008-12-19 18:33 | 只看该作者
一般来说是这样的!
但这样的好处也是显然易见的!
如果出现一个程序把核心0/1的6M耗尽(不太可能),那E8就死翘翘(具体表现为一卡一卡的),但Q9却可以正常运行其它程序。

这个现象在低端的PE2系列上是经常看到的,不过E8这样的6M对于现在的程序来说几乎相当于无限了,所以E8好像还没有人反映出现这样的问题。

P.S:相对来说,同频下Q9跑PI也是比E8略有优势,不过却很小,主要体现在它的核心多资源多,可以分出两个核心运行系统其它程序,再用另外两个核心的6M全力跑PI。(单核和双核可以明显看出区别,双核和4核就几乎可以忽略不计了……)
回复 支持 反对

使用道具 举报

20#
发表于 2008-12-19 18:35 | 只看该作者
原帖由 frankincense 于 2008-12-16 13:21 发表


基于核心间数据同步的考虑,i7的L3缓存包含了L2缓存的所有数据
这样一个核心在L3找不到的数据也不可能存在于其他三个核心的L2内
也就省去了请求其他核心的L2缓存数据的步骤,直接转入对内存的请求
所以i7一个 ...


学习了{lol:]
那AMD的K10 L3也是这样吗?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-21 22:22

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表