POPPUR爱换

标题: CPU2000测试中各子系统性能瓶颈影响百分比[基于精确模拟] [打印本页]

作者: Edison    时间: 2006-12-18 19:31
标题: CPU2000测试中各子系统性能瓶颈影响百分比[基于精确模拟]
http://www.pcinlife.com/ours/edison/cpu2000_details.png

来源:http://www.spec.org/workshops/2006/papers/11_SPEC_2006.pdf
作者: hopetoknow    时间: 2006-12-19 17:38
分支miss代价  的影响 仅为 0.4%

远不如
不同的分支预测器的预测精度的影响大(好像是排名第4位)

想想

其实现在看来:

P4的ROB是126 entries, 在x86中数字最大了,比酷睿2的96-entries还要大。 A的72-entries多。

L2也大

但是后期P4的缓存延迟和内存延迟让P4......
作者: hopetoknow    时间: 2006-12-19 17:40
性能影响排名:
1. ROB
2. L2容量
3. 内存延迟
4. L2延迟
5. 分支预测器
......
作者: hopetoknow    时间: 2006-12-19 17:49
不知道K8L的ROB有变大了吗?

其实从4核跑rates的观点看,K8L的L2比OP缩小了,延迟也变大了。

L2缩小一半。 L3延迟高,还要分给4个核心,结果都不如L2。
等于原来OP是 1M的L2。但K8L 4核把L3分下来, 现在却是 0.5M的L2 和 0.5M的高延迟低带宽L3了。

真的运行单Chip的4核spec rates, 反而不如原来OP的L2 1M有利。
作者: itany    时间: 2006-12-19 18:54
原帖由 hopetoknow 于 2006-12-19 17:49 发表
不知道K8L的ROB有变大了吗?

其实从4核跑rates的观点看,K8L的L2比OP缩小了,延迟也变大了。

L2缩小一半。 L3延迟高,还要分给4个核心,结果都不如L2。
等于原来OP是 1M的L2。但K8L 4核把L3分下来, 现在 ...


45nm的Penryne是不是可能会增加ROB数量啊?或者增加L1的大小?
作者: hopetoknow    时间: 2006-12-19 19:32
真的不清楚




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4