原帖由 colddawn 于 2007-12-2 00:33 发表
问一下第6点,对于L2/L3的共享缓存,到底是怎么实现多硬件线程并发访问时的同步控制的?有单独的锁缓存指令吗?能细到什么粒度?如果有的话那肯定可以确认是需要操作系统支持了,会有补丁?
原帖由 colddawn 于 2007-12-2 00:33 发表
问一下第6点,对于L2/L3的共享缓存,到底是怎么实现多硬件线程并发访问时的同步控制的?有单独的锁缓存指令吗?能细到什么粒度?如果有的话那肯定可以确认是需要操作系统支持了,会有补丁?
原帖由 哈哈小刀 于 2007-12-3 05:39 PM 发表
对核心的东西我一点都不懂,只是看到百万小时的测试。那算100万小时吧
100万/24/365=114年,看来Intel的确花了不少心血。
原帖由 colddawn 于 2007-12-3 19:06 发表
这个知道,我意思是硬件保证同步的同时必然带来时延,有时必要向操作系统暴露一些同步细节可以使系统在线程调度行为时尽量避免出现需要硬件进行同步的情况,否则就有可能出现在某种情况下两个核心的缓存行为出现较强 ...
原帖由 colddawn 于 2007-12-3 19:24 发表
呵呵,刚回复又多了内容,补一个
硬件同步自然比软件同步延迟小,但软件可以通过调度策略避免过多的同步行为,并不是说要在软件层面实现同步,这可以理解为一种优化策略吧,比如说系统可以优先将任务调度至分离缓存 ...
原帖由 itany 于 2007-12-3 19:32 发表
我觉得一方面是编译器对现有架构的优化,另一方面是新架构对于已有代码执行效率的妥协,毕竟软硬件是互动的
我认为共享缓存、SMT、NUMA这样的“非传统”结构,在软件的优化下将发挥的更好,但是毕竟软件是渐进式 ...
原帖由 colddawn 于 2007-12-3 19:34 发表
Right,就是这里,所以你认为K10这次属于前者还是后者呢?我认为K10的L3效能提升还是要先做好软件的准备工作,至于这两天那15%的提升,是什么样子的bug导致的有具体细节吗:loveliness:
原帖由 itany 于 2007-12-3 19:43 发表
具体细节不清楚……
但是,如果YY K10通过软件挖掘性能潜力,我看还是算了吧
如果说通过软件,比如说改进OS的线程调度和内存访问,可以优化共享缓存的性能,那有理由相信,容量更大、硬件延迟更低、更依赖于缓 ...
原帖由 colddawn 于 2007-12-3 19:50 发表
当然是指操作系统,谈系统优化已经有点超前了,应用软件要谈的话恐怕要等更久
不论谁延迟低,谁容量大,单是划分出L3这一点来看,从技术复杂度上已经先迈出一步了。共享缓存的策略在某些领域有测试能证明>8 threa ...
原帖由 itany 于 2007-12-3 20:00 发表
在Server上,共享L3早就有了,Tulsa就是共享L3的,Dunnington也会,至于Nehalem估计也会共享L3缓存,容量都比AMD要大
如果说要优化,还是Intel更占便宜
桌面上么,我不认为能优化出什么特别的来。反正能优化更 ...
原帖由 colddawn 于 2007-12-3 19:34 发表
Right,就是这里,所以你认为K10这次属于前者还是后者呢?我认为K10的L3效能提升还是要先做好软件的准备工作,至于这两天那15%的提升,是什么样子的bug导致的有具体细节吗:loveliness:
Currently, the L3 cache/NB on these chips runs ata fixed frequency that's actually lower than the rest of the CPUfrequency: 2.0GHz. We tested Phenoms running from 2.2GHz all the way upto 2.6GHz, and in all cases the L3 cache and North Bridge ran at 2.0GHz.
原帖由 acqwer 于 2007-12-3 21:04 发表
K10的BUG嘛,按anandtech的说法是L3和南桥都只能跑在2G。
以inq的RP,搞不好这个10~15%的提升指的是L3从2G提升到2.2G(9500)和2.3G(9600)。
欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |