POPPUR爱换

标题: 新aida64缓存与内存测试成绩巨幅提升 [打印本页]

作者: kinno 时间: 2013-6-4 01:13
标题: 新aida64缓存与内存测试成绩巨幅提升
本帖最后由 kinno 于 2013-6-4 01:02 编辑

ULUG1-PRWD6-U8DA7-8DMM4-FUYR8
http://www.myfiles.com.cn/soft/9/9273.htm
[attach]2277309[/attach]
key文件，解压缩放到安装目录下。有了这个就可以不要序列号了，为了预防序列号滥用失效的情况发生。

G1610老aida
[attach]2277313[/attach]

G1610新aida
[attach]2277311[/attach]

2500K@4.5G老aida
[attach]2277314[/attach]

2500K@4.5G新aida
[attach]2277310[/attach]

[attach]2277356[/attach]
汇总。
可以看见，除延迟之外，两个处理器任何项目都有巨幅提升。L3延迟增加带来了带宽巨幅增长。
先看内存，提升还是相当可观的，我记得snb平台内存写入要达到2.4W，基本要求是cpu超4.8G，内存要2133起步。而新版本内存写入直接爆表，2.8W的成绩在老版本snb平台里真没有看见过。要达到估计要超5.2G了。ivb平台可能好一点点，因为内存可以超更高。
再观察最为复杂的写入操作，通过表格更加一目了然看出，2500K的新内存写入已经逼近老版本的L3写入。而新版本的L3写入更是完爆老版本的L1写入。这绝对是革命性的提升。
再对比同项目新老对比，在G1610时，各项目基本上都有翻番。而到了2500K直接逆天，达到了数量级上的提升，L1读取复制提升略小也有4倍之多。

finalwire做了什么让cpu基本能力提升如此之多？而且这还只是snb老架构，不知道新的haswell要怎么样逆天了。这仅仅是软件更新，snb还是以前的snb。看来平常用的软件还是有很大优化余地的，特别是重负载应用。
欢迎交流其他平台的测试情况。

作者: qwased 时间: 2013-6-4 01:25
测试方法改变了？

作者: kinno 时间: 2013-6-4 01:53

qwased 发表于 2013-6-4 01:25
测试方法改变了？

那带宽可是货真价实的增加了啊

作者: amx004 时间: 2013-6-4 12:06
这下子X79四通终于沉冤得雪了

作者: kinno 时间: 2013-6-4 12:57

amx004 发表于 2013-6-4 12:06
这下子X79四通终于沉冤得雪了

还没看见x79的成绩

作者: somarizhou 时间: 2013-6-4 15:38
本帖最后由 somarizhou 于 2013-6-4 15:41 编辑

AIDA64 3.00.2500 更新内容：

Multi-threaded cache and memory bandwidth benchmarks with AVX2, AVX and SSE optimizations
Block-random cache and memory latency benchmark
Optimized 64-bit benchmarks for AMD “Kabini” and “Temash” APUs
AVX2 and FMA optimized 64-bit benchmarks for Intel “Haswell” processors
Preliminary support for L4 cache of Intel “Crystal Well” processors
Crucial M500, OCZ Vertex 450 SSD support
GPU details for AMD Radeon HD 7990 “Malta” and nVIDIA GeForce 700 Series

AVX2，AVX和SSE多线程缓存和内存带宽检测优化
随机块高速缓存和内存延时检测
AMD“Kabini的”和“Temash”APU的64位检测优化
英特尔 “Haswell”处理器的AVX2和FMA的64位检测优化
L4缓存的英特尔“Crystal Well”处理器的初步支持
关键的 M500, OCZ Vertex 450 SSD支持
AMD Radeon HD7990 “Malta” 和NVIDIA GeForce700系列GPU细节
http://bbs.pceva.com.cn/thread-90239-1-1.html

作者: kinno 时间: 2013-6-4 16:14

somarizhou 发表于 2013-6-4 15:38
AIDA64 3.00.2500 更新内容：

Multi-threaded cache and memory bandwidth benchmarks with AVX2, AVX a ...

感谢科普

作者: kinno 时间: 2013-6-4 16:16

4479237 发表于 2013-6-4 16:04
这个是软件优化的问题还是基准提升了？

应该是优化给力呢

作者: gtx5 时间: 2013-6-4 18:39

[attach]2278063[/attach]

作者: inSeek 时间: 2013-6-4 20:36
本帖最后由 inSeek 于 2013-6-4 20:37 编辑

大家没发现：新版L1 L2 带宽就是老版的L1 L2乘以核心数量么...
L3这块乘以核心数量再乘以1.25左右....
原因应该是原来单线程的，现在多线程了...

所以也爆出一个问题...2011，单线程的时候最多用双通道...所以SNB-E似乎就是双通IMC*2...

另外，这个版本...延迟暴增....

作者: kinno 时间: 2013-6-4 21:32

inSeek 发表于 2013-6-4 20:36
大家没发现：新版L1 L2 带宽就是老版的L1 L2乘以核心数量么...
L3这块乘以核心数量再乘以1.25左右....
原 ...

原来如此，那么这等成绩的增长有实际意义吗？
延迟增加不算很严重吧？相比带宽的增加

作者: kinno 时间: 2013-6-4 21:33

gtx5 发表于 2013-6-4 18:39

4通道恐怖啊

作者: sonicrrr 时间: 2013-6-4 22:38
这么猛？

作者: 乐极生悲 时间: 2013-6-4 22:41
提示: 作者被禁止或删除内容自动屏蔽

作者: kinno 时间: 2013-6-5 00:29
为什么我的图都挂了？

作者: inSeek 时间: 2013-6-5 03:00

L1,L2感觉就是这样。x79内存带宽提升似乎不是*2，成绩比这更高，感觉有2.5倍左右

纯猜测啊... 我估计是当时单线程测试（不排除是算法）与两个双通IMC之间发生了些什么，而造成了额外性能开销...

作者: inSeek 时间: 2013-6-5 03:08

kinno 发表于 2013-6-4 21:32
原来如此，那么这等成绩的增长有实际意义吗？
延迟增加不算很严重吧？相比带宽的增加

从分数来说，有意义。多好看，单核，双核，4核，6核间，各种不可逾越。4核，6核多了优越感...
从实际来说无意义，因为AIDA64升级或不升级，SNB-E的各种性能就在那里...

另外...内存延迟咋回事儿，一下子想不到原因...我这儿IVY直接涨了70%的延迟（35左右涨到近60）... 而1156的就涨了25%（46到57）... 所以不排除Ivy的Ringbus在数据吞吐繁重时性能衰减的比Nehalem的XBar多的可能...

突然想到一个有意思的东西，有人来测试下推土机嘛？L1 L2 都比较特殊

作者: kinno 时间: 2013-6-5 08:45

inSeek 发表于 2013-6-5 03:08
从分数来说，有意义。多好看，单核，双核，4核，6核间，各种不可逾越。4核，6核多了优越感...
从实际来说 ...

aida的成绩确实提升，但是这个成绩代表的是内存带宽这种计算机系统最基本的指标，应该对实际情况还是很有好处的吧？我的意思是，这种多线程增加带宽的程序写法，其他程序也可以采用

作者: crespo442 时间: 2013-6-5 13:22
本帖最后由 crespo442 于 2013-6-5 13:52 编辑

3.0的算法肯定是有改变的，就如同SiSoftware Sandra测试4通的内存带宽优势是巨大的一样。感觉3.0尤其是对内存有了更高的要求，其中在内存频率相差不大的情况以时序的送紧影响比前几个版本更为明显。

作者: kinno 时间: 2013-6-5 13:54

crespo442 发表于 2013-6-5 13:22
3.0的算法肯定是有改变的，就如同SiSoftware Sandra测试4通的内存带宽优势是巨大的一样。感觉3.0尤其是对内 ...

要是普通程序访问内存能多线程并发，那就很棒了

作者: inSeek 时间: 2013-6-5 14:22

kinno 发表于 2013-6-5 08:45
aida的成绩确实提升，但是这个成绩代表的是内存带宽这种计算机系统最基本的指标，应该对实际情况还是很有 ...

问题是，能多线程的早就多线程了，不多线程的估计也不会去多线程....
另外测试内存带宽为目的的算法和实际使用环境下的那些算法还是有差别的...
就像这新版，要是1600 CL11和2133 CL9我估摸着有20%+的带宽差距... 但实际使用中最后性能差距可能就3%都不到...

作者: crespo442 时间: 2013-6-5 14:35
本帖最后由 crespo442 于 2013-6-5 14:39 编辑

inSeek 发表于 2013-6-5 14:22
问题是，能多线程的早就多线程了，不多线程的估计也不会去多线程....
另外测试内存带宽为目的的算法和实 ...

抛开主频因素，大概1600 c11和2133 c9带宽8%左右把！实际使用中最后性能差距也许连1%都不到。主频提升却在实际使用中是实实在在的。

作者: inSeek 时间: 2013-6-5 15:04
我这儿有27%的差距... 不过是1600 CL11 + 3.7G 和 2133 CL9 + 4.4G，主频也有带来带宽性能差距...
其实现在的U，大部分时候带宽需求不大的... 延迟更重要...
这版AIDA64，觉得还是需要时间考验... 估摸着官方会陆陆续续有修改优化...

作者: crespo442 时间: 2013-6-5 15:57
本帖最后由 crespo442 于 2013-6-5 16:03 编辑

跑了下4.9g，基本在3.0中相比之前的4.5g的带宽提升已经很小了，所以没兴趣再往上超了。看来read和write要想在这个版本中破双7w，即使是imc更好的ivy-e也是不能指望的！

作者: kinno 时间: 2013-6-6 00:33

inSeek 发表于 2013-6-5 15:04
我这儿有27%的差距... 不过是1600 CL11 + 3.7G 和 2133 CL9 + 4.4G，主频也有带来带宽性能差距...
其实现在 ...

请教下，延迟到底有何意义？是不是从cpu请求访问内存开始计时到内存做出响应的时间差？

作者: inSeek 时间: 2013-6-6 01:46

kinno 发表于 2013-6-6 00:33
请教下，延迟到底有何意义？是不是从cpu请求访问内存开始计时到内存做出响应的时间差？

就是在CPU在L1 L2 L3都命中失败之后，决定去内存获取数据开始，到拿到数据为止的时间...这个期间CPU对于此线程是暂停计算的...所以内存延迟越小，遇到L1-LLC都miss的时候的性能损失越小...

作者: kinno 时间: 2013-6-6 09:25

inSeek 发表于 2013-6-6 01:46
就是在CPU在L1 L2 L3都命中失败之后，决定去内存获取数据开始，到拿到数据为止的时间...这个期间CPU对于此 ...

谢谢，和我理解的差不多。可否认为，轻微牺牲延迟带来带宽大幅增长，是合算的？

作者: 为爱琳 时间: 2013-6-6 15:11
本帖最后由为爱琳于 2013-6-6 15:12 编辑

用高端主板比中端主板读写能力，算了吧

不是人人用都用FX990 X58 X79要放就放些平民些的H61 H67 Z68

AMD 970你比较才有意义

作者: crespo442 时间: 2013-6-15 10:46
呵呵！内存带宽和总线带宽傻傻的分不清？FX990能和X79相提并论？

作者: bassenan 时间: 2013-6-15 12:41

crespo442 发表于 2013-6-5 15:57
跑了下4.9g，基本在3.0中相比之前的4.5g的带宽提升已经很小了，所以没兴趣再往上超了。看来read和write要想 ...

配置流口水啊，高富帅！~

作者: somarizhou 时间: 2013-6-15 13:16

crespo442 发表于 2013-6-5 13:22
3.0的算法肯定是有改变的，就如同SiSoftware Sandra测试4通的内存带宽优势是巨大的一样。感觉3.0尤其是对内 ...

为何x58的3通道，没什么质变？是说1366的3通也就相当于snb、ivy的双通道？[attach]2287488[/attach]

作者: crespo442 时间: 2013-6-15 13:30
本帖最后由 crespo442 于 2013-6-15 13:31 编辑

somarizhou 发表于 2013-6-15 13:16
为何x58的3通道，没什么质变？是说1366的3通也就相当于snb、ivy的双通道？

老架构 Nehalem的3通道受制于uc的频率内存效能本来就不如新架构的 snb ivy，但是3.0这个版本的计算方式对内存频率，时序，通道数也有了更高的要求，所以同频率大概略优于 1155，你不妨跑18x200 2000 uc 4000 应该更耐看点！

作者: somarizhou 时间: 2013-6-15 13:41
本帖最后由 somarizhou 于 2013-6-15 13:42 编辑

crespo442 发表于 2013-6-15 13:30
老架构 Nehalem的3通道受制于uc的频率内存效能本来就不如新架构的 snb ivy，但是3.0这个版本的计算方式 ...

L5520普通下，内存最高也就跑在18xx了，200外频不好上。
现在是1600，uc已经3208了，按说也满足2倍了，这分也就这样。

作者: crespo442 时间: 2013-6-15 13:47

somarizhou 发表于 2013-6-15 13:41
L5520普通下，内存最高也就跑在18xx了，200外频不好上。
现在是1600，uc已经3208了，按说也满足2倍了，这 ...

200其实是很好跑的，至于uc能不能跑4000和u的imc，条子以及板子都是息息相关的。当然最重要的是玩东西，玩的开心就行，没必要去追求完美！

作者: somarizhou 时间: 2013-6-15 14:07

crespo442 发表于 2013-6-15 13:47
200其实是很好跑的，至于uc能不能跑4000和u的imc，条子以及板子都是息息相关的。当然最重要的是玩东西，玩 ...

我说错了，200外频好上，220很难了。条子是美光运动1333的，跑在1600的三条9已经可以了。板子x58d-e，据说是二手的。
对了，还想问下，如果开了c-state，最高19x倍频单核影响内存频率吗？

作者: kinno 时间: 2013-6-15 14:34

somarizhou 发表于 2013-6-15 13:16
为何x58的3通道，没什么质变？是说1366的3通也就相当于snb、ivy的双通道？

x58自从snb面世以来，内存性能就被战爆了。现在还是这样子。

作者: somarizhou 时间: 2013-6-15 14:43
除了aida还有啥测试内存的？SiSoftware Sandra？

作者: crespo442 时间: 2013-6-15 15:08
yes!!!!!!

作者: Ephyer 时间: 2013-6-15 16:58
刚上了下1155平台，I3 3220的，内存还是A3A神条，内存方面速度还是挺好的。
[attach]2287765[/attach]

作者: crespo442 时间: 2013-6-15 17:10
本帖最后由 crespo442 于 2013-6-15 17:12 编辑

Ephyer 发表于 2013-6-15 16:58
刚上了下1155平台，I3 3220的，内存还是A3A神条，内存方面速度还是挺好的。

单颗粒128m的力晶a3g-x 确实很强啊！可惜以前出了两对，好点的如果跑2133 6-10-7 或者2400 7-11-7 会更碉堡！

作者: Ephyer 时间: 2013-6-15 17:13

crespo442 发表于 2013-6-15 17:10
单颗粒128m的力晶a3g-x 确实很强啊！可惜以前出了两对，好点的如果跑2133 7-10-7 或者2400 7-11-7 会 ...

可惜都是2G的``bbb，

以前有3条A3G-A，出掉了2条，只剩一条了，无奈淘宝了一条A3G-U，凑成一对，这样就不用测试的时候拔x79上的黑武士了。

作者: kinno 时间: 2013-6-15 17:57

Ephyer 发表于 2013-6-15 16:58
刚上了下1155平台，I3 3220的，内存还是A3A神条，内存方面速度还是挺好的。

写超3W，NB

作者: crespo442 时间: 2013-6-15 19:16
本帖最后由 crespo442 于 2013-6-15 19:33 编辑

kinno 发表于 2013-6-15 17:57
写超3W，NB

早就说了3.0以通道数,多线程,内存频率时序为标杆!

作者: kinno 时间: 2013-6-15 20:10

crespo442 发表于 2013-6-15 19:16
早就说了3.0以通道数,多线程,内存频率时序为标杆!

恩，以前没法比

作者: 为爱琳 时间: 2013-6-15 22:32
本帖最后由为爱琳于 2013-6-15 22:33 编辑

多线程个屁8320跟6300同频跑分一样读写性能。

什么时候才完完全全优化8线程就是四核死期的时候，

作者: crespo442 时间: 2013-6-16 20:06
本帖最后由 crespo442 于 2013-6-16 20:53 编辑

又是脑残+地摊货的组合来扎眼!世间偏有这么欢快的细胞~

作者: OCL 时间: 2016-12-16 19:15
挖一下坟

被收购后就开始作弊

内存呼呼飞
缓存L1 起步双倍 I5以上3倍

期待大家用老版本测试一下双通道级别的内存四代五代cpu的老AD64的成绩
L1速度决定整个框架的成熟。L1带宽一直是瓶颈（有的框架设置成SATA3 pcieX16就降到X8）

作者: kinno 时间: 2016-12-21 18:38
这个软件有啥好作弊的？

作者: OCL 时间: 2016-12-24 01:17

kinno 发表于 2016-12-21 18:38
这个软件有啥好作弊的？

你说呢？你给我钱，我就给你的硬件N倍的分数。

三倍起步。

欢迎光临 POPPUR爱换 (http://we.poppur.com/)