|
这篇报道提出 Top500 使用的 HPL 不能全面反映 HPC 性能这个观点虽然不错,但是它举的一些例子不恰当,而且文中存在一些容易引起误导的因素。
1、目前 10 万台 Android 手机跑 HPL 不可能达到天河一号 A 的水准,这样的“集群”即使拼凑得起来,性能也相差三个数量级。
2、在历史上,提出 Linpack(Top 500 使用的是 HPL 2.0,Linpack 的集群版,和大家跑 LinX 的那个是不同的,LinX 那个使用的是 Intel C 编译器+MKL 编译的 Linpack 1000D 修订版,HPL 的效率要比 1000D 低一些,不过由于 MKL 比较烂,如果采用 GCC+GotoBLAS 来编译 HPL,性能只会比 Intel 那个修改版 Linpack 1000D 更快)不能适应 HPC 发展、无法反映 HPC 全面性能的呼声一直存在,几年前就有一个叫 HPCC(HPC Challenge)的 project,它把 Stream、pingpong、HPL、Ptrans、FFT 等几个测试包在一起执行测试并递交结果,不过这样的问题是虽然结果挺全了,但是依然让一般人无法可以较快地判定谁快谁慢。
3、Graph 500 的测试包可以用来测试传统的 “最高运算性能” 这个东西外,还尝试引入能反映未来超级计算所针对的“巨大 dataset”(数据密集型)测试。
数组的规模有以下档次:
toy
17GB or around 1010 bytes, which we also call level 10,
mini
140GB (1011 bytes, level 11),
small
1TB (1012 bytes, level 12),
medium
17TB (1013 bytes, level 13),
large
140TB (1014 bytes, level 14), and
huge
1.1PB (1015 bytes, level 15).
搞 Graph 500 的会员有 Intel、IBM、AMD、 NVIDIA、Oracle ,大约有三十个会员,Oracle 收购以前的 SUN,这几家公司都会参与美国 ExaFLOPS 级别 HPC 的投标,Graph 500 就是 Sandia (另一个 ExaFLOPS 项目投标者)牵头。
在我看来, Graph 500 其实反映了未来异架构计算(因为这基本上是未来 HPC 的基调)的一些挑战,例如 cache 层次之类的,对 NVIDIA、AMD 来说,GPU 与 CPU 的合并是应对这类应用的不二选择(某种程度上也是催生 Graph 500 的民意基础)。 |
|