|
Tesla V100是基于Volta架构的产品,内置了5120个CUDA单元,核心频率为1455MHz,搭载16GB HBM2显存,单精度浮点性能15 TFLOPS,双精度浮点7.5 TFLOPS,显存带宽900GB/s。此外,Tesla V100还增加与深度学习高度相关的Tensor单元,Tensor性能号称可以达到120 TFLOPS。
作为对比,上代旗舰Tesla P100不过只有3584个CUDA核心,拥有153亿个晶体管,核心面积610平方毫米(16nm FET+工艺)。同时,Tesla V100的二级缓存及寄存器大小也有所增加,L2缓存由Tesla P100的4096KB增加到了6144KB,每组SM单元的寄存器文件大小总数从14336KB增加到了20480KB。
Tesla V100
Tesla V100
Tesla V100
Tesla V100
|
|