POPPUR爱换

标题: 顶级显卡通过PCIE接口的数据传输速度是每秒钟多少GB? [打印本页]

作者: 380    时间: 2010-6-1 16:27
提示: 作者被禁止或删除 内容自动屏蔽
作者: iamw2d    时间: 2010-6-1 16:35
5770 pcie 1.1 16x
===> Testing device 0 <===
Device type: Unknown
Max resource 2D width/height: 16384/16384
Total GPU memory size: 1024 MB
Total CPU cached space size: 1855 MB
Total CPU uncached space size: 1855 MB
GPU engine clock: 850 MHz
GPU memory clock: 1200 MHz
Number of timing loops: 100
[        16 bytes] CPU->GPU= 242.260 KB/sec, GPU->CPU= 140.117 KB/sec
[        32 bytes] CPU->GPU= 616.366 KB/sec, GPU->CPU= 567.506 KB/sec
[        64 bytes] CPU->GPU=   1.210 MB/sec, GPU->CPU=   1.162 MB/sec
[       128 bytes] CPU->GPU=   2.205 MB/sec, GPU->CPU=   2.861 MB/sec
[       256 bytes] CPU->GPU=   4.663 MB/sec, GPU->CPU=   4.698 MB/sec
[       512 bytes] CPU->GPU=   8.433 MB/sec, GPU->CPU=   4.119 MB/sec
[      1024 bytes] CPU->GPU=  18.401 MB/sec, GPU->CPU=  20.935 MB/sec
[      2048 bytes] CPU->GPU=  38.216 MB/sec, GPU->CPU=  40.868 MB/sec
[      4096 bytes] CPU->GPU=  68.427 MB/sec, GPU->CPU=  59.379 MB/sec
[      8192 bytes] CPU->GPU= 120.992 MB/sec, GPU->CPU=  64.612 MB/sec
[     16384 bytes] CPU->GPU= 279.259 MB/sec, GPU->CPU= 290.333 MB/sec
[     32768 bytes] CPU->GPU= 426.603 MB/sec, GPU->CPU= 513.302 MB/sec
[     65536 bytes] CPU->GPU= 468.653 MB/sec, GPU->CPU=   1.284 GB/sec
[    131072 bytes] CPU->GPU=   2.052 GB/sec, GPU->CPU=   1.923 GB/sec
[    262144 bytes] CPU->GPU=   2.415 GB/sec, GPU->CPU=   2.507 GB/sec
[    524288 bytes] CPU->GPU=   2.530 GB/sec, GPU->CPU=   2.820 GB/sec
[   1048576 bytes] CPU->GPU=   2.724 GB/sec, GPU->CPU=   2.968 GB/sec
[   2097152 bytes] CPU->GPU=   2.817 GB/sec, GPU->CPU=   3.015 GB/sec
[   4194304 bytes] CPU->GPU=   2.830 GB/sec, GPU->CPU=   3.037 GB/sec
[   8388608 bytes] CPU->GPU=   2.837 GB/sec, GPU->CPU=   3.052 GB/sec
[  16777216 bytes] CPU->GPU=   2.837 GB/sec, GPU->CPU=   3.038 GB/sec
[  33554432 bytes] CPU->GPU=   2.856 GB/sec, GPU->CPU=   2.928 GB/sec
[  67108864 bytes] CPU->GPU=   2.855 GB/sec, GPU->CPU=   2.919 GB/sec
[ 134217728 bytes] CPU->GPU=   2.855 GB/sec, GPU->CPU=   2.970 GB/sec
[ 268435456 bytes] CPU->GPU=   2.866 GB/sec, GPU->CPU=   2.962 GB/sec
[ 536870912 bytes] ^C
作者: iamw2d    时间: 2010-6-1 16:35
后面的太费时间 不测了 差不多就这样
作者: 380    时间: 2010-6-1 16:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2010-6-1 17:06
A 卡的 PCIE 带宽比较烂。
作者: 380    时间: 2010-6-1 17:20
提示: 作者被禁止或删除 内容自动屏蔽
作者: nfsking2    时间: 2010-6-1 17:27
回家用CUDA-Z跑个480的带宽看看
不过貌似CUDA-Z不能很合理的利用显卡资源,不知道测出来会跟实际带宽差距有多大
作者: Edison    时间: 2010-6-1 17:33





host to device 和 device to host 就是 pcie 带宽(为主)。
作者: 380    时间: 2010-6-1 17:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: 380    时间: 2010-6-1 17:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2010-6-1 17:57
3GB/s 的带宽实在不算高。
作者: 380    时间: 2010-6-1 18:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: gz_easy    时间: 2010-6-1 18:29
回复 8# Edison
瓶颈应该不在PCIe上,那么这是否可以说明由于AMD GPU本身带宽相对不足而导致PCIe传输率较低?
作者: nfsking2    时间: 2010-6-1 18:56
本帖最后由 nfsking2 于 2010-6-1 18:59 编辑

软件名:OpenCL General Purpose Computing Benchmark

测试平台:
i7 920 @ 212*19
DDR3 1700 2G*3
GTX480默认频率

[attach]1297151[/attach]
[attach]1297152[/attach]
[attach]1297153[/attach]
[attach]1297154[/attach]
[attach]1297155[/attach]
[attach]1297156[/attach]
[attach]1297157[/attach]
[attach]1297158[/attach]
[attach]1297159[/attach]
[attach]1297160[/attach]
[attach]1297161[/attach]

显示的物理内存总数有误,估计是程序本身是32位的原因
不过不知道为什么会显示GTX480频率为810MHz......
作者: gz_easy    时间: 2010-6-1 20:28
810MHz表示当时GTX400的流处理器所处频率,如果用nvidiainspector检测,此时的P State为P8。
作者: nfsking2    时间: 2010-6-1 20:40
810MHz表示当时GTX400的流处理器所处频率,如果用nvidiainspector检测,此时的P State为P8。
gz_easy 发表于 2010-6-1 20:28



流处理器频率应该是核心频率的两倍吧,况且跑这个测试的时候,GPU-Z也确实显示显卡是全速运行的,而仅打开软件,不运行测试时,显卡处于待机频率,貌似无论如何都得不到810MHz这个频率
作者: 380    时间: 2010-6-2 08:52
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4