POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3001|回复: 10
打印 上一主题 下一主题

Yonah的指令延迟和吞吐能力

[复制链接]
跳转到指定楼层
1#
发表于 2006-4-14 23:53 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  1. ------[ CPU Info ]------

  2. CPU Type           : Mobile DualCore Intel Core Duo, 1833 MHz (11 x 167)
  3. CPU Alias          : Yonah
  4. CPU Stepping       : C0
  5. Instruction Set    : x86, MMX, SSE, SSE2, SSE3
  6. CPUID Manufacturer : GenuineIntel
  7. CPUID CPU Name     : Genuine Intel(R) CPU T2400 @ 1.83GHz
  8. CPUID Revision     : 000006E8h
  9. IA Brand ID        : 00h  (Unknown)
  10. Platform ID        : 05h  (Mobile uPGA2)

  11. !!! MAKE SURE TO RUN THIS BENCHMARK FROM A/C POWER, AND NOT FROM BATTERIES !!!
  12. Inst   0 X86   : NOP                   Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  13. Inst   1 X86   : MOV r32, r32          Lat:   0.55ns=   1.0c  TPut:   0.28ns=   0.50c
  14. Inst   2 CMOV  : CMOV r32, r32         Lat:   1.09ns=   2.0c  TPut:   0.55ns=   1.00c
  15. Inst   3 X86   : ADD r32, r32          Lat:   0.55ns=   1.0c  TPut:   0.28ns=   0.50c
  16. Inst   4 X86   : ADC r32, r32          Lat:   1.09ns=   2.0c  TPut:   1.09ns=   2.00c
  17. Inst   5 X86   : CMP r32, r32          Lat:   0.28ns=   0.5c  TPut:   0.28ns=   0.50c
  18. Inst   6 X86   : CMP r32_1, r32_2      Lat:   0.28ns=   0.5c  TPut:   0.28ns=   0.50c
  19. Inst   7 X86   : AND r32, r32          Lat:   0.55ns=   1.0c  TPut:   0.28ns=   0.50c
  20. Inst   8 X86   : AND r32_1, r32_2      Lat:   0.55ns=   1.0c  TPut:   0.26ns=   0.47c
  21. Inst   9 X86   : OR r32, r32           Lat:   0.55ns=   1.0c  TPut:   0.28ns=   0.50c
  22. Inst  10 X86   : OR r32_1, r32_2       Lat:   0.55ns=   1.0c  TPut:   0.26ns=   0.47c
  23. Inst  11 X86   : XOR r32, r32          Lat:   0.28ns=   0.5c  TPut:   0.27ns=   0.50c
  24. Inst  12 X86   : XOR r32_1, r32_2      Lat:   0.55ns=   1.0c  TPut:   0.24ns=   0.44c
  25. Inst  13 X86   : INC r32               Lat:   0.55ns=   1.0c  TPut:   0.27ns=   0.50c
  26. Inst  14 X86   : LEA r32, [r32+r32]    Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  27. Inst  15 X86   : LEA r32, [r32+8*r32]  Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  28. Inst  16 X86   : SHL r32, 1            Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  29. Inst  17 X86   : SHL r32, 3            Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  30. Inst  18 X86   : SHL r32, cl           Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  31. Inst  19 X86   : ROL r32, 1            Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  32. Inst  20 X86   : ROL r32, 3            Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  33. Inst  21 X86   : ROL r32, cl           Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  34. Inst  22 X86   : BSWAP r32             Lat:   1.09ns=   2.0c  TPut:   0.55ns=   1.00c
  35. Inst  23 X86   : IMUL r8               Lat:   2.19ns=   4.0c  TPut:   2.19ns=   4.00c
  36. Inst  24 X86   : IMUL r16, r16         Lat:   2.19ns=   4.0c  TPut:   0.55ns=   1.00c
  37. Inst  25 X86   : IMUL r32, r32         Lat:   2.19ns=   4.0c  TPut:   0.55ns=   1.00c
  38. Inst  26 X86   : MUL r8                Lat:   2.19ns=   4.0c  TPut:   2.19ns=   4.00c
  39. Inst  27 X86   : MUL r16               Lat:   2.73ns=   5.0c  TPut:   2.73ns=   5.00c
  40. Inst  28 X86   : MUL r32               Lat:   2.73ns=   5.0c  TPut:   2.73ns=   5.00c
  41. Inst  29 X86   : IDIV r8               Lat:   8.75ns=  16.0c  TPut:   8.75ns=  16.00c
  42. Inst  30 X86   : IDIV r16              Lat:   8.20ns=  15.0c  TPut:   8.20ns=  15.00c
  43. Inst  31 X86   : IDIV r32              Lat:   8.20ns=  15.0c  TPut:   8.20ns=  15.00c
  44. Inst  32 X86   : DIV r8                Lat:   8.75ns=  16.0c  TPut:   8.75ns=  16.00c
  45. Inst  33 X86   : DIV r16               Lat:   8.20ns=  15.0c  TPut:   8.20ns=  15.00c
  46. Inst  34 X86   : DIV r32               Lat:   8.20ns=  15.0c  TPut:   8.20ns=  15.00c
  47. Inst  35 X87   : FNOP                  Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  48. Inst  36 X87   : FXCH                  Lat:   0.21ns=   0.4c  TPut:   0.21ns=   0.38c
  49. Inst  37 X87   : FCHS                  Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  50. Inst  38 X87   : FCHS+FXCH             Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  51. Inst  39 CMOV  : FCMOV st, st(i)       Lat:   1.09ns=   2.0c  TPut:   1.09ns=   2.00c
  52. Inst  40 X87   : FADD st(i), st        Lat:   1.64ns=   3.0c  TPut:   0.55ns=   1.00c
  53. Inst  41 X87   : FMUL st(i), st        Lat:   2.73ns=   5.0c  TPut:   1.09ns=   2.00c
  54. Inst  42 X87   : FDIV32 st(i), st      Lat:   9.84ns=  18.0c  TPut:   9.30ns=  17.00c
  55. Inst  43 X87   : FDIV64 st(i), st      Lat:  17.50ns=  32.0c  TPut:  16.95ns=  31.00c
  56. Inst  44 X87   : FDIV80 st(i), st      Lat:  20.78ns=  38.0c  TPut:  20.23ns=  37.00c
  57. Inst  45 X87   : FDIV0 st(i), st       Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  58. Inst  46 X87   : FDIV1 st(i), st       Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  59. Inst  47 X87   : FDIV2 st(i), st       Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  60. Inst  48 X87   : FSQRT32 st(i), st     Lat:  15.86ns=  29.0c  TPut:  15.31ns=  28.00c
  61. Inst  49 X87   : FSQRT64 st(i), st     Lat:  31.72ns=  58.0c  TPut:  31.17ns=  57.00c
  62. Inst  50 X87   : FSQRT80 st(i), st     Lat:  37.73ns=  69.0c  TPut:  37.73ns=  69.00c
  63. Inst  51 X87   : FSQRT0 st(i), st      Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  64. Inst  52 X87   : FSQRT1 st(i), st      Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  65. Inst  53 MMX   : MOVQ mm, mm           Lat:   0.55ns=   1.0c  TPut:   0.27ns=   0.50c
  66. Inst  54 MMX   : PADDD mm, mm          Lat:   0.55ns=   1.0c  TPut:   0.27ns=   0.50c
  67. Inst  55 MMX   : PMULHW mm, mm         Lat:   1.64ns=   3.0c  TPut:   0.55ns=   1.00c
  68. Inst  56 MMX   : PMADDWD mm, mm        Lat:   1.64ns=   3.0c  TPut:   0.55ns=   1.00c
  69. Inst  57 MMX   : PSRLQ mm, mm          Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  70. Inst  66 MMX+  : PMOVMSKB r32, mm      Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  71. Inst  67 MMX+  : PSHUFW mm, mm, im8    Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  72. Inst  68 SSE   : MOVAPS xmm, xmm       Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  73. Inst  69 SSE   : MOVSS xmm, xmm        Lat:   0.55ns=   1.0c  TPut:   0.27ns=   0.50c
  74. Inst  70 SSE   : ADDSS xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   0.55ns=   1.00c
  75. Inst  71 SSE   : ADDPS xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   1.09ns=   2.00c
  76. Inst  72 SSE   : MULSS xmm, xmm        Lat:   2.19ns=   4.0c  TPut:   0.55ns=   1.00c
  77. Inst  73 SSE   : MULPS xmm, xmm        Lat:   2.19ns=   4.0c  TPut:   1.09ns=   2.00c
  78. Inst  74 SSE   : MINSS xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   1.64ns=   3.00c
  79. Inst  75 SSE   : MINPS xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   1.64ns=   3.00c
  80. Inst  76 SSE   : RCPSS xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   0.55ns=   1.00c
  81. Inst  77 SSE   : RCPPS xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   1.09ns=   2.00c
  82. Inst  78 SSE   : XORPS xmm, xmm        Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  83. Inst  79 SSE   : SHUFPS xmm, xmm, im8  Lat:   1.09ns=   2.0c  TPut:   1.09ns=   2.00c
  84. Inst  80 SSE   : DIVSS xmm, xmm        Lat:   9.84ns=  18.0c  TPut:   9.30ns=  17.00c
  85. Inst  81 SSE   : DIVPS xmm, xmm        Lat:  18.59ns=  34.0c  TPut:  18.59ns=  34.00c
  86. Inst  82 SSE   : DIVSS0 xmm, xmm       Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  87. Inst  83 SSE   : DIVSS1 xmm, xmm       Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  88. Inst  84 SSE   : DIVSS2 xmm, xmm       Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  89. Inst  85 SSE   : DIVPS0 xmm, xmm       Lat:   4.38ns=   8.0c  TPut:   4.38ns=   8.00c
  90. Inst  86 SSE   : DIVPS1 xmm, xmm       Lat:   4.38ns=   8.0c  TPut:   4.38ns=   8.00c
  91. Inst  87 SSE   : DIVPS2 xmm, xmm       Lat:   4.38ns=   8.0c  TPut:   4.38ns=   8.00c
  92. Inst  88 SSE   : SQRTSS xmm, xmm       Lat:  16.41ns=  30.0c  TPut:  15.31ns=  28.00c
  93. Inst  89 SSE   : SQRTPS xmm, xmm       Lat:  30.63ns=  56.0c  TPut:  30.63ns=  56.00c
  94. Inst  90 SSE   : SQRTSS0 xmm, xmm      Lat:   3.28ns=   6.0c  TPut:   2.19ns=   4.00c
  95. Inst  91 SSE   : SQRTSS1 xmm, xmm      Lat:   3.28ns=   6.0c  TPut:   2.19ns=   4.00c
  96. Inst  92 SSE   : SQRTPS0 xmm, xmm      Lat:   4.38ns=   8.0c  TPut:   4.38ns=   8.00c
  97. Inst  93 SSE   : SQRTPS1 xmm, xmm      Lat:   4.38ns=   8.0c  TPut:   4.38ns=   8.00c
  98. Inst  94 SSE2  : MOVAPD xmm, xmm       Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  99. Inst  95 SSE2  : MOVSD xmm, xmm        Lat:   0.55ns=   1.0c  TPut:   0.27ns=   0.50c
  100. Inst  96 SSE2  : ADDSD xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   0.55ns=   1.00c
  101. Inst  97 SSE2  : ADDPD xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   1.09ns=   2.00c
  102. Inst  98 SSE2  : MULSD xmm, xmm        Lat:   2.73ns=   5.0c  TPut:   1.09ns=   2.00c
  103. Inst  99 SSE2  : MULPD xmm, xmm        Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  104. Inst 100 SSE2  : MINSD xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   1.64ns=   3.00c
  105. Inst 101 SSE2  : MINPD xmm, xmm        Lat:   1.64ns=   3.0c  TPut:   1.09ns=   2.00c
  106. Inst 102 SSE2  : XORPD xmm, xmm        Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  107. Inst 103 SSE2  : SHUFPD xmm, xmm, im8  Lat:   1.09ns=   2.0c  TPut:   1.09ns=   2.00c
  108. Inst 104 SSE2  : DIVSD xmm, xmm        Lat:  17.50ns=  32.0c  TPut:  16.95ns=  31.00c
  109. Inst 105 SSE2  : DIVPD xmm, xmm        Lat:  33.91ns=  62.0c  TPut:  33.91ns=  62.00c
  110. Inst 106 SSE2  : DIVSD0 xmm, xmm       Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  111. Inst 107 SSE2  : DIVSD1 xmm, xmm       Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  112. Inst 108 SSE2  : DIVSD2 xmm, xmm       Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  113. Inst 109 SSE2  : DIVPD0 xmm, xmm       Lat:   4.38ns=   8.0c  TPut:   4.38ns=   8.00c
  114. Inst 110 SSE2  : DIVPD1 xmm, xmm       Lat:   4.38ns=   8.0c  TPut:   4.38ns=   8.00c
  115. Inst 111 SSE2  : DIVPD2 xmm, xmm       Lat:   4.37ns=   8.0c  TPut:   4.37ns=   8.00c
  116. Inst 112 SSE2  : SQRTSD xmm, xmm       Lat:  31.72ns=  58.0c  TPut:  31.17ns=  57.00c
  117. Inst 113 SSE2  : SQRTPD xmm, xmm       Lat:  62.34ns= 114.0c  TPut:  62.34ns= 114.00c
  118. Inst 114 SSE2  : SQRTSD0 xmm, xmm      Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  119. Inst 115 SSE2  : SQRTSD1 xmm, xmm      Lat:   2.73ns=   5.0c  TPut:   2.19ns=   4.00c
  120. Inst 116 SSE2  : SQRTPD0 xmm, xmm      Lat:   4.38ns=   8.0c  TPut:   4.38ns=   8.00c
  121. Inst 117 SSE2  : SQRTPD1 xmm, xmm      Lat:   4.37ns=   8.0c  TPut:   4.37ns=   8.00c
  122. Inst 118 SSE2  : MOVDQA xmm, xmm       Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  123. Inst 119 SSE2  : PADDD xmm, xmm        Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  124. Inst 120 SSE3  : ADDSUBPS xmm, xmm     Lat:   1.64ns=   3.0c  TPut:   1.09ns=   2.00c
  125. Inst 121 SSE3  : ADDSUBPD xmm, xmm     Lat:   1.64ns=   3.0c  TPut:   1.09ns=   2.00c
  126. Inst 122 SSE3  : HADDPS xmm, xmm       Lat:   3.83ns=   7.0c  TPut:   2.19ns=   4.00c
  127. Inst 123 SSE3  : HADDPD xmm, xmm       Lat:   2.19ns=   4.0c  TPut:   1.09ns=   2.00c
  128. Inst 124 SSE3  : MOVDDUP xmm, xmm      Lat:   0.55ns=   1.0c  TPut:   0.55ns=   1.00c
  129. Inst 125 SSE3  : MOVSHDUP xmm, xmm     Lat:   1.09ns=   2.0c  TPut:   1.09ns=   2.00c
复制代码
cherashi 该用户已被删除
2#
发表于 2006-4-15 05:01 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

dreamz2 该用户已被删除
3#
发表于 2006-4-15 22:12 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

expanse520 该用户已被删除
4#
发表于 2006-4-18 12:04 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

5#
发表于 2006-4-18 12:35 | 只看该作者
这个测试程序哪有?想试试。
回复 支持 反对

使用道具 举报

xiedeminchina 该用户已被删除
6#
发表于 2006-4-18 14:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

7#
发表于 2006-4-18 15:16 | 只看该作者
看不懂,怎么用。。。
回复 支持 反对

使用道具 举报

8#
 楼主| 发表于 2006-4-18 15:35 | 只看该作者
这里给出的其实就是CPU执行不同指令的时候效率,数字越小越好。
回复 支持 反对

使用道具 举报

9#
发表于 2006-4-20 11:29 | 只看该作者
解说一下吧
回复 支持 反对

使用道具 举报

10#
 楼主| 发表于 2006-4-20 12:00 | 只看该作者
Latency(延迟)就是执行单元获得指令后执行该指令所要花费的时间。

Throughput(吞吐)在这里是指指令从指令发射机发射到执行单元所需要的时间。
回复 支持 反对

使用道具 举报

11#
发表于 2006-6-10 20:44 | 只看该作者
原帖由 Edison 于 2006-4-20 12:00 发表
Latency(延迟)就是执行单元获得指令后执行该指令所要花费的时间。

Throughput(吞吐)在这里是指指令从指令发射机发射到执行单元所需要的时间。

这些信息对于写汇编提高性能的人很有用
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-5-15 21:56

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表