1.6.1AMD Instruction Set Enhancements
The AMD Family 10h processor has been enhanced with the following new instructions:
•LZCNT, POPCNT—Advanced Bit Manipulation (ABM) instructions operate on general purpose registers.
•MOVNTSS, MOVNTSD, EXTRQ, INSERTQ—SSE4a instructions operate on XMM registers.
原帖由 Prescott 于 2007-5-5 14:34 发表
重点不在这个x87上啊,重点在SSE2指令上,那边的提高还是不错的。through put基本翻倍,latency也减少了一个cycle.
原帖由 Dr.BT 于 2007-5-5 18:42 发表
那个sse3里的haddps/haddpd xmm xmm
:huh: conroe不会比k10弱这么多吧
addsubps/d倒是延迟比k10更短
movddup/movshdup不说了
throughput不能比了:wacko:
sse2中的paddd能赢k10,movdqa双方throughput打 ...
原帖由 Edison 于 2007-5-5 19:01 发表
没必要神秘兮的吧。
http://developer.amd.com/devguides.jsp
17楼的延迟、吞吐周期是实际的测试值,当时跑来主要是因为没有资料可参考,现在应该以官方的优化指南为准。
欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |