POPPUR爱换

标题: 贴个东西给afan yy [打印本页]

作者: Dr.BT    时间: 2007-5-5 14:05
标题: 贴个东西给afan yy
:huh:
afan快来yy吧
我撤先:lol:
[attach]739546[/attach]

等下在沙发上贴个东西给ifan  yy:p
作者: Dr.BT    时间: 2007-5-5 14:05
占位:lol: :lol:
ifan拿出k8的那张表比一下吧
:shifty:
就知道为什么叫你们来yy了
[attach]739547[/attach]

[ 本帖最后由 Dr.BT 于 2007-5-5 14:07 编辑 ]
作者: zacard    时间: 2007-5-5 14:06
提示: 作者被禁止或删除 内容自动屏蔽
作者: kill8sars    时间: 2007-5-5 14:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: Dr.BT    时间: 2007-5-5 14:08
原帖由 zacard 于 2007-5-5 14:06 发表
纯文字的YY

这东西都公开了,自己去下载不就可以了?
:whistling:
不要跟我说amd官网找不到
作者: 红发IXFXI    时间: 2007-5-5 14:13
:p AMD努力抢先发布SEE4
作者: 红发IXFXI    时间: 2007-5-5 14:23
原帖由 Seraphlich 于 2007-5-5 14:19 发表
没想通AMD怎么拿到SSE4指令的内容.


:rolleyes: AMD怎么拿到MMX偶都不清楚。。。管他的。。消费者用就OK
作者: Prescott    时间: 2007-5-5 14:27
原帖由 Seraphlich 于 2007-5-5 14:19 发表
没想通AMD怎么拿到SSE4指令的内容.

SSE4a和SSE4还是有差别的吧。

就这四条指令也敢叫SSE4?
1.6.1AMD Instruction Set Enhancements
The AMD Family 10h processor has been enhanced with the following new instructions:
•LZCNT, POPCNT—Advanced Bit Manipulation (ABM) instructions operate on general purpose registers.
•MOVNTSS, MOVNTSD, EXTRQ, INSERTQ—SSE4a instructions operate on XMM registers.

[ 本帖最后由 Prescott 于 2007-5-5 14:29 编辑 ]
作者: Prescott    时间: 2007-5-5 14:34
原帖由 Dr.BT 于 2007-5-5 14:05 发表
占位:lol: :lol:
ifan拿出k8的那张表比一下吧
:shifty:
就知道为什么叫你们来yy了
739547

重点不在这个x87上啊,重点在SSE2指令上,那边的提高还是不错的。through put基本翻倍,latency也减少了一个cycle.
作者: Prescott    时间: 2007-5-5 14:38
原帖由 Seraphlich 于 2007-5-5 14:33 发表
我在想是不是只是名字接近,内容不一样.
就算IA之间有协议, I自己都没发布,A怎么搞到资料呢?

完全不一样。根本不是一回事。
作者: Dr.BT    时间: 2007-5-5 14:41
原帖由 Prescott 于 2007-5-5 14:34 发表

重点不在这个x87上啊,重点在SSE2指令上,那边的提高还是不错的。through put基本翻倍,latency也减少了一个cycle.

这个都看过了
through put *4的也有
作者: byby    时间: 2007-5-5 17:38
YY什么啊,拿几千几万亿美元出来将INTEL/AMD全收下,让他们慢慢生产给你玩。这才是YY啊。
不然YY大半天,都别人生产的东西历害,又不是你自己

[ 本帖最后由 byby 于 2007-5-5 17:39 编辑 ]
作者: the_god_of_pig    时间: 2007-5-5 18:01
这个是职业专业人士才需要的pdf,看不懂地说:wacko:




前边SSE的YY度更高点儿,谁有conroe的可以拿来对比:lol:
作者: the_god_of_pig    时间: 2007-5-5 18:09



:lol: :lol: :lol:
作者: GZeID    时间: 2007-5-5 18:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: Dr.BT    时间: 2007-5-5 18:42
那个sse3里的haddps/haddpd xmm xmm
:huh: conroe不会比k10弱这么多吧
addsubps/d倒是延迟比k10更短
movddup/movshdup不说了
throughput不能比了:wacko:

sse2中的paddd能赢k10,movdqa双方throughput打平,不过延迟conroe更短
开方和除法么,给17楼 yy
minsd/pd好像被做掉了
xorpd比k10强

加法延迟是i短,乘法好像是a短

sse,mmx,x87之类的等会儿看,先吃饭
作者: GZeID    时间: 2007-5-5 18:46
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2007-5-5 19:01
没必要神秘兮的吧。

http://developer.amd.com/devguides.jsp

17楼的延迟、吞吐周期是实际的测试值,当时跑来主要是因为没有资料可参考,现在应该以官方的优化指南为准。
作者: the_god_of_pig    时间: 2007-5-5 19:14
原帖由 Dr.BT 于 2007-5-5 18:42 发表
那个sse3里的haddps/haddpd xmm xmm
:huh: conroe不会比k10弱这么多吧
addsubps/d倒是延迟比k10更短
movddup/movshdup不说了
throughput不能比了:wacko:

sse2中的paddd能赢k10,movdqa双方throughput打 ...



唉,这么比的确蛮YY的,理论吞吐量和实际是两回事,

不过倒是可以看看谁的微架构更好一点:lol:
作者: the_god_of_pig    时间: 2007-5-5 19:20
原帖由 Edison 于 2007-5-5 19:01 发表
没必要神秘兮的吧。

http://developer.amd.com/devguides.jsp

17楼的延迟、吞吐周期是实际的测试值,当时跑来主要是因为没有资料可参考,现在应该以官方的优化指南为准。



下载老P那个贴子给了:unsure:

http://we.pcinlife.com/thread-759881-1-1.html


没注意到~:o

conroe的官方说明书偶没看过,非专业人士涉及不起的说:a)

[ 本帖最后由 the_god_of_pig 于 2007-5-5 19:21 编辑 ]
作者: 红发IXFXI    时间: 2007-5-5 19:45
:lol: 期待实际对决。。。理论没意思




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4