POPPUR爱换

标题: 这条SSE4指令,K10有没有? [打印本页]

作者: ConroeXE    时间: 2007-5-23 15:34
提示: 作者被禁止或删除 内容自动屏蔽
作者: ConroeXE    时间: 2007-5-23 15:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: zaarath    时间: 2007-5-23 15:43
K10 只拥有4条SSE4指令
1.6.1  AMD Instruction Set Enhancements

The AMD Family 10h processor has been enhanced with the following new
instructions:

LZCNT, POPCNT—Advanced Bit Manipulation (ABM) instructions operate on
general purpose registers. MOVNTSS, MOVNTSD, EXTRQ, INSERTQ -- SSE4a
instructions operate on XMM registers.

不包括你说的那条。
作者: zaarath    时间: 2007-5-23 15:44
原帖由 ConroeXE 于 2007-5-23 15:36 发表
K10是SSE4a 和Intel SSE4不同,少了一些针对Intel的指令。


不是少了一些,是少了100%。
penryn的SSE4也不是全部,但是拥有47条,nehalem会增加余下的8条。
K10只有4条,有趣的是SSE4并没有这4条指令,AMD将其称为SSE4a实在是混淆视听。

[ 本帖最后由 zaarath 于 2007-5-23 15:49 编辑 ]
作者: ConroeXE    时间: 2007-5-23 16:16
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-5-23 16:19
其实SSE系列指令目前看来在多媒体编码解码上用得最多

似乎重要性也不大
作者: zaarath    时间: 2007-5-23 16:22
原帖由 ConroeXE 于 2007-5-23 16:16 发表
K10如果在SSE4上严重跛脚,买K10的人肠子都得悔青了……


K10没有SSE4是肯定的了,不出意外AMD应该会在第二版K10也就是45nm上加入SSE4支持,以AMD目前的资金状况,最早也是08年末的事情了。
作者: Ricepig    时间: 2007-5-23 16:24
我记得有段时间AMD的U对SSEx执行效率比Intel高得多
作者: zaarath    时间: 2007-5-23 16:26
原帖由 Ricepig 于 2007-5-23 16:19 发表
其实SSE系列指令目前看来在多媒体编码解码上用得最多

似乎重要性也不大


重要性不大?
事实是现在所有的商业软件,都尽可能作SSE优化以绕过低效的x87浮点指令集。x87唯一的作用是科学计算,对于日常应用,x87才是真正的“重要性不大”。
作者: Ricepig    时间: 2007-5-23 16:28
原帖由 zaarath 于 2007-5-23 16:26 发表


重要性不大?
事实是现在所有的商业软件,都尽可能作SSE优化以绕过低效的x87浮点指令集。x87唯一的作用是科学计算,对于日常应用,x87才是真正的“重要性不大”。

商业软件注重的是功能,一般对效率要求不是太高,而且用到浮点的东西少吧。科学计算SSE的加速才比较明显
而且SSE其实包括整数指令和浮点指令的。
作者: acqwer    时间: 2007-5-23 16:29
原帖由 Ricepig 于 2007-5-23 16:19 发表
其实SSE系列指令目前看来在多媒体编码解码上用得最多

似乎重要性也不大

用在多媒体编码解码是SSE3,没SSE2,大把的软件用都用不起来。
作者: zaarath    时间: 2007-5-23 16:30
原帖由 Ricepig 于 2007-5-23 16:24 发表
我记得有段时间AMD的U对SSEx执行效率比Intel高得多


AMD对于SSEx执行效率从来就没intel高。你的印象来自于K8蹂躏P4的时代。即使P4时代,重SSE的程序比如视频编码P4和K8的差距就大大缩小,甚至胜出。
K10倒是double了SSE执行的带宽,有可能达到或超过intel的SSE能力。
作者: Ricepig    时间: 2007-5-23 16:31
原帖由 acqwer 于 2007-5-23 16:29 发表

用在多媒体编码解码是SSE3,没SSE2,大把的软件用都用不起来。

比如说?
作者: agooday    时间: 2007-5-23 16:31
路过学习
作者: zaarath    时间: 2007-5-23 16:33
原帖由 acqwer 于 2007-5-23 16:29 发表

用在多媒体编码解码是SSE3,没SSE2,大把的软件用都用不起来。

没SSE2, 连破解的OS X都无法在x86上运行,哈哈。
作者: Ricepig    时间: 2007-5-23 16:34
原帖由 zaarath 于 2007-5-23 16:33 发表

没SSE2, 连破解的OS X都无法在x86上运行,哈哈。

晕倒,这也算~~~
作者: acqwer    时间: 2007-5-23 16:39
原帖由 Ricepig 于 2007-5-23 16:31 发表

比如说?

目前最好的SS模拟器SSF必须要SSE2,PS2模拟器中关闭SSE2支持速度要慢30%以上,还有MacOS只有在有SSE2的机器上才能装。

只要看SpecFP中P4对P3同频下40%以上的提升就知道SSE2有多大作用了。

[ 本帖最后由 acqwer 于 2007-5-23 16:40 编辑 ]
作者: Ricepig    时间: 2007-5-23 16:39
原帖由 acqwer 于 2007-5-23 16:39 发表

目前最好的SS模拟器SSF必须要SSE2,PS2模拟器中关闭SSE2支持速度要慢30%以上,还有MacOS只有在有SSE2的机器上才能装。

主流商业软件呢?不支持SSE2就不能跑的那叫自杀吧
作者: tedsun    时间: 2007-5-23 16:40
原帖由 zaarath 于 2007-5-23 16:30 发表


AMD对于SSEx执行效率从来就没intel高。你的印象来自于K8蹂躏P4的时代。即使P4时代,重SSE的程序比如视频编码P4和K8的差距就大大缩小,甚至胜出。
K10倒是double了SSE执行的带宽,有可能达到或超过intel的S ...

sse 是非常的频率敏感的
所以。。。P4的sse比K8好多了。而p-m甚至一度不支持SSE。。。支持了也没啥用
作者: ConroeXE    时间: 2007-5-23 16:44
提示: 作者被禁止或删除 内容自动屏蔽
作者: acqwer    时间: 2007-5-23 16:45
原帖由 Ricepig 于 2007-5-23 16:39 发表

主流商业软件呢?不支持SSE2就不能跑的那叫自杀吧

Premiere Pro 2.0
作者: ConroeXE    时间: 2007-5-23 16:47
提示: 作者被禁止或删除 内容自动屏蔽
作者: NONO    时间: 2007-5-23 16:48
K10的SSE能力會比Conroe強嗎:unsure:
作者: ConroeXE    时间: 2007-5-23 16:50
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-5-23 16:51
原帖由 acqwer 于 2007-5-23 16:45 发表

Premiere Pro 2.0

来了个视频的~~~

早就承认SSE多媒体压缩解压很快了~~~
作者: ConroeXE    时间: 2007-5-23 16:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: ConroeXE    时间: 2007-5-23 16:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: acqwer    时间: 2007-5-23 17:00
原帖由 Ricepig 于 2007-5-23 16:51 发表

来了个视频的~~~

早就承认SSE多媒体压缩解压很快了~~~

行业软件中对速度要求高的大部分都是跨平台的,不可能检测到没SSE2就不能用,否则MAC早就死了。

[ 本帖最后由 acqwer 于 2007-5-23 17:03 编辑 ]
作者: ConroeXE    时间: 2007-5-23 17:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-5-23 17:32
原帖由 acqwer 于 2007-5-23 17:00 发表

行业软件中对速度要求高的大部分都是跨平台的,不可能检测到没SSE2就不能用,否则MAC早就死了。

其实对速度要求的高程序就该做平台专用的优化,否则速度提不上来
作者: Ricepig    时间: 2007-5-23 17:33
原帖由 ConroeXE 于 2007-5-23 17:04 发表


怕是到了X86-64就是必须的了,只是编写整个软件都基于sse2可能工程太大,所以目前还不流行这句:“没有sse2不可使用”……MAC现在也是sse2的了……Premiere Pro 2.0干脆没有MAC版……:sweatingbullets:

并不是所有运算适合SIMD模式,只有大量重复不相关运算时,才是SIMD发挥的时候。多媒体处理正好是这种情况
作者: acqwer    时间: 2007-5-23 18:09
原帖由 Ricepig 于 2007-5-23 17:32 发表

其实对速度要求的高程序就该做平台专用的优化,否则速度提不上来

专用优化的就不是通用软件了,这种软件只要是运行在X86上的,基本上都需要SSE2,具体有没有作检测不知道,不过运行这些软件的机器没有不带有SSE2的。
作者: demonpumpkin    时间: 2007-5-23 18:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: 89度热水    时间: 2007-5-23 19:13
AMD有针对自己平台的协处理器加速指令
作者: Bohr    时间: 2007-5-23 19:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: Bohr    时间: 2007-5-23 19:34
提示: 作者被禁止或删除 内容自动屏蔽
作者: 89度热水    时间: 2007-5-23 19:38
那个搞渲染的换了多少马甲了?
作者: acqwer    时间: 2007-5-23 19:56
原帖由 demonpumpkin 于 2007-5-23 18:51 发表
现在sse2都还没能普及,要用上sse4不知还要多长时间?

谁说SSE2还没普及的,软件可以在没有SSE2的机器上用并不等于软件没为SSE2优化。War3可以在DX7的卡上运行难道War3就不支持DX8了?
作者: acqwer    时间: 2007-5-23 19:58
原帖由 Bohr 于 2007-5-23 19:32 发表



sse4优化软件流行的时候,我估计K10也该停产了吧

在需要用到SSE3的视频编、解码领域,SSE3基本上已经普及了。
作者: 89度热水    时间: 2007-5-23 20:11
原帖由 acqwer 于 2007-5-23 19:56 发表

谁说SSE2还没普及的,软件可以在没有SSE2的机器上用并不等于软件没为SSE2优化。War3可以在DX7的卡上运行难道War3就不支持DX8了?


“普及”就不仅仅是“优化”的范畴了
作者: acqwer    时间: 2007-5-23 20:20
原帖由 89度热水 于 2007-5-23 20:11 发表


“普及”就不仅仅是“优化”的范畴了

看来XP也没有普及了,没几个软件不能在2000下用。需要用到SSE2的软件基本上都支持SSE2,就连Firefox这种没必要支持SSE的都有几个非官方编译版支持SSE2,还要怎样才叫普及?

[ 本帖最后由 acqwer 于 2007-5-23 20:24 编辑 ]
作者: 缺氧的鱼    时间: 2007-5-23 21:03
原帖由 zaarath 于 2007-5-23 16:26 发表


重要性不大?
事实是现在所有的商业软件,都尽可能作SSE优化以绕过低效的x87浮点指令集。x87唯一的作用是科学计算,对于日常应用,x87才是真正的“重要性不大”。



你的意思是:“商业软件”没有科学运算,是“日常应用”?
作者: ConroeXE    时间: 2007-5-23 21:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: ConroeXE    时间: 2007-5-23 21:13
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4