POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3223|回复: 32
打印 上一主题 下一主题

天阿 有人说SSE 1 不如3dnow 1 是这样的吗 ~~

[复制链接]
头像被屏蔽
跳转到指定楼层
1#
发表于 2007-12-1 17:51 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
2#
发表于 2007-12-1 17:53 | 只看该作者
杀发第一排。
回复 支持 反对

使用道具 举报

头像被屏蔽
3#
 楼主| 发表于 2007-12-1 17:54 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

4#
发表于 2007-12-1 18:06 | 只看该作者
两个字一个标点:放屁!
回复 支持 反对

使用道具 举报

G70 该用户已被删除
5#
发表于 2007-12-1 18:14 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
6#
 楼主| 发表于 2007-12-1 18:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

7#
发表于 2007-12-1 20:14 | 只看该作者
3DNOW好,3DNOW好强
3DNOW技术先进超过SSE100
就是没有软件支持:whistling:
回复 支持 反对

使用道具 举报

8#
发表于 2007-12-1 20:20 | 只看该作者
原帖由 jakenchao 于 2007-12-1 20:14 发表
3DNOW好,3DNOW好强
3DNOW技术先进超过SSE100
就是没有软件支持:whistling:


谁说的,CPU-Z就可以检测出3DNow!,呵呵:w00t)::w00t)::w00t):
回复 支持 反对

使用道具 举报

头像被屏蔽
9#
 楼主| 发表于 2007-12-1 20:39 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

10#
发表于 2007-12-1 21:03 | 只看该作者
pci的振兴就考这样的贴了。一个星期出2个饭喷量就不少了:rolleyes:
回复 支持 反对

使用道具 举报

11#
发表于 2007-12-1 21:14 | 只看该作者
SSE INSTRUCTION SET:
• Packed and scalar single-precision floating-point instructions
• 64-bit SIMD integer instructions
• State management instructions
• Cacheability control, prefetch, and memory ordering instructions
这问题基本上没啥意义。sse1也只在在单精度浮点上混混日子。

搭车请教各位一个以前碰到的问题,怎么才能让libm库的sin/cos系列函数支持sse?
我已经把libm编译成sse支持,简单用objdump检查一下,
objdump -d /lib/libm-2.7.so |grep xmm
    35b3:       f2 0f 10 4d 08          movsd  0x8(%ebp),%xmm1
    35b8:       f2 0f 10 45 10          movsd  0x10(%ebp),%xmm0
    35c0:       f2 0f 11 4d e0          movsd  %xmm1,-0x20(%ebp)
    35c5:       f2 0f 11 45 e8          movsd  %xmm0,-0x18(%ebp)
......(很长)
证明已经支持sse ,但是如果检查fsin指令,结果:
    a834:       d9 fe                   fsin   
    a853:       d9 fe                   fsin   
    c224:       d9 fb                   fsincos
    c253:       d9 fb                   fsincos
    c34e:       d9 fb                   fsincos
    c385:       d9 fb                   fsincos
    c3c8:       d9 fb                   fsincos
    c425:       d9 fb                   fsincos
   13294:       d9 fe                   fsin
.....(比较长)
证明x87的浮点指令仍然不可避免。
三角函数很常用。做不到这一点,没法真正比较x87与sse两个指令集的浮点总体性能(单指令能力+指令集是否完备)。

[ 本帖最后由 紫色 于 2007-12-1 21:17 编辑 ]
回复 支持 反对

使用道具 举报

头像被屏蔽
12#
 楼主| 发表于 2007-12-1 22:01 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

13#
发表于 2007-12-1 22:41 | 只看该作者
菜鸟,:lol:祝好!

==========
补:哪位知道,gcc能使用sse模拟sin吗?fsin需要100多个周期!很想看看sse能否邦上忙。
以cpuid=0f-2h为例子:
instruction              latency                   throuthput                          
fptan                     240-300                   170
fsin                        160-200                   130
fincos                     170-250                   140

[ 本帖最后由 紫色 于 2007-12-2 12:18 编辑 ]
回复 支持 反对

使用道具 举报

头像被屏蔽
14#
 楼主| 发表于 2007-12-1 23:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

15#
发表于 2007-12-2 00:59 | 只看该作者
我也不是:p 。
请弄清楚,sse理论性能超过x87无须讨论,我之所以拍那些YYer是因为:如何用起来,能不能用起来,以及有多少程序在用它。一个例子就是sse有没有能力模仿x87指令fsin。intel的手册里介绍了sse用处绝不限于图形图像,也涉及系统编程。楼主既然也玩linux,编译kernel肯定很常见,理论上linux kernel也能利用sse进行系统编程释放simd的"威力",事实上并没有。
算啦,大家都疲劳了呵呵。
回复 支持 反对

使用道具 举报

头像被屏蔽
16#
 楼主| 发表于 2007-12-2 01:07 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
17#
 楼主| 发表于 2007-12-2 01:09 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
18#
 楼主| 发表于 2007-12-2 01:20 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

19#
发表于 2007-12-2 01:31 | 只看该作者
原帖由 紫色 于 2007-12-2 00:59 发表
我也不是:p 。
请弄清楚,sse理论性能超过x87无须讨论,我之所以拍那些YYer是因为:如何用起来,能不能用起来,以及有多少程序在用它。一个例子就是sse有没有能力模仿x87指令fsin。intel的手册里介绍了sse用处绝不限于图形图像,也涉及系统编程。楼主既然也玩linux,编译kernel肯定很常见,理论上linux kernel也能利用sse进行系统编程释放simd的"威力",事实上并没有。
算啦,大家都疲劳了呵呵。


您老这就露怯了吧。

Linux Kernel中禁用浮点!!

Linux 内核源代码中一个Double或者float都没有。(_(
至于X87,自从SSE2出世之后就再也没有存在的必要。如果SSE2指令能实现sin,而且比fsin快,你是不是就在这里公开道歉呢?

[ 本帖最后由 Prescott 于 2007-12-2 02:11 编辑 ]
回复 支持 反对

使用道具 举报

头像被屏蔽
20#
 楼主| 发表于 2007-12-2 01:41 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-9 17:32

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表