POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
12
返回列表 发新帖
楼主: 晶晶守护神
打印 上一主题 下一主题

天阿 有人说SSE 1 不如3dnow 1 是这样的吗 ~~

[复制链接]
21#
发表于 2007-12-2 02:02 | 只看该作者
:unsure: :unsure:
回复 支持 反对

使用道具 举报

22#
发表于 2007-12-2 09:52 | 只看该作者
原帖由 Prescott 于 2007-12-2 01:31 发表


您老这就露怯了吧。

Linux Kernel中禁用浮点!!

Linux 内核源代码中一个Double或者float都没有。(_(
至于X87,自从SSE2出世之后就再也没有存在的必要。如果SSE2指令能实现sin,而且比fsin快,你是不是就 ...


1) ,我不清楚“禁用浮点”。我反汇编检查下vmlinux,真被我发现一个x87指令
c0948426:       de e1                   fsubp  %st,%st(1)
我想你可能是对的,诺大的kernel就仅仅这么一条x87指令。
2) ,我没有说kernel中使用sse就是浮点。刚刚我检查了下,kernel里真有sse指令,而且是p打包系列的指令,也就是矢量sse。
c02c461a:       0f 11 00                movups %xmm0,(%eax)
c02c468b:       0f 57 00                xorps  (%eax),%xmm0
c02c468e:       0f 57 48 10             xorps  0x10(%eax),%xmm1
c02c4692:       0f 57 50 20             xorps  0x20(%eax),%xmm2
c05492c6:       66 0f fc e4             paddb  %xmm4,%xmm4
c05492ca:       66 0f fc f6             paddb  %xmm6,%xmm6
c05492ce:       66 0f db e8             pand   %xmm0,%xmm5
c05492d2:       66 0f db f8             pand   %xmm0,%xmm7
c05492d6:       66 0f ef e5             pxor   %xmm5,%xmm4
......
可见kernel中的sse指令多用于加速逻辑运算。
3) 如果sse能模拟sin等x87数学函数,那么x87就是可被替代的;如果sse模拟能减少延时/吞吐量,我当然就要承认sse比x87优越。不过也没什么要道歉的,寻求真相嘛:p,我在这里先提醒P大,即使是intel fortran貌似也调用了fsin?研究研究!

[ 本帖最后由 紫色 于 2007-12-2 12:21 编辑 ]
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
23#
发表于 2007-12-2 10:10 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

24#
发表于 2007-12-2 10:43 | 只看该作者


sourcefourge上好多icc的binary啊
包括 mencoder这种东西



[ 本帖最后由 boris_lee 于 2007-12-2 10:48 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

25#
发表于 2007-12-2 11:29 | 只看该作者
原帖由 紫色 于 2007-12-1 21:14 发表
SSE INSTRUCTION SET:
• Packed and scalar single-precision floating-point instructions
• 64-bit SIMD integer instructions
• State management instructions
• Cacheability con ...


实力贴,才头到尾看不懂,我应该去网吧要饭必要符合我的智商
回复 支持 反对

使用道具 举报

头像被屏蔽
26#
 楼主| 发表于 2007-12-2 13:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

27#
发表于 2007-12-2 13:56 | 只看该作者
原帖由 紫色 于 2007-12-2 09:52 发表


1) ,我不清楚“禁用浮点”。我反汇编检查下vmlinux,真被我发现一个x87指令
c0948426:       de e1                   fsubp  %st,%st(1)
我想你可能是对的,诺大的kernel就仅仅这么一条x87指令。
2) ,我没有 ...

对于不承认基本事实的人,实在没有办法讨论下去。
以你的技术水平,弄明白这些问题根本不是难事。如果你是打算在论坛上胡搅蛮缠,我没兴趣奉陪,如果你是打算探求真相,那请抱着一个平和的心态,不要对任何言论先入为主。

一个忠告:对于任何你不了解的事物,不要习惯性的抱否定态度,设计这些东西的人,远比你有经验,他们可能投入了毕生精力,无论怎么做都是有他们的道理。如果你觉得他们做错了,那一定是你没有理解。
回复 支持 反对

使用道具 举报

头像被屏蔽
28#
 楼主| 发表于 2007-12-2 14:24 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

29#
发表于 2007-12-2 17:13 | 只看该作者
原帖由 Prescott 于 2007-12-2 13:56 发表
一个忠告:对于任何你不了解的事物,不要习惯性的抱否定态度,设计这些东西的人,远比你有经验,他们可能投入了毕生精力,无论怎么做都是有他们的道理。如果你觉得他们做错了,那一定是你没有理解。


P大息怒。这个我承认。
但是他们的智慧可能集中于满足某一方面的需要,如图形图像处理。常见数学函数里sse只有一个开平方,三角、指数等则没有,数值计算方面sse就不那么“有道理“了。
intel新的编程手册上宣称sse对“系统编程”有贡献,windows大概我们没办法,而linux内核是可以定制的,能否通过定制gcc的编译选项来加速linux内核呢?
我自己都疲劳了,那就到此为止吧。这些留给有兴趣的后人去探寻。我的观点是:simd前程远大,绝对应该扩展到图形处理领域之外,但那种需求目前被忽视了,所以那些领域想从sse受益并不容易(已经有部分帮助,数值计算平均提高10-15%速度在478机器上),需要编译器优化、模拟算法等等的创新,不是YY一下理论性能那么easy的事情。
http://www.intel.com/products/processor/manuals/index.htm

[ 本帖最后由 紫色 于 2007-12-2 23:54 编辑 ]
回复 支持 反对

使用道具 举报

头像被屏蔽
30#
 楼主| 发表于 2007-12-2 17:21 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

31#
发表于 2007-12-2 17:26 | 只看该作者
原帖由 紫色 于 2007-12-2 17:13 发表


P大息怒。这个我承认。
但是他们的智慧可能集中于满足某一方面的需要,例如图形图像。所以其他方面就未必那么“合理”了。常见数学函数里sse只有一个开平方,三角、指数而这些常用函数都没有,这方面他就不那么 ...

你去看看除了x87这个被人诟病的浮点指令集,还有哪个现代浮点指令集傻乎乎的提供这么高层的函数指令?大部分函数库都不使用fsin,因为fsin更慢。

LinuxKernel并不是计算密集型的代码,SIMD对他用处不是很大也是可以理解的。但是SSE3中的MONITOR/MWAIT对系统编程的影响就不可小视。当然还有lfence/mfence。
回复 支持 反对

使用道具 举报

头像被屏蔽
32#
 楼主| 发表于 2007-12-2 17:39 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

33#
发表于 2007-12-2 23:27 | 只看该作者
原帖由 紫色 于 2007-12-2 17:13 发表


P大息怒。这个我承认。
但是他们的智慧可能集中于满足某一方面的需要,如图形图像处理。常见数学函数里sse只有一个开平方,三角、指数等则没有,数值计算方面sse就不那么“有道理“了。
intel新的编程手册上宣 ...

我不是太熟悉linux ,但OS内核要浮点运算做什么?
虽然linux是macro kernel....
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-9 12:40

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表