POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 12722|回复: 88
打印 上一主题 下一主题

那位编程举个例子, 把sse的"威力"释放一下?

[复制链接]
跳转到指定楼层
1#
发表于 2007-9-29 19:46 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
图形图像我也相信sse肯定有用, 至于它的份额和重要程度, 已经讨论够多了,也没啥结果,这里不再继续,ok?

就选定数值计算编程,
为了公平起见,  结果请大家共同验证. 别人还没验证就不要自己先吹.
请提供:
1) 编译器,编译选项,
2) 同时提供使用sse与使用x87的程序运行时间,
3) 源代码.既然是数值计算,那么编程语言就是C或者fortran.
程序希望是现实点的别太极端太蠢到现实中根本不可能. 最好调用广泛使用的库如lapack等 ,或者调用intel的mkl生成随机向量做simulation之类的也行, 总之要比较符合现实.
来吧, "sse救命论"者们. 我很期待你们的程序能释放simd的威力!

[ 本帖最后由 紫色 于 2007-9-29 20:13 编辑 ]
2#
发表于 2007-9-29 20:00 | 只看该作者
Spec2000,基本都是C和fortran的数值运算,发布的时候SSE刚出,代码显然是没有为SSE优化的。
除了SSE外规格完全相同的Athlon1600+和Athlon1.4G成绩:
http://www.spec.org/osg/cpu2000/ ... 20010519-00654.html
http://www.spec.org/osg/cpu2000/ ... 20011008-01021.html
Runtime在测试结果中都有。
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2007-9-29 20:07 | 只看该作者
没有sse的成绩比较就等于没说. ifort好像是8.0才支持sse ,5.0应该是不支持sse的吧。

那些程序你去选择、编译并比较吧, 既然你也用linux, 如果需要,我给你提供ifort 10.0 for linux的lic(说实话我并不使用ifort)。
建议你干脆把那些程序全部编译一遍。事实也许会对你有利,也许会对我有利,都大白于阳光下好了~~

[ 本帖最后由 紫色 于 2007-9-29 20:15 编辑 ]
回复 支持 反对

使用道具 举报

4#
发表于 2007-9-29 20:13 | 只看该作者
Intel 01年出的编译器不支持SSE,你是在搞笑吧。
http://www.spec.org/cpu2000/results/res2001q2/cpu2000-20010507-00631.html
当然,你非要说P4的X87性能比同频的Athlon强我也没办法。

[ 本帖最后由 acqwer 于 2007-9-29 20:18 编辑 ]
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2007-9-29 20:16 | 只看该作者
请教这里面,那个支持sse,是Intel C/C++ 5.0 build 1120 and Intel Fortran 5.0 build 1120 ?

Operating System:          Windows 2000 SP1
Compiler:         Compaq Visual Fortran 6.5A
Intel C/C++ 5.0 build 1120 and Intel Fortran 5.0 build 1120
Microsoft Visual Studio 6.0 (libraries)
MicroQuill Smartheap Library 5.0
File System:         FAT32
System State:         Default

[ 本帖最后由 紫色 于 2007-9-29 20:34 编辑 ]
回复 支持 反对

使用道具 举报

6#
发表于 2007-9-29 20:21 | 只看该作者
从P4的测试结果看,ifort5.0连SSE2都支持。
回复 支持 反对

使用道具 举报

7#
发表于 2007-9-29 20:22 | 只看该作者
SSE有什么威力?不知道,只知道现在的游戏必须有SSE支持的CPU,而不是3DNow!那个废物!w00t)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

8#
发表于 2007-9-29 20:27 | 只看该作者
:huh:
这个,好像amd有数据的
不过lz这样的bc看不懂,懒得拿出来了
回复 支持 反对

使用道具 举报

9#
 楼主| 发表于 2007-9-29 20:37 | 只看该作者
原帖由 Dr.BT 于 2007-9-29 20:27 发表
:huh:
这个,好像amd有数据的
不过lz这样的bc看不懂,懒得拿出来了


你还是省省吧,肉鸟
我都不想再把发给conXE的短信再向你发一遍了,这里所有人都知道你的类型。
不是我瞧不起你,你还比不上conXE呢,你连否定的能耐都没。

[ 本帖最后由 紫色 于 2007-9-29 21:01 编辑 ]
回复 支持 反对

使用道具 举报

10#
 楼主| 发表于 2007-9-29 21:10 | 只看该作者
原帖由 acqwer 于 2007-9-29 20:00 发表
Spec2000,基本都是C和fortran的数值运算,发布的时候SSE刚出,代码显然是没有为SSE优化的。
除了SSE外规格完全相同的Athlon1600+和Athlon1.4G成绩:
http://www.spec.org/osg/cpu2000/results/res2001q2/cpu ...


我看了cfp2000的结果。我觉得不可靠。首先,cvf ,ifort等编译器版本不一样。即使忽略版本,但对同一程序,甚至连编译器都不一样,这就不好比较了,因为不同编译器往往都有不小性能差。
171.swim:     f90 -Optimize:5 -fast
171.swim:     ifl -O3 -QxK -Qwp_ipo +FDO
等等。

你能否提供对这些程序的同一编译器不同选项的结果以供验证?
ifort/icc ,
pgi
gcc/gfortran ?

[ 本帖最后由 紫色 于 2007-9-29 21:16 编辑 ]
回复 支持 反对

使用道具 举报

11#
发表于 2007-9-29 21:15 | 只看该作者
原帖由 紫色 于 2007-9-29 21:10 发表


我看了cfp2000的结果。我觉得不可靠。首先,cvf ,ifort等编译器版本不一样。即使忽略版本,但对同一程序,甚至连编译器都不一样,这就不好比较了,因为不同编译器往往都有不小性能差。
171.swim:     f90  ...

嗯,Spec不可靠,tom是枪手 ,拿Linus宣传kerneltrap ,但Linus怎么想无关紧要
其实只要两个字就够了.
I Believe.
回复 支持 反对

使用道具 举报

12#
 楼主| 发表于 2007-9-29 21:18 | 只看该作者
不要打岔,不要断章取义。我说的是相关数据用于作比较不可靠。
说到believe,你要拿出烧饼而不是画饼,才能让别人believe。
你觉得多弄些人凭空想象、彼此支持、彼此吹拍甚至还不存在的nehalem有多强,就能让别人都信服?人多了没用,100个零加起来还是零。

[ 本帖最后由 紫色 于 2007-9-29 21:29 编辑 ]
回复 支持 反对

使用道具 举报

13#
发表于 2007-9-29 21:28 | 只看该作者
原帖由 紫色 于 2007-9-29 21:18 发表
不要打岔,不要断章取义。我说的是相关数据用于作比较不可靠。
说到believe,你要拿出烧饼而不是画饼,才能让别人believe。
你觉得多弄些人凭空想象、彼此支持、彼此吹拍甚至还不存在的nehalem有多强,就能让 ...


别人有义务让您信服吗?
某些人在Nehalem出来之后也不会信服的
对于没有决策权的人士,是不是Believe=0,花时间证明这种显然的东西显然是在浪费生命

[ 本帖最后由 itany 于 2007-9-29 21:32 编辑 ]
回复 支持 反对

使用道具 举报

14#
发表于 2007-9-29 21:31 | 只看该作者
Spec官网摆在这,自己去翻。论X87性能,P3/P4远不如Athlon,它们是靠什么压倒同频的K7?

至于nehalem多强,只要最终的设计达到intel所宣传的,那么nehalem的FP_rate不会输给任何对手,在确认nehalem无法达到intel宣传之前,你没有任何理由阻止别人yy nehalem的性能,就像在K10和R600发布前,没人阻止Afan yy一样。

[ 本帖最后由 acqwer 于 2007-9-29 21:38 编辑 ]
回复 支持 反对

使用道具 举报

头像被屏蔽
15#
发表于 2007-9-29 21:36 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

16#
发表于 2007-9-29 21:40 | 只看该作者
spec源代码花钱就能买到,自己用sse开关编译一下不就晓得了。老等别人证明给你看。

BTW,我不相信地球是圆的,哪位证明给我看一下?
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
17#
发表于 2007-9-29 22:39 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

18#
发表于 2007-9-29 22:42 | 只看该作者
其实就一个矩阵乘法,有SSE会快不少.
SSE本身速度快是现实,但是目前貌似算法能适应SSE的不多,即很大部分问题不能用SIMD模式的算法搞定~~~
回复 支持 反对

使用道具 举报

19#
发表于 2007-9-29 22:46 | 只看该作者
原帖由 akeyyeka 于 2007-9-29 21:40 发表
spec源代码花钱就能买到,自己用sse开关编译一下不就晓得了。老等别人证明给你看。

BTW,我不相信地球是圆的,哪位证明给我看一下?

因为自己从来没东西可以证明的
只需要满嘴大炮就可以了
w00t)
所以,先下手为强
对付君子会有优势:huh:
对付邪恶的君子么w00t)

很简单的惯例,谁指证谁举证嘛
要想只让被指证的人举证也容易啊,自己开个bbs,然后虚拟机个人进来被自己这样欺负不就可以了:shifty:

[ 本帖最后由 Dr.BT 于 2007-9-29 22:48 编辑 ]
回复 支持 反对

使用道具 举报

20#
发表于 2007-9-29 22:46 | 只看该作者
原帖由 Ricepig 于 2007-9-29 22:42 发表
其实就一个矩阵乘法,有SSE会快不少.
SSE本身速度快是现实,但是目前貌似算法能适应SSE的不多,即很大部分问题不能用SIMD模式的算法搞定~~~


http://en.wikipedia.org/wiki/AMD64

The original AMD64 architecture adopted Intel's SSE and SSE2 as core instructions.SSE3 instructions were added in April 2005. SSE2 replaces the x87instruction set's IEEE 80-bit precision, with the choice of either IEEE32-bit or 64-bit floating-point mathematics. This providesfloating-point operations compatible with many other modern CPUs. TheSSE and SSE2 instructions have also been extended to support the eightnew XMM registers. SSE and SSE2 are available in 32-bit mode in modernx86 processors; however, if they're used in 32-bit programs, thoseprograms will only work on systems with processors that support them.This is not an issue in 64-bit programs, as all processors that supportAMD64 support SSE and SSE2, so using SSE and SSE2 instructions insteadof x87 instructions does not reduce the set of machines on which theprograms will run. Since SSE and SSE2 are generally faster than, andduplicate most of the features of, the traditional x87 instructions, MMX, and 3DNow!, the latter are redundant under AMD64.

[ 本帖最后由 acqwer 于 2007-9-29 22:48 编辑 ]
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-6 10:35

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表