POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: 紫色
打印 上一主题 下一主题

那位编程举个例子, 把sse的"威力"释放一下?

[复制链接]
81#
发表于 2007-9-30 21:03 | 只看该作者
lz真像AMD-FANS 总要弄个xx论大肆批斗啊
嫌论坛还不够慢啊..
回复 支持 反对

使用道具 举报

82#
发表于 2007-9-30 21:16 | 只看该作者
SSE/SSE2指令集并不是只有SIMD运算的扩展,还有一些load/store方面的指令,能达到提高UCWC的效率。
回复 支持 反对

使用道具 举报

83#
发表于 2007-9-30 21:21 | 只看该作者
原帖由 slice 于 2007-9-30 20:33 发表


试了下Mark03。
My God!跑还是能跑,结果有点匪夷所思!放720P的WMVCPU也就30%多变成40%多而已。没想到Mark03会这样子。谁能tell me why?
关SSE简直就是超级幻灯片啊,92分。不关是720分。w00t) 问题出 ...


放wmv大部份用的是MMX,你关掉这个就可能根本不让你跑了。
回复 支持 反对

使用道具 举报

84#
 楼主| 发表于 2007-9-30 21:54 | 只看该作者
找了台双Xeon的机器,跑prescutt的程序。gcc版本是4.3.0pre

运行时间竟然是6m40s w00t) ,我还以为死机了呢。
[19:50:08][~]$g++ -O3 -mfpmath=387 1.c -o a.out.387
[19:52:15][~]$time ./a.out.387
result of c[25][391] is -297.068634

real    6m38.561s
user    6m38.010s
sys     0m0.030s

[20:17:01][~]$g++ -O3 -msse2 -mfpmath=sse 1.c -o a.out.sse
[20:17:50][~]$time ./a.out.sse
result of c[25][391] is -297.068634

real    6m43.477s
user    6m39.830s
sys     0m1.130s

=======================
[20:40:03][~]$gcc --version
gcc (GCC) 4.3.0 20070921 (experimental)
Copyright (C) 2007 Free Software Foundation, Inc.
本程序是自由软件;请参看源代码的版权声明。本软件没有任何担保;
包括没有适销性和某一专用目的下的适用性担保。

==========================
processor       : 3
vendor_id       : GenuineIntel
cpu family      : 15
model           : 2
model name      : Intel(R) Xeon(TM) CPU 2.40GHz
stepping        : 7
cpu MHz         : 2394.804
cache size      : 512 KB
physical id     : 3
siblings        : 2
fdiv_bug        : no
hlt_bug         : no
f00f_bug        : no
coma_bug        : no
fpu             : yes
fpu_exception   : yes
cpuid level     : 2
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm
bogomips        : 4784.12
回复 支持 反对

使用道具 举报

85#
发表于 2007-9-30 22:25 | 只看该作者
seti优化程序的各种sse版本 :lol:

http://www.equn.com/forum/thread-16358-1-1.html
回复 支持 反对

使用道具 举报

86#
发表于 2007-9-30 22:45 | 只看该作者
楼上也玩分布式啊w00t)

SETI用SSE优化效果实在是,没说的



[ 本帖最后由 YsMilan 于 2007-9-30 22:46 编辑 ]
回复 支持 反对

使用道具 举报

87#
发表于 2007-9-30 22:57 | 只看该作者
原帖由 紫色 于 2007-9-30 21:54 发表
找了台双Xeon的机器,跑prescutt的程序。gcc版本是4.3.0pre

运行时间竟然是6m40s w00t) ,我还以为死机了呢。
[19:50:08][~]$g++ -O3 -mfpmath=387 1.c -o a.out.387
[19:52:15][~]$time ./a.out.387
resu ...


六分多钟很奇怪吗?:lol: :lol: :lol:
回复 支持 反对

使用道具 举报

88#
发表于 2007-9-30 23:25 | 只看该作者
原帖由 Prescott 于 2007-9-30 17:21 发表


稍微修改一下程序,满足你一下:

#include
#include

float a[512][512], b[512][512], c[512][512], d = 0;

int main () {

    int i,j,N;

    srand(0);
    for (i = 0; i < 512; i++ ...


用P大的代码试了一下:loveliness:
结果如下:

gogo@no1-debian:~/test$ g++ -O3 -mfpmath=387 sse.cc -o a.gcc.387
gogo@no1-debian:~/test$ time ./a.gcc.387
result of c[25][391] is -297.068634

real    8m29.681s
user    8m28.160s
sys     0m0.212s
gogo@no1-debian:~/test$ g++ -O3 -mfpmath=sse -ftree-vectorize -ftree-vectorizer-verbose=5 sse.cc -o a.gcc.sse
sse.cc:1: warning: SSE instruction set disabled, using 387 arithmetics

sse.cc:12: note: not vectorized: unhandled data-ref
sse.cc:21: note: not vectorized: no vectype for stmt: D.3208_38 = c[i_15][j_88] scalar_type: float
sse.cc:21: note: vectorized 0 loops in function.

//照P大的参数居然优化不成功,加了对应CPU的参数就好了
gogo@no1-debian:~/test$ g++ -O3 -mfpmath=sse  -march=athlon-xp  -ftree-vectorize -ftree-vectorizer-verbose=5 sse.cc -o a.gcc.sse

sse.cc:12: note: not vectorized: unhandled data-ref
sse.cc:21: note: dependence distance  = 0.
sse.cc:21: note: accesses have the same alignment.
sse.cc:21: note: dependence distance modulo vf == 0 between c[i_90][j_92] and c[i_90][j_92]
sse.cc:21: note: dependence distance  = 0.
sse.cc:21: note: accesses have the same alignment.
sse.cc:21: note: dependence distance modulo vf == 0 between c[i_90][j_92] and c[i_90][j_92]
sse.cc:21: note: LOOP VECTORIZED.
sse.cc:21: note: vectorized 1 loops in function.
gogo@no1-debian:~/test$ time ./a.gcc.sse
result of c[25][391] is -297.068634

real    5m33.425s
user    5m32.317s
sys     0m0.160s
gogo@no1-debian:~/test$
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
89#
发表于 2007-9-30 23:29 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-6 10:35

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表