POPPUR爱换

标题: 有没有会编程的人有兴趣？Project: Shader PI [打印本页]

作者: 79GS干掉X1950XT 时间: 2007-1-29 23:42
标题: 有没有会编程的人有兴趣？Project: Shader PI
在CPU超频测试、评测领域有著名的SuperPI
为什么不尝试来用利用GPU的运算能力也来算算PI看看能不能跟CPU的运算能力较量一下呢？w00t)
顺便也可以测试GPU超频稳定性和性能。
大家分头找算法实现，看看谁写出来的ShaderPI效率更高。

作者: ayanamei 时间: 2007-1-29 23:45

原帖由 79GS干掉X1950XT 于 2007-1-29 23:42 发表
在CPU超频测试、评测领域有著名的SuperPI
为什么不尝试来用利用GPU的运算能力也来算算PI看看能不能跟CPU的运算能力较量一下呢？w00t)
顺便也可以测试GPU超频稳定性和性能。
大家分头找算法实现，看看谁写出 ...

你是想让G8x大幅度秒杀所有GPU么

作者: Edison 时间: 2007-1-29 23:45
peakstream的sdk里好像有shader pi。

http://www.gpgpu.org/sc2006/slides/12.papakipos.peakstream.pdf

众所周知，我不是程序员。:charles:

作者: 大死人花 时间: 2007-1-30 09:48
这个只和GPU的threading 能力有关，和shader能力没有关系

G80秒杀R580,RV530秒杀所有G7X

作者: InuYasha 时间: 2007-1-30 09:48
108万位跑19遍大概要多长时间?

作者: Norways_Winter 时间: 2007-1-30 09:54
这个看起来很好玩啊...

作者: kobemc 时间: 2007-1-30 10:04
提示: 作者被禁止或删除内容自动屏蔽

作者: 89度热水 时间: 2007-1-30 10:05
蛮好玩的，可惜我不会

这种东西怎么通过并行运算填满Shader呢？不能的话这点负载也没法测稳定性啊

作者: iiiiuuuu 时间: 2007-1-30 12:15
在cuda的sdk放出之前不考虑

作者: ayanamei 时间: 2007-1-30 12:35

原帖由 大死人花 于 2007-1-30 09:48 发表
这个只和GPU的threading 能力有关，和shader能力没有关系

G80秒杀R580,RV530秒杀所有G7X

和branch未必有太大关系
但是可以肯定跑PI没有Vector, 那么MIMD Scalar的G80的优势几乎是绝对的..

作者: zhangsq18 时间: 2007-1-30 12:52
大多数计算PI的算法都需要大量的递归，用ASM表示就是复杂的指令跳转，G80的晶体管利用率很很高。。。。这个问题看好G80

作者: Bright0574 时间: 2007-1-30 12:57
天下之势，久和必分，久分必和w00t)

作者: roadrunner 时间: 2007-1-30 13:19
再度召唤HPR女王

作者: 以前的密码没了 时间: 2007-1-30 14:21
不知道pi是怎么算的。
哪位有时间研究呢，我是没有。

有时间我还要实现我那个厌烦的虚拟程序呢。
本来想实现fp16的预渲染光照，可是没有办法压缩只能作罢。
终于明白hl2的苦衷了，利用int8<<8＋int8实现int16，也是没有办法的办法啊。能压缩啊。这个是重点啊。
可是动态范围小了 65536：1，唉没办法。

上次问cho，cho竟然杳无音讯。唉。。。。

[ 本帖最后由以前的密码没了于 2007-1-30 14:26 编辑 ]

作者: RacingPHT 时间: 2007-1-31 16:08
提示: 作者被禁止或删除内容自动屏蔽

作者: 79GS干掉X1950XT 时间: 2007-1-31 16:43

原帖由 RacingPHT 于 2007-1-31 16:08 发表
http://www.boo.net/~jasonp/pi-ref.txt
http://www.boo.net/~jasonp/pi8.c

ps: 我不认为GPU做这个会高效。
除非能弄到SuperPi的大型机版本。

多谢提供参考信息
也不一定就要比目前已有的算PI程序快，能拿相同算法的CPU版本和GPU版本来对比一下有个参考就行了

作者: kingsoft 时间: 2007-1-31 21:10

原帖由 kobemc 于 2007-1-30 10:04 发表

一直很好奇，cho大是干什么工作的:lol:

具备丰富编程经验的“非专业程序员”

作者: Edison 时间: 2007-1-31 22:30
more infomation:

http://www.peakstreaminc.com/reference/article_Microprocessor.pdf

作者: 来不及思考 时间: 2007-1-31 22:32
提示: 作者被禁止或删除内容自动屏蔽

作者: ayanamei 时间: 2007-1-31 22:37

原帖由 来不及思考 于 2007-1-31 22:32 发表

SSE2优化Pi :blink:

:wacko: 怎么可能呢..能的话怕Super-PI P4 VS K8就要反过来了...

作者: 来不及思考 时间: 2007-1-31 22:39
提示: 作者被禁止或删除内容自动屏蔽

作者: ayanamei 时间: 2007-1-31 22:42

原帖由 来不及思考 于 2007-1-31 22:39 发表

你去GOOGLE一下先 :shifty:

SSE2优化Pi
不知道你指什么利用SSE2的Pi计算程序么?
现在的测U的那个Pi现在显然是没有用到的
具体等我晚点去看现在切来切去没空..

作者: Edison 时间: 2007-1-31 22:44
http://www.overclock.net/downloa ... uper-pi-thread.html

sse优化的版本。

我记得还有一个测试软件里包含了pi，可以选择多线程，但是代码不见得是来自super pi。

作者: ayanamei 时间: 2007-1-31 22:53

原帖由 Edison 于 2007-1-31 22:44 发表
http://www.overclock.net/downloa ... uper-pi-thread.html

sse优化的版本。

我记得还有一个测试软件里包含了pi，可以选择多线程，但是代码不见得是来自super pi。

用这个跑 k8 八成是跑不过P4了..先下来测试一下..

作者: 79GS干掉X1950XT 时间: 2007-1-31 23:00

原帖由 ayanamei 于 2007-1-31 22:42 发表

SSE2优化Pi
不知道你指什么利用SSE2的Pi计算程序么?
现在的测U的那个Pi现在显然是没有用到的
具体等我晚点去看现在切来切去没空..

就是在原有SuperPI基础上修改而来的，有SSE、SSE2、SSE3不同版本
还有演变到现在的带checksum和毫秒显示版本

作者: ayanamei 时间: 2007-1-31 23:03

原帖由 79GS干掉X1950XT 于 2007-1-31 23:00 发表

就是在原有SuperPI基础上修改而来的，有SSE、SSE2、SSE3不同版本
还有演变到现在的带checksum和毫秒显示版本

上面cho的那个文章
arry ? 做成Float *4 丢给SIMD资源去跑??

作者: 79GS干掉X1950XT 时间: 2007-1-31 23:07

原帖由 ayanamei 于 2007-1-31 23:03 发表

上面cho的那个文章
arry ? 做成Float *4 丢给SIMD资源去跑??

貌似如此
如果真想搞清楚恐怕得把原版本和新版本的代码都反汇编出来，放在一起对比着看才能真正搞清楚

作者: zhangsq18 时间: 2007-1-31 23:29
superpi加着一层壳呢，反汇编出来也不好看啊

刚才用Ollydbg试了下，乱，要找到算法部分不容易啊

作者: RacingPHT 时间: 2007-2-1 09:49
提示: 作者被禁止或删除内容自动屏蔽

作者: 79GS干掉X1950XT 时间: 2007-2-1 09:56

原帖由 zhangsq18 于 2007-1-31 23:29 发表
superpi加着一层壳呢，反汇编出来也不好看啊

刚才用Ollydbg试了下，乱，要找到算法部分不容易啊

我记得没有壳啊，算法部分我以前已经找到了的，就是跳转很多，看不懂而已。

作者: 79GS干掉X1950XT 时间: 2007-2-1 10:00

原帖由 RacingPHT 于 2007-2-1 09:49 发表
cho引用的那个example只能算是程序员面试题把。算六位小数可能要天文数字的时间，而且不保证收敛。

计算PI最重要的是要解决大数问题, 动辄百万位的浮点精度当然不能用常规的算法解决。所以有时候连浮点运算都 ...

cho那个是随机数法，可能是求PI算法中收敛速度最慢，而且不管算了多少次，也无法知道当前有效精度有多少位的算法。:p
好的算PI算法必须有尽可能快的收敛速度，能够确切知道在经过多少次运算后的有效位数有多少位。
按常理来说确实应该都是整数算法
但是很奇怪的是，SuperPI确实充满了大量的浮点运算。

作者: i386sx 时间: 2007-2-1 14:57

原帖由 79GS干掉X1950XT 于 2007-2-1 10:00 发表

cho那个是随机数法，可能是求PI算法中收敛速度最慢，而且不管算了多少次，也无法知道当前有效精度有多少位的算法。:p
好的算PI算法必须有尽可能快的收敛速度，能够确切知道在经过多少次运算后的有效位数有 ...

强人啊呵呵
我很期待以后越来越多的CPU计算由显卡来承担

作者: zyz184 时间: 2007-2-1 15:12
提示: 作者被禁止或删除内容自动屏蔽

作者: shike_cuke 时间: 2007-2-1 15:14
:unsure: :unsure: :unsure: :unsure:

作者: zyz184 时间: 2007-2-1 15:15
提示: 作者被禁止或删除内容自动屏蔽

作者: 79GS干掉X1950XT 时间: 2007-2-1 17:24
找到了一个很好的算法，速度比SuperPI快，而且有源代码：
http://momonga.t.u-tokyo.ac.jp/~ooura/pi_fft.html

作者: Edison 时间: 2007-2-1 17:27
tokyo u本来就是super pi的大本营啦。

Makefile_quad 看来比较对头。

欢迎光临 POPPUR爱换 (https://we.poppur.com/)