POPPUR爱换

标题: 有没有会编程的人有兴趣?Project: Shader PI [打印本页]

作者: 79GS干掉X1950XT    时间: 2007-1-29 23:42
标题: 有没有会编程的人有兴趣?Project: Shader PI
在CPU超频测试、评测领域有著名的SuperPI
为什么不尝试来用利用GPU的运算能力也来算算PI看看能不能跟CPU的运算能力较量一下呢?w00t)
顺便也可以测试GPU超频稳定性和性能。
大家分头找算法实现,看看谁写出来的ShaderPI效率更高。
作者: ayanamei    时间: 2007-1-29 23:45
原帖由 79GS干掉X1950XT 于 2007-1-29 23:42 发表
在CPU超频测试、评测领域有著名的SuperPI
为什么不尝试来用利用GPU的运算能力也来算算PI看看能不能跟CPU的运算能力较量一下呢?w00t)
顺便也可以测试GPU超频稳定性和性能。
大家分头找算法实现,看看谁写出 ...


你是想让G8x大幅度秒杀所有GPU么
作者: Edison    时间: 2007-1-29 23:45
peakstream的sdk里好像有shader pi。

http://www.gpgpu.org/sc2006/slides/12.papakipos.peakstream.pdf

众所周知,我不是程序员。:charles:
作者: 大死人花    时间: 2007-1-30 09:48
这个只和GPU的threading 能力有关,和shader能力没有关系

G80秒杀R580,RV530秒杀所有G7X
作者: InuYasha    时间: 2007-1-30 09:48
108万位跑19遍大概要多长时间?
作者: Norways_Winter    时间: 2007-1-30 09:54
这个看起来很好玩啊...
作者: kobemc    时间: 2007-1-30 10:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: 89度热水    时间: 2007-1-30 10:05
蛮好玩的,可惜我不会

这种东西怎么通过并行运算填满Shader呢?不能的话这点负载也没法测稳定性啊
作者: iiiiuuuu    时间: 2007-1-30 12:15
在cuda的sdk放出之前不考虑
作者: ayanamei    时间: 2007-1-30 12:35
原帖由 大死人花 于 2007-1-30 09:48 发表
这个只和GPU的threading 能力有关,和shader能力没有关系

G80秒杀R580,RV530秒杀所有G7X


和branch未必有太大关系
但是可以肯定 跑PI没有Vector, 那么MIMD Scalar的G80的优势几乎是绝对的..
作者: zhangsq18    时间: 2007-1-30 12:52
大多数计算PI的算法都需要大量的递归,用ASM表示就是复杂的指令跳转,G80的晶体管利用率很很高。。。。这个问题看好G80
作者: Bright0574    时间: 2007-1-30 12:57
天下之势,久和必分,久分必和w00t)
作者: roadrunner    时间: 2007-1-30 13:19
再度召唤HPR女王
作者: 以前的密码没了    时间: 2007-1-30 14:21
不知道pi是怎么算的。
哪位有时间研究呢,我是没有。

有时间我还要实现我那个厌烦的虚拟程序呢。
本来想实现fp16的预渲染光照,可是没有办法压缩只能作罢。
终于明白hl2的苦衷了,利用int8<<8+int8实现int16,也是没有办法的办法啊。能压缩啊。这个是重点啊。
可是动态范围小了 65536:1,唉没办法。

上次问cho,cho竟然杳无音讯。唉。。。。

[ 本帖最后由 以前的密码没了 于 2007-1-30 14:26 编辑 ]
作者: RacingPHT    时间: 2007-1-31 16:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: 79GS干掉X1950XT    时间: 2007-1-31 16:43
原帖由 RacingPHT 于 2007-1-31 16:08 发表
http://www.boo.net/~jasonp/pi-ref.txt
http://www.boo.net/~jasonp/pi8.c

ps: 我不认为GPU做这个会高效。
除非能弄到SuperPi的大型机版本。


多谢提供参考信息
也不一定就要比目前已有的算PI程序快,能拿相同算法的CPU版本和GPU版本来对比一下有个参考就行了
作者: kingsoft    时间: 2007-1-31 21:10
原帖由 kobemc 于 2007-1-30 10:04 发表



一直很好奇,cho大是干什么工作的:lol:


具备丰富编程经验的“非专业程序员”
作者: Edison    时间: 2007-1-31 22:30
more infomation:

http://www.peakstreaminc.com/reference/article_Microprocessor.pdf
作者: 来不及思考    时间: 2007-1-31 22:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: ayanamei    时间: 2007-1-31 22:37
原帖由 来不及思考 于 2007-1-31 22:32 发表


SSE2优化Pi :blink:

:wacko: 怎么可能呢..能的话怕Super-PI P4 VS K8就要反过来了...
作者: 来不及思考    时间: 2007-1-31 22:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: ayanamei    时间: 2007-1-31 22:42
原帖由 来不及思考 于 2007-1-31 22:39 发表


你去GOOGLE一下先 :shifty:


SSE2优化Pi
不知道你指什么 利用SSE2的Pi计算程序么?
现在的测U的那个Pi现在显然是没有用到的
具体等我晚点去看 现在切来切去没空..
作者: Edison    时间: 2007-1-31 22:44
http://www.overclock.net/downloa ... uper-pi-thread.html

sse优化的版本。

我记得还有一个测试软件里包含了pi,可以选择多线程,但是代码不见得是来自super pi。
作者: ayanamei    时间: 2007-1-31 22:53
原帖由 Edison 于 2007-1-31 22:44 发表
http://www.overclock.net/downloa ... uper-pi-thread.html

sse优化的版本。

我记得还有一个测试软件里包含了pi,可以选择多线程,但是代码不见得是来自super pi。


用这个跑 k8 八成是跑不过P4了..先下来测试一下..
作者: 79GS干掉X1950XT    时间: 2007-1-31 23:00
原帖由 ayanamei 于 2007-1-31 22:42 发表


SSE2优化Pi
不知道你指什么 利用SSE2的Pi计算程序么?
现在的测U的那个Pi现在显然是没有用到的
具体等我晚点去看 现在切来切去没空..


就是在原有SuperPI基础上修改而来的,有SSE、SSE2、SSE3不同版本
还有演变到现在的带checksum和毫秒显示版本
作者: ayanamei    时间: 2007-1-31 23:03
原帖由 79GS干掉X1950XT 于 2007-1-31 23:00 发表


就是在原有SuperPI基础上修改而来的,有SSE、SSE2、SSE3不同版本
还有演变到现在的带checksum和毫秒显示版本


上面cho的那个文章
arry ? 做成Float *4 丢给SIMD资源去跑??
作者: 79GS干掉X1950XT    时间: 2007-1-31 23:07
原帖由 ayanamei 于 2007-1-31 23:03 发表


上面cho的那个文章
arry ? 做成Float *4 丢给SIMD资源去跑??


貌似如此
如果真想搞清楚恐怕得把原版本和新版本的代码都反汇编出来,放在一起对比着看才能真正搞清楚
作者: zhangsq18    时间: 2007-1-31 23:29
superpi加着一层壳呢,反汇编出来也不好看啊

刚才用Ollydbg试了下,乱,要找到算法部分不容易啊
作者: RacingPHT    时间: 2007-2-1 09:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: 79GS干掉X1950XT    时间: 2007-2-1 09:56
原帖由 zhangsq18 于 2007-1-31 23:29 发表
superpi加着一层壳呢,反汇编出来也不好看啊

刚才用Ollydbg试了下,乱,要找到算法部分不容易啊


我记得没有壳啊,算法部分我以前已经找到了的,就是跳转很多,看不懂而已。
作者: 79GS干掉X1950XT    时间: 2007-2-1 10:00
原帖由 RacingPHT 于 2007-2-1 09:49 发表
cho引用的那个example只能算是程序员面试题把。算六位小数可能要天文数字的时间,而且不保证收敛。

计算PI最重要的是要解决大数问题, 动辄百万位的浮点精度当然不能用常规的算法解决。所以有时候连浮点运算都 ...


cho那个是随机数法,可能是求PI算法中收敛速度最慢,而且不管算了多少次,也无法知道当前有效精度有多少位的算法。:p
好的算PI算法必须有尽可能快的收敛速度,能够确切知道在经过多少次运算后的有效位数有多少位。
按常理来说确实应该都是整数算法
但是很奇怪的是,SuperPI确实充满了大量的浮点运算。
作者: i386sx    时间: 2007-2-1 14:57
原帖由 79GS干掉X1950XT 于 2007-2-1 10:00 发表


cho那个是随机数法,可能是求PI算法中收敛速度最慢,而且不管算了多少次,也无法知道当前有效精度有多少位的算法。:p
好的算PI算法必须有尽可能快的收敛速度,能够确切知道在经过多少次运算后的有效位数有 ...




强人啊  呵呵
我很期待以后越来越多的CPU计算由显卡来承担
作者: zyz184    时间: 2007-2-1 15:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: shike_cuke    时间: 2007-2-1 15:14
:unsure: :unsure: :unsure: :unsure:
作者: zyz184    时间: 2007-2-1 15:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: 79GS干掉X1950XT    时间: 2007-2-1 17:24
找到了一个很好的算法,速度比SuperPI快,而且有源代码:
http://momonga.t.u-tokyo.ac.jp/~ooura/pi_fft.html
作者: Edison    时间: 2007-2-1 17:27
tokyo u本来就是super pi的大本营啦。

Makefile_quad 看来比较对头。




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4