|
本帖最后由 Prescott 于 2010-5-21 00:42 编辑
把俺哥们做的一个东西摆上台:
hpctech 发表于 2010-5-20 23:05 ![]()
这种东西也好意思摆上台。懒得看GPU version,随便说说CPU version
没源代码,不用看也知道代码烂的和屎一样。
1. CPU version是一个单线程程序,无论多少个核心只能用一个核心进行计算。
2. 整个程序75%的时间耗在MSVCRT80.dll中,25%的时间耗在主程序中
3. 超级可悲的是:MSVCRT80.dll中居然有97%的时间花在modf函数上,我就不信这个程序真的需要分别取小数部分和整数部分来做运算,文章中特地指出的sin/cos等GPU处理性能占优的超越函数只占了3%
4. 号称会写SSE intrinsic的高手,自己的代码统统用的是x87浮点,而且是还是双精度,你的GPU也是双精度浮点??
懒得看下去了
这几个问题解决,一个i7-860就可以轻松干掉Fermi,CPU程序写成这样,连走都不会,就学什么跑。
我说论文都是**,你还有什么话说。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|