POPPUR爱换

标题: 看看Intel C++下P4、K8、扣肉的差距。ICC对肉无用? [打印本页]

作者: ConroeXE    时间: 2007-5-23 16:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: acqwer    时间: 2007-5-23 16:19
P4本就是要靠软件优化的。
作者: Ricepig    时间: 2007-5-23 16:21
原帖由 acqwer 于 2007-5-23 16:19 发表
P4本就是要靠软件优化的。

流水线太长了,一定得优化
现在的R600也类似
作者: Ricepig    时间: 2007-5-23 16:22
其实这个测试考虑到用的Intel编译器,而且AMD主频低那么多,其实结果是可以接受的
作者: ConroeXE    时间: 2007-5-23 16:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: acqwer    时间: 2007-5-23 16:28
原帖由 ConroeXE 于 2007-5-23 16:26 发表


如果看扣肉的表现的话,ICC似乎是报废了。:sweatingbullets:

SSE4出来后,ICC又有用了。
作者: Ricepig    时间: 2007-5-23 16:29
原帖由 acqwer 于 2007-5-23 16:28 发表

SSE4出来后,ICC又有用了。

靠编译器自动做SSE4优化,提高有限的
还是得程序员自觉使用SSE4
作者: Ricepig    时间: 2007-5-23 16:30
原帖由 ConroeXE 于 2007-5-23 16:26 发表


如果看扣肉的表现的话,ICC似乎是报废了。:sweatingbullets:

可能编译器小组对扣肉的优化还没有完成~~~
作者: samhrc    时间: 2007-5-23 16:30
这个以前我同事试验过,用C编写一个模拟火焰的程序测试机器。

标准Linux 带的 GCC 编译后 执行了 5个小时还多
Intel自己的 编译器也就3小时不到。
作者: raphael8269    时间: 2007-5-23 16:30
貌似Intel C++为Netbrust优化的很好?
作者: Ricepig    时间: 2007-5-23 16:32
原帖由 raphael8269 于 2007-5-23 16:30 发表
貌似Intel C++为Netbrust优化的很好?

恩,ICC非常依赖CPU体系~~~
作者: ConroeXE    时间: 2007-5-23 16:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-5-23 16:33
原帖由 samhrc 于 2007-5-23 16:30 发表
这个以前我同事试验过,用C编写一个模拟火焰的程序测试机器。

标准Linux 带的 GCC 编译后 执行了 5个小时还多
Intel自己的 编译器也就3小时不到。

把算术运算替换成Kernal Math Library提高得更多
作者: Ricepig    时间: 2007-5-23 16:33
原帖由 ConroeXE 于 2007-5-23 16:32 发表


架购不同,简单地对比频率有意义么。
如果要达到955XE风冷小4G的成绩,X2是要超3G的。

恩,这倒是,不过拿2.2比4G,怎么也说不过去
作者: ConroeXE    时间: 2007-5-23 16:34
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-5-23 16:36
原帖由 ConroeXE 于 2007-5-23 16:34 发表


应该是ICC就是针对Netbrus的。对扣肉应该说毫无用处。

主要原理就是识别代码块替换多余计算内容,调整指令顺序避免惩罚,用更高效率的指令替换低效率指令
作者: ConroeXE    时间: 2007-5-23 16:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-5-23 16:37
原帖由 ConroeXE 于 2007-5-23 16:36 发表


作个参考,不是说X2不能超,可以看出来,X2即使超,跑ICC编译的程序,再超也是白搭。:)

恩,内部结构不同,对各指令的执行效率也不同的
作者: 罗菜鸟    时间: 2007-5-23 17:20
貌似icc有很多版本,不光针对P4优化。
另外怎么自觉使用SSE4?嵌入汇编?
作者: Ricepig    时间: 2007-5-23 17:29
原帖由 罗菜鸟 于 2007-5-23 17:20 发表
貌似icc有很多版本,不光针对P4优化。
另外怎么自觉使用SSE4?嵌入汇编?

汇编也可以
Intel好像也有类似SDK的东西,定义了一些结构和函数
作者: Ephyer    时间: 2007-5-23 18:16
把955XE换成普通的4G PD看看成绩如何?毕竟XE是绝少数的,pd才对大部分人有意义...。这种应用里,HT提高似乎有15%左右,少了这部分,pd的成绩不见得好看.....

[ 本帖最后由 Ephyer 于 2007-5-23 18:18 编辑 ]
作者: ConroeXE    时间: 2007-5-23 21:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: gazel    时间: 2007-5-23 21:44
原帖由 罗菜鸟 于 2007-5-23 17:20 发表
貌似icc有很多版本,不光针对P4优化。
另外怎么自觉使用SSE4?嵌入汇编?

嵌入汇编, Intel编译器的intrinsic函数或使用IPP, MKL等Intel提供的函数库
作者: Ephyer    时间: 2007-5-23 22:01
原帖由 ConroeXE 于 2007-5-23 21:21 发表


应该说缺少了HT的PD是半残的PD,所以普通PD卖的忒便宜.
HT对于P4就如同IMC对于K8.是完整的一套架构中的一部分.



问题是现在卖的,以及绝大部分买的,都是这种不完整的半残的pd,我想知道它们的性能而已,你没必要一下子又扯到 AMD,我和a fan无缘,想战你找错人了。(_(
作者: Ricepig    时间: 2007-5-23 22:49
原帖由 gazel 于 2007-5-23 21:44 发表

嵌入汇编, Intel编译器的intrinsic函数或使用IPP, MKL等Intel提供的函数库

不是,我记得有一套SDK可以帮助使用这些SSE指令的,for c/c++的
作者: Ricepig    时间: 2007-5-23 22:50
原帖由 ConroeXE 于 2007-5-23 21:21 发表


应该说缺少了HT的PD是半残的PD,所以普通PD卖的忒便宜.
HT对于P4就如同IMC对于K8.是完整的一套架构中的一部分.

HT是bug啊是bug
作者: ConroeXE    时间: 2007-5-23 23:10
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-5-23 23:18
原帖由 ConroeXE 于 2007-5-23 23:10 发表


明年这个“bug”搞不好又来了。HT和P4架构是不合时宜的“Extreme”。

阿,它又来了~~~Intel在搞什么
作者: ConroeXE    时间: 2007-5-23 23:23
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ricepig    时间: 2007-5-23 23:28
原帖由 ConroeXE 于 2007-5-23 23:23 发表


Power6上也有逻辑多线程啊,当然,有区别。但逻辑多线程这东西是挖掘CPU潜力的,没什么不好。是extreme不是bug。可惜,就是成倍增大了对操作系统支持的硬件线程数的需求。
总之这种尽量挖掘CPU运算潜力的e ...

HT类似技术只是针对指令流水线很长的情况吧
作者: ConroeXE    时间: 2007-5-23 23:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: shike_cuke    时间: 2007-5-24 10:03
是不是对频率很敏感????
作者: ITANIUM2    时间: 2007-5-24 11:14
晕倒, 编译选项都没有写, 有啥好讨论的:wacko:
作者: ITANIUM2    时间: 2007-5-24 11:14
晕倒, 编译选项都没有写, 有啥好讨论的:wacko:
作者: hdy_aoe    时间: 2007-5-24 12:32
不奇怪,人家才2.2G~~~~
作者: Tanknet    时间: 2007-5-24 12:53
icc在K8上是可以显著提高性能的(和GCC或者VC比较)
只不过要打一个for AMD的补丁

http://www.swallowtail.org/naughty-intel.html

不然的话,Intel的编译器会把AMD所有处理器的执行路径选择成使用x87而不是SSE(2、3)




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4