POPPUR爱换

标题: 看看Intel C++下P4、K8、扣肉的差距。ICC对肉无用？ [打印本页]

作者: ConroeXE 时间: 2007-5-23 16:05
提示: 作者被禁止或删除内容自动屏蔽

作者: acqwer 时间: 2007-5-23 16:19
P4本就是要靠软件优化的。

作者: Ricepig 时间: 2007-5-23 16:21

原帖由 acqwer 于 2007-5-23 16:19 发表
P4本就是要靠软件优化的。

流水线太长了，一定得优化
现在的R600也类似

作者: Ricepig 时间: 2007-5-23 16:22
其实这个测试考虑到用的Intel编译器，而且AMD主频低那么多，其实结果是可以接受的

作者: ConroeXE 时间: 2007-5-23 16:26
提示: 作者被禁止或删除内容自动屏蔽

作者: acqwer 时间: 2007-5-23 16:28

原帖由 ConroeXE 于 2007-5-23 16:26 发表

如果看扣肉的表现的话，ICC似乎是报废了。:sweatingbullets:

SSE4出来后，ICC又有用了。

作者: Ricepig 时间: 2007-5-23 16:29

原帖由 acqwer 于 2007-5-23 16:28 发表

SSE4出来后，ICC又有用了。

靠编译器自动做SSE4优化，提高有限的
还是得程序员自觉使用SSE4

作者: Ricepig 时间: 2007-5-23 16:30

原帖由 ConroeXE 于 2007-5-23 16:26 发表

如果看扣肉的表现的话，ICC似乎是报废了。:sweatingbullets:

可能编译器小组对扣肉的优化还没有完成~~~

作者: samhrc 时间: 2007-5-23 16:30
这个以前我同事试验过，用C编写一个模拟火焰的程序测试机器。

标准Linux 带的 GCC 编译后执行了 5个小时还多
Intel自己的编译器也就3小时不到。

作者: raphael8269 时间: 2007-5-23 16:30
貌似Intel C++为Netbrust优化的很好？

作者: Ricepig 时间: 2007-5-23 16:32

原帖由 raphael8269 于 2007-5-23 16:30 发表
貌似Intel C++为Netbrust优化的很好？

恩，ICC非常依赖CPU体系~~~

作者: ConroeXE 时间: 2007-5-23 16:32
提示: 作者被禁止或删除内容自动屏蔽

作者: Ricepig 时间: 2007-5-23 16:33

原帖由 samhrc 于 2007-5-23 16:30 发表
这个以前我同事试验过，用C编写一个模拟火焰的程序测试机器。

标准Linux 带的 GCC 编译后执行了 5个小时还多
Intel自己的编译器也就3小时不到。

把算术运算替换成Kernal Math Library提高得更多

作者: Ricepig 时间: 2007-5-23 16:33

原帖由 ConroeXE 于 2007-5-23 16:32 发表

架购不同，简单地对比频率有意义么。
如果要达到955XE风冷小4G的成绩，X2是要超3G的。

恩，这倒是，不过拿2.2比4G，怎么也说不过去

作者: ConroeXE 时间: 2007-5-23 16:34
提示: 作者被禁止或删除内容自动屏蔽

作者: Ricepig 时间: 2007-5-23 16:36

原帖由 ConroeXE 于 2007-5-23 16:34 发表

应该是ICC就是针对Netbrus的。对扣肉应该说毫无用处。

主要原理就是识别代码块替换多余计算内容，调整指令顺序避免惩罚，用更高效率的指令替换低效率指令

作者: ConroeXE 时间: 2007-5-23 16:36
提示: 作者被禁止或删除内容自动屏蔽

作者: Ricepig 时间: 2007-5-23 16:37

原帖由 ConroeXE 于 2007-5-23 16:36 发表

作个参考，不是说X2不能超，可以看出来，X2即使超，跑ICC编译的程序，再超也是白搭。:)

恩，内部结构不同，对各指令的执行效率也不同的

作者: 罗菜鸟 时间: 2007-5-23 17:20
貌似icc有很多版本，不光针对P4优化。
另外怎么自觉使用SSE4？嵌入汇编？

作者: Ricepig 时间: 2007-5-23 17:29

原帖由 罗菜鸟 于 2007-5-23 17:20 发表
貌似icc有很多版本，不光针对P4优化。
另外怎么自觉使用SSE4？嵌入汇编？

汇编也可以
Intel好像也有类似SDK的东西，定义了一些结构和函数

作者: Ephyer 时间: 2007-5-23 18:16
把955XE换成普通的4G PD看看成绩如何?毕竟XE是绝少数的,pd才对大部分人有意义...。这种应用里，HT提高似乎有15%左右，少了这部分,pd的成绩不见得好看.....

[ 本帖最后由 Ephyer 于 2007-5-23 18:18 编辑 ]

作者: ConroeXE 时间: 2007-5-23 21:21
提示: 作者被禁止或删除内容自动屏蔽

作者: gazel 时间: 2007-5-23 21:44

原帖由 罗菜鸟 于 2007-5-23 17:20 发表
貌似icc有很多版本，不光针对P4优化。
另外怎么自觉使用SSE4？嵌入汇编？

嵌入汇编, Intel编译器的intrinsic函数或使用IPP, MKL等Intel提供的函数库

作者: Ephyer 时间: 2007-5-23 22:01

原帖由 ConroeXE 于 2007-5-23 21:21 发表

应该说缺少了ＨＴ的ＰＤ是半残的ＰＤ，所以普通ＰＤ卖的忒便宜．
ＨＴ对于Ｐ４就如同ＩＭＣ对于Ｋ８．是完整的一套架构中的一部分．

问题是现在卖的,以及绝大部分买的,都是这种不完整的半残的pd,我想知道它们的性能而已，你没必要一下子又扯到 AMD,我和a fan无缘,想战你找错人了。(_(

作者: Ricepig 时间: 2007-5-23 22:49

原帖由 gazel 于 2007-5-23 21:44 发表

嵌入汇编, Intel编译器的intrinsic函数或使用IPP, MKL等Intel提供的函数库

不是，我记得有一套SDK可以帮助使用这些SSE指令的，for c/c++的

作者: Ricepig 时间: 2007-5-23 22:50

原帖由 ConroeXE 于 2007-5-23 21:21 发表

应该说缺少了ＨＴ的ＰＤ是半残的ＰＤ，所以普通ＰＤ卖的忒便宜．
ＨＴ对于Ｐ４就如同ＩＭＣ对于Ｋ８．是完整的一套架构中的一部分．

HT是bug啊是bug

作者: ConroeXE 时间: 2007-5-23 23:10
提示: 作者被禁止或删除内容自动屏蔽

作者: Ricepig 时间: 2007-5-23 23:18

原帖由 ConroeXE 于 2007-5-23 23:10 发表

明年这个“bug”搞不好又来了。HT和P4架构是不合时宜的“Extreme”。

阿，它又来了~~~Intel在搞什么

作者: ConroeXE 时间: 2007-5-23 23:23
提示: 作者被禁止或删除内容自动屏蔽

作者: Ricepig 时间: 2007-5-23 23:28

原帖由 ConroeXE 于 2007-5-23 23:23 发表

Power6上也有逻辑多线程啊，当然，有区别。但逻辑多线程这东西是挖掘CPU潜力的，没什么不好。是extreme不是bug。可惜，就是成倍增大了对操作系统支持的硬件线程数的需求。
总之这种尽量挖掘CPU运算潜力的e ...

HT类似技术只是针对指令流水线很长的情况吧

作者: ConroeXE 时间: 2007-5-23 23:37
提示: 作者被禁止或删除内容自动屏蔽

作者: shike_cuke 时间: 2007-5-24 10:03
是不是对频率很敏感？？？？

作者: ITANIUM2 时间: 2007-5-24 11:14
晕倒, 编译选项都没有写, 有啥好讨论的:wacko:

作者: hdy_aoe 时间: 2007-5-24 12:32
不奇怪，人家才2.2G～～～～

作者: Tanknet 时间: 2007-5-24 12:53
icc在K8上是可以显著提高性能的（和GCC或者VC比较)
只不过要打一个for AMD的补丁

http://www.swallowtail.org/naughty-intel.html

不然的话，Intel的编译器会把AMD所有处理器的执行路径选择成使用x87而不是SSE（2、3）

欢迎光临 POPPUR爱换 (https://we.poppur.com/)