POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 5883|回复: 35
打印 上一主题 下一主题

看看Intel C++下P4、K8、扣肉的差距。ICC对肉无用?

[复制链接]
头像被屏蔽
跳转到指定楼层
1#
发表于 2007-5-23 16:05 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
2#
发表于 2007-5-23 16:19 | 只看该作者
P4本就是要靠软件优化的。
回复 支持 反对

使用道具 举报

3#
发表于 2007-5-23 16:21 | 只看该作者
原帖由 acqwer 于 2007-5-23 16:19 发表
P4本就是要靠软件优化的。

流水线太长了,一定得优化
现在的R600也类似
回复 支持 反对

使用道具 举报

4#
发表于 2007-5-23 16:22 | 只看该作者
其实这个测试考虑到用的Intel编译器,而且AMD主频低那么多,其实结果是可以接受的
回复 支持 反对

使用道具 举报

头像被屏蔽
5#
 楼主| 发表于 2007-5-23 16:26 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

6#
发表于 2007-5-23 16:28 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 16:26 发表


如果看扣肉的表现的话,ICC似乎是报废了。:sweatingbullets:

SSE4出来后,ICC又有用了。
回复 支持 反对

使用道具 举报

7#
发表于 2007-5-23 16:29 | 只看该作者
原帖由 acqwer 于 2007-5-23 16:28 发表

SSE4出来后,ICC又有用了。

靠编译器自动做SSE4优化,提高有限的
还是得程序员自觉使用SSE4
回复 支持 反对

使用道具 举报

8#
发表于 2007-5-23 16:30 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 16:26 发表


如果看扣肉的表现的话,ICC似乎是报废了。:sweatingbullets:

可能编译器小组对扣肉的优化还没有完成~~~
回复 支持 反对

使用道具 举报

9#
发表于 2007-5-23 16:30 | 只看该作者
这个以前我同事试验过,用C编写一个模拟火焰的程序测试机器。

标准Linux 带的 GCC 编译后 执行了 5个小时还多
Intel自己的 编译器也就3小时不到。
回复 支持 反对

使用道具 举报

10#
发表于 2007-5-23 16:30 | 只看该作者
貌似Intel C++为Netbrust优化的很好?
回复 支持 反对

使用道具 举报

11#
发表于 2007-5-23 16:32 | 只看该作者
原帖由 raphael8269 于 2007-5-23 16:30 发表
貌似Intel C++为Netbrust优化的很好?

恩,ICC非常依赖CPU体系~~~
回复 支持 反对

使用道具 举报

头像被屏蔽
12#
 楼主| 发表于 2007-5-23 16:32 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

13#
发表于 2007-5-23 16:33 | 只看该作者
原帖由 samhrc 于 2007-5-23 16:30 发表
这个以前我同事试验过,用C编写一个模拟火焰的程序测试机器。

标准Linux 带的 GCC 编译后 执行了 5个小时还多
Intel自己的 编译器也就3小时不到。

把算术运算替换成Kernal Math Library提高得更多
回复 支持 反对

使用道具 举报

14#
发表于 2007-5-23 16:33 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 16:32 发表


架购不同,简单地对比频率有意义么。
如果要达到955XE风冷小4G的成绩,X2是要超3G的。

恩,这倒是,不过拿2.2比4G,怎么也说不过去
回复 支持 反对

使用道具 举报

头像被屏蔽
15#
 楼主| 发表于 2007-5-23 16:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

16#
发表于 2007-5-23 16:36 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 16:34 发表


应该是ICC就是针对Netbrus的。对扣肉应该说毫无用处。

主要原理就是识别代码块替换多余计算内容,调整指令顺序避免惩罚,用更高效率的指令替换低效率指令
回复 支持 反对

使用道具 举报

头像被屏蔽
17#
 楼主| 发表于 2007-5-23 16:36 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

18#
发表于 2007-5-23 16:37 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 16:36 发表


作个参考,不是说X2不能超,可以看出来,X2即使超,跑ICC编译的程序,再超也是白搭。:)

恩,内部结构不同,对各指令的执行效率也不同的
回复 支持 反对

使用道具 举报

19#
发表于 2007-5-23 17:20 | 只看该作者
貌似icc有很多版本,不光针对P4优化。
另外怎么自觉使用SSE4?嵌入汇编?
回复 支持 反对

使用道具 举报

20#
发表于 2007-5-23 17:29 | 只看该作者
原帖由 罗菜鸟 于 2007-5-23 17:20 发表
貌似icc有很多版本,不光针对P4优化。
另外怎么自觉使用SSE4?嵌入汇编?

汇编也可以
Intel好像也有类似SDK的东西,定义了一些结构和函数
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-5-14 01:53

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表