intel的指令集为何那么牛？？

Ricepig · 发表于 2007-5-23 16:16

原帖由 ConroeXE 于 2007-5-23 15:42 发表

如果是跑ICC编译的程序，amd惨到吓死人。P4最得益于ICC，而扣肉表现和一般，似乎ICC对扣肉无用。

那是因为P4是长流水线，指令的先后关系及分支对执行效率影响很大。扣肉流水线短，影响就要小得多。所以加速效果不明显

自自在在 · 发表于 2007-5-23 16:39

这个帖子没发错，学到东西了:lol:

口口口乐 · 发表于 2007-5-23 17:16

一直以来依靠指令集提高cpu性能就从没明显过，更别提系统性能了。

Ricepig · 发表于 2007-5-23 17:30

原帖由 口口口乐 于 2007-5-23 17:16 发表
一直以来依靠指令集提高cpu性能就从没明显过，更别提系统性能了。

这是CISC的思路嘛

只看该作者 · 发表于 2007-5-23 18:47

提示: 作者被禁止或删除内容自动屏蔽

gazel · 发表于 2007-5-23 20:41

原帖由 zaarath 于 2007-5-23 15:55 发表

AMD把SSE照单全收是一分钱也不用付的，这和AMD可以制造x86 cpu是一个道理。当年Intel并不想允许AMD使用MMX/SSE, 但是AMD告上法庭，法庭判决指令集并不受商标权的约束，所以AMD可以直接拿来用。

兄弟, 你确信么? 我晕

gazel · 发表于 2007-5-23 20:44

原帖由 ConroeXE 于 2007-5-23 15:42 发表

如果是跑ICC编译的程序，amd惨到吓死人。P4最得益于ICC，而扣肉表现和一般，似乎ICC对扣肉无用。

AMD不惨的, ICC的优化大多都是general的, CPU设计的思路一样的, 哪能有很大差距? 实际上AMD的很多benchmark数据是用ICC的结构

acqwer · 发表于 2007-5-23 20:44

原帖由 Ricepig 于 2007-5-23 17:30 发表

这是CISC的思路嘛

你先去查查VMX是什么吧。

ConroeXE · 发表于 2007-5-23 21:23

提示: 作者被禁止或删除内容自动屏蔽

gazel · 发表于 2007-5-23 21:43

原帖由 ConroeXE 于 2007-5-23 21:23 发表

你经常使用ＩＣＣ编译的程序么？用过应该有体会．至少，我还没见过ＡＭＤ跑ＩＣＣ不惨的例子．

嗯, 我经常使用ICC的. 编译器的优化无非是通用优化 + uArch相关的优化, 通用的优化总归大家都有好处, A和I的CPUuArch在编译器这一级看来又很类似, 所以大多数情况下这种优化也能对两种U都有相同的作用.

Ricepig · 发表于 2007-5-23 23:14

原帖由 acqwer 于 2007-5-23 20:44 发表

你先去查查VMX是什么吧。

VMX是什么不知道

我不喜欢你说话的方式

Ricepig · 发表于 2007-5-23 23:16

原帖由 gazel 于 2007-5-23 21:43 发表

嗯, 我经常使用ICC的. 编译器的优化无非是通用优化 + uArch相关的优化, 通用的优化总归大家都有好处, A和I的CPUuArch在编译器这一级看来又很类似, 所以大多数情况下这种优化也能对两种U都有相同的作用.

通用优化GCC也做了，主要就是指令相关优化，I和A的U在这一点上还是有差别的，关于指令排列顺序的“惩罚”值A和I特别不同。ICC对AMD有提高，但是没有Intel那么大，Intel工程师这么说还是很中肯的

ConroeXE · 发表于 2007-5-23 23:17

提示: 作者被禁止或删除内容自动屏蔽

Ricepig · 发表于 2007-5-23 23:19

原帖由 ConroeXE 于 2007-5-23 23:17 发表

AMD不是因为Intel c++针对自己有“特殊待遇”起诉了Intel么？莫非阁下在amd上运用Intel编译器可以绕开这些“特殊待遇”？:)

对于AMD的U，提高多少还是有一点的拉，呵呵
比如像这样的计算(matrix里元素是int类型)
for(int i=1;i<10000;i++)
{
matrix[1] = matrix2[1] * matrix3[1];
matrix[2] = matrix2[2] * matrix3[2];
matrix[3] = matrix2[3] * matrix3[3];
matrix[4] = matrix2[4] * matrix3[4];
}

[ 本帖最后由 Ricepig 于 2007-5-23 23:20 编辑 ]

ConroeXE · 发表于 2007-5-23 23:32

提示: 作者被禁止或删除内容自动屏蔽

acqwer · 发表于 2007-5-23 23:33

原帖由 Ricepig 于 2007-5-23 23:14 发表

VMX是什么不知道

我不喜欢你说话的方式

Vector Multimedia eXtension，用于power的扩展指令集。

w0017 · 发表于 2007-5-23 23:39

主要是多媒体方面的优化，当年p3年代，解mpeg4慢得要命

Ricepig · 发表于 2007-5-24 00:56

原帖由 acqwer 于 2007-5-23 23:33 发表

Vector Multimedia eXtension，用于power的扩展指令集。

还是SIMD，不符合RISC的思路啊

Ricepig · 发表于 2007-5-24 00:59

原帖由 ConroeXE 于 2007-5-23 23:32 发表

我只是对软件实际速度感兴趣，这个对我就没用了。

在用Intel C++编译的Vray测试的时候，有的运算4.5G的PD 955XE速度是X2 3800+的两倍。换句话说，3800+要超频整一倍才行，这对于X2是不可能的任务。Intel ...

主要原因就是指令顺序的优化，对于P4来说，什么指令放在一起执行，什么指令在什么指令后执行是很影响速度的。而这种优化和CPU相关性非常高，X2 3800+这种AMD的cpu，指令之间的关系肯定和P4不同，所以优化出来的结果，提高有限

gazel · 发表于 2007-5-24 08:58

原帖由 ConroeXE 于 2007-5-23 23:17 发表

AMD不是因为Intel c++针对自己有“特殊待遇”起诉了Intel么？莫非阁下在amd上运用Intel编译器可以绕开这些“特殊待遇”？:)

特殊待遇是没有的, 只不过ICC是Intel的产品, 编译优化的基础本来就是针对某种pattern进行的, 对某个uArch优化的代码序列, 对另一个可能不, 这个完全合理. ICC的工程师哪能那么闲故意写很多code去给AMD特殊待遇?

所以结论是: 既然没有特殊待遇, 当然不须绕开. 大多数情况下, 优化对两种U会都有好处的 (不过I U的好处一定大于A U的好处是一定的了).

帐号		自动登录	找回密码
密码			注册

demonpumpkin 该用户已被删除	25^# 发表于 2007-5-23 18:47 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
demonpumpkin 该用户已被删除
	回复支持反对使用道具举报显身卡

ConroeXE ConroeXE 当前离线积分 5 IP卡狗仔卡头像被屏蔽	29^# 发表于 2007-5-23 21:23 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
ConroeXE ConroeXE 当前离线积分 5 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

ConroeXE ConroeXE 当前离线积分 5 IP卡狗仔卡头像被屏蔽	33^# 发表于 2007-5-23 23:17 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
ConroeXE ConroeXE 当前离线积分 5 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

ConroeXE ConroeXE 当前离线积分 5 IP卡狗仔卡头像被屏蔽	35^# 发表于 2007-5-23 23:32 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
ConroeXE ConroeXE 当前离线积分 5 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

intel的指令集为何那么牛？？

浏览过的版块