POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: 自自在在
打印 上一主题 下一主题

intel的指令集为何那么牛??

[复制链接]
21#
发表于 2007-5-23 16:16 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 15:42 发表


如果是跑ICC编译的程序,amd惨到吓死人。P4最得益于ICC,而扣肉表现和一般,似乎ICC对扣肉无用。

那是因为P4是长流水线,指令的先后关系及分支对执行效率影响很大。扣肉流水线短,影响就要小得多。所以加速效果不明显
回复 支持 反对

使用道具 举报

22#
 楼主| 发表于 2007-5-23 16:39 | 只看该作者
这个帖子没发错,学到东西了:lol:
回复 支持 反对

使用道具 举报

23#
发表于 2007-5-23 17:16 | 只看该作者
一直以来依靠指令集提高cpu性能就从没明显过,更别提系统性能了。
回复 支持 反对

使用道具 举报

24#
发表于 2007-5-23 17:30 | 只看该作者
原帖由 口口口乐 于 2007-5-23 17:16 发表
一直以来依靠指令集提高cpu性能就从没明显过,更别提系统性能了。

这是CISC的思路嘛
回复 支持 反对

使用道具 举报

demonpumpkin 该用户已被删除
25#
发表于 2007-5-23 18:47 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

26#
发表于 2007-5-23 20:41 | 只看该作者
原帖由 zaarath 于 2007-5-23 15:55 发表


AMD把SSE照单全收是一分钱也不用付的,这和AMD可以制造x86 cpu是一个道理。当年Intel并不想允许AMD使用MMX/SSE, 但是AMD告上法庭,法庭判决指令集并不受商标权的约束,所以AMD可以直接拿来用。

兄弟, 你确信么? 我晕
回复 支持 反对

使用道具 举报

27#
发表于 2007-5-23 20:44 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 15:42 发表


如果是跑ICC编译的程序,amd惨到吓死人。P4最得益于ICC,而扣肉表现和一般,似乎ICC对扣肉无用。


AMD不惨的, ICC的优化大多都是general的, CPU设计的思路一样的, 哪能有很大差距? 实际上AMD的很多benchmark数据是用ICC的结构
回复 支持 反对

使用道具 举报

28#
发表于 2007-5-23 20:44 | 只看该作者
原帖由 Ricepig 于 2007-5-23 17:30 发表

这是CISC的思路嘛

你先去查查VMX是什么吧。
回复 支持 反对

使用道具 举报

头像被屏蔽
29#
发表于 2007-5-23 21:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

30#
发表于 2007-5-23 21:43 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 21:23 发表


你经常使用ICC编译的程序么?用过应该有体会.至少,我还没见过AMD跑ICC不惨的例子.

嗯, 我经常使用ICC的. 编译器的优化无非是通用优化 + uArch相关的优化, 通用的优化总归大家都有好处, A和I的CPUuArch在编译器这一级看来又很类似, 所以大多数情况下这种优化也能对两种U都有相同的作用.
回复 支持 反对

使用道具 举报

31#
发表于 2007-5-23 23:14 | 只看该作者
原帖由 acqwer 于 2007-5-23 20:44 发表

你先去查查VMX是什么吧。

VMX是什么不知道

我不喜欢你说话的方式
回复 支持 反对

使用道具 举报

32#
发表于 2007-5-23 23:16 | 只看该作者
原帖由 gazel 于 2007-5-23 21:43 发表

嗯, 我经常使用ICC的. 编译器的优化无非是通用优化 + uArch相关的优化, 通用的优化总归大家都有好处, A和I的CPUuArch在编译器这一级看来又很类似, 所以大多数情况下这种优化也能对两种U都有相同的作用.


通用优化GCC也做了,主要就是指令相关优化,I和A的U在这一点上还是有差别的,关于指令排列顺序的“惩罚”值A和I特别不同。ICC对AMD有提高,但是没有Intel那么大,Intel工程师这么说还是很中肯的
回复 支持 反对

使用道具 举报

头像被屏蔽
33#
发表于 2007-5-23 23:17 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

34#
发表于 2007-5-23 23:19 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 23:17 发表


AMD不是因为Intel c++针对自己有“特殊待遇”起诉了Intel么?莫非阁下在amd上运用Intel编译器可以绕开这些“特殊待遇”?:)

对于AMD的U,提高多少还是有一点的拉,呵呵
比如像这样的计算(matrix里元素是int类型)
for(int i=1;i<10000;i++)
{
    matrix[1] = matrix2[1] * matrix3[1];
    matrix[2] = matrix2[2] * matrix3[2];
    matrix[3] = matrix2[3] * matrix3[3];
    matrix[4] = matrix2[4] * matrix3[4];
}

[ 本帖最后由 Ricepig 于 2007-5-23 23:20 编辑 ]
回复 支持 反对

使用道具 举报

头像被屏蔽
35#
发表于 2007-5-23 23:32 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

36#
发表于 2007-5-23 23:33 | 只看该作者
原帖由 Ricepig 于 2007-5-23 23:14 发表

VMX是什么不知道

我不喜欢你说话的方式

Vector Multimedia eXtension,用于power的扩展指令集。
回复 支持 反对

使用道具 举报

37#
发表于 2007-5-23 23:39 | 只看该作者
主要是多媒体方面的优化,当年p3年代,解mpeg4慢得要命
回复 支持 反对

使用道具 举报

38#
发表于 2007-5-24 00:56 | 只看该作者
原帖由 acqwer 于 2007-5-23 23:33 发表

Vector Multimedia eXtension,用于power的扩展指令集。

还是SIMD,不符合RISC的思路啊
回复 支持 反对

使用道具 举报

39#
发表于 2007-5-24 00:59 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 23:32 发表


我只是对软件实际速度感兴趣,这个对我就没用了。

在用Intel C++编译的Vray测试的时候,有的运算4.5G的PD 955XE速度是X2 3800+的两倍。换句话说,3800+要超频整一倍才行,这对于X2是不可能的任务。Intel ...

主要原因就是指令顺序的优化,对于P4来说,什么指令放在一起执行,什么指令在什么指令后执行是很影响速度的。而这种优化和CPU相关性非常高,X2 3800+这种AMD的cpu,指令之间的关系肯定和P4不同,所以优化出来的结果,提高有限
回复 支持 反对

使用道具 举报

40#
发表于 2007-5-24 08:58 | 只看该作者
原帖由 ConroeXE 于 2007-5-23 23:17 发表


AMD不是因为Intel c++针对自己有“特殊待遇”起诉了Intel么?莫非阁下在amd上运用Intel编译器可以绕开这些“特殊待遇”?:)

特殊待遇是没有的, 只不过ICC是Intel的产品, 编译优化的基础本来就是针对某种pattern进行的, 对某个uArch优化的代码序列, 对另一个可能不, 这个完全合理. ICC的工程师哪能那么闲故意写很多code去给AMD特殊待遇?

所以结论是: 既然没有特殊待遇, 当然不须绕开. 大多数情况下, 优化对两种U会都有好处的 (不过I U的好处一定大于A U的好处是一定的了).
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-5-13 20:14

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表