原帖由 larrabee 于 2008-8-31 16:53 发表
我楼顶发贴时就在想有菜鸟说只有汇编才能影响cpu指令级并行,不幸而言中。
我很菜,你比我更菜。。。。看完那本“软件优化手册 --IA32平台高性能手册“ ,再来教导我吧。
原帖由 larrabee 于 2008-8-31 16:53 发表
我楼顶发贴时就在想有菜鸟说只有汇编才能影响cpu指令级并行,不幸而言中。
我很菜,你比我更菜。。。。看完那本“软件优化手册 --IA32平台高性能手册“ ,再来教导我吧。
原帖由 netmask254 于 2008-8-31 15:57 发表
尽量使用矢量或矩阵?{titter:]
因为Intel的CPU都有超级乱序功能(配合编译器的优化),所以你根本不必操心这个问题。换句话说,想了也是白想,除非你是直接用汇编语言而非这类高级语言。
原帖由 larrabee 于 2008-9-1 02:12 发表
是不是就是这样:
1)选择一个对simd支持更好的编译器,代码首先考虑对simd优化;
2)然后考虑 尽量减少simd指令之间的数据关联,
simd指令及其乱序执行效率 ,有点类似于openmp与mpi混合编程模型?
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |