|
认为bd核心的整数性能比k10低,那有2个前提,一是bd的整数单元就是在k10的基础上消去1/3,二是k10的3个alu利用率很高。
而实际上bd的2alu和2agu是独立的,各自拥有完整管线,利用率更高,再结合改进相当大的预取,分支预测、宏融合以及需要重新设计的译码单元,bd核心的整数ipc肯定比k10要高。amd在总结里把单线程性能作为显著提升的要点之一提出来,应当是ipc提高与更先进的turbo模式共同作用的结果。
hammerking 发表于 2010-8-25 19:42 ![]()
1、K10.5的ALU管线不完整么?
2、按照AMD的图,预取的改进相当大,但是效率问题不提(分支预测的效率更不提),AMD的宏融合情况也没有很明晰的答案,至少K10.5的效率不明显。Bulldozer能不能做到很好的改善?如果从编译器这个AMD心结看,我的观点是不理想。重新设计的译码单元也是以观后效。因此,我个人认为BD核心的整数IPC不比K10强,相反会倒退。
3、我一直坚持这个观点,Bulldozer的收益在于顺序结构的多线程程序。 |
|