|
理论值是加倍。
其实应该比较的是一个128位加乘融合和一个128位乘并一个128位加。
理论上有折扣---加乘单元可能只提供一个端口,换句话说不能同时跑分立的一个加一个乘。
不过也有加成---融合的加乘运算实际比1乘后再1加要快不少。
不过折扣的情况其实挺罕见,但是软件编得好的话加成的情况倒是普遍的。 所以现在普遍使用FMACspinup 发表于 2010-8-25 16:28
理论值的确加倍,但是那是理想情况,运行linkpack肯定很好看。但是发射宽度极度缩小,一个模块(两个核心)对应四发射,而整数管线却加大,有点小水管进大池子,然后又用缩小水管(相比K10.5)出水,这真是一个很变形的东西,相当于两头小,中间大的梭形结构,难道AMD真的想用管线做缓存?(^_^),或说AMD真的相信服务器计算领域的程序都是顺序性的比较多,能够时刻充满管线?我认为除非AMD的影响力要大于Intel,而且能够提供比Intel更优秀的编译器。
还有一个推测,Intel的Many core架构走的是顺序结构,Intel要推广这个玩意,自然在编译器上需要大力优化。AMD就看中这个,要搭这个便车?如果真是这样,那些能够在Many core上优化很好的东西,Bulldozer可能会运行得很好,实现“增加33%晶体管得到50%的提升”。 |
|