POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: HeavenPR
打印 上一主题 下一主题

吐血推荐阅读文章 NetBurst: A Processor with Replay System

[复制链接]
21#
发表于 2005-6-3 21:31 | 只看该作者
其实可以追溯到2年以前的,这和Chip Architect说的是同一实质内容。 不过是当时谈到K8对付L1/L2 miss问题时,采用了和P4/Alpha EV6 不同的方法--从调度器中先删除掉相关的指令,可能这是因为整数调度器虽然有24-entrys,其实是分成3块,每块只有8-entrys,调度空间太小了,K8只好一删除方法保留调度空间。
一般不同于K8的,不是去删除,而是采用再次发射,P4很出色的地方在于采用了倍速ALU(P4 3G可以6G速度计算)承受再次发射执行的压力。他们还具有和K8所不具备的data-speculation能力--乱序猜测读写能力

最后评价是方法不同但K8一样能有效率的处理L1/L2 miss问题。
回复 支持 反对

使用道具 举报

22#
发表于 2005-6-3 21:33 | 只看该作者
HPR我写给你的HT短消息。你看到没有?短消息功能还是不是正常的?
回复 支持 反对

使用道具 举报

23#
 楼主| 发表于 2005-6-3 21:44 | 只看该作者
短信看到了,那个 div 时钟周期我是现编的,嘿嘿

还有 Prescott 的 Rapid Exec Engine 用了发热量超高的 LVS 低压浮动电路,所以导致功耗狂增

本来准备借 LVS 再次提高频率,可是却被功耗给卡主了
回复 支持 反对

使用道具 举报

24#
发表于 2005-6-3 21:52 | 只看该作者
可是我确实是的不停的连续做,开两个和开一个线程都一样的,平均26个时钟,去掉扣一个时钟(mov xor的开销),就是划到25啊?
mov
xor
div

mov
xor
div

mov
xor
div
回复 支持 反对

使用道具 举报

25#
发表于 2005-6-3 21:58 | 只看该作者
我确实做了xx M个div平均的。确实只有26
void div_int(void)
{
        int n =        N1M,k=1900000000,j=119311219,p=75456637;

        _asm
        {
                mov ecx,n;
                mov edi,k;
                mov eax,edi;
                xor edx,edx;
                mov ebx,j;
                mov esi,p;
                mov edx,esi;
L1:
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;

                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
////////////////////////////////16
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;

                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
////////////////////////////////32
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;

                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
////////////////////////////////48
                                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;

                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;

                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
////////////////////////////////64
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;

                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
                mov eax,edi;
                mov edx,esi;
                div ebx;
/////////////////////////72
                dec ecx;
                jnz L1;
        }
}
回复 支持 反对

使用道具 举报

26#
发表于 2005-6-3 23:25 | 只看该作者
相当强的文章 前几天看完就全盘保存了
回复 支持 反对

使用道具 举报

27#
发表于 2005-6-4 00:13 | 只看该作者
超长流水线为intel 带来主频的飞跃
也造就了他的高频低能
回复 支持 反对

使用道具 举报

28#
发表于 2005-6-4 00:17 | 只看该作者
NetBurst 架构,高主频的商业价值大于实用价值
回复 支持 反对

使用道具 举报

29#
发表于 2005-6-4 02:44 | 只看该作者
Originally posted by HeavenPR at 2005-6-3 14:54
xbitlabs 经过数月的研究写成的报告

Prescott: The Last of the Mohicans? (Pentium 4: from Willamette to Prescott)

里面介绍了 P4 NetBurst 鲜为人知的架构秘密: Replay Queue

前两天用了 5 个小时慢 ...


不就是个Speculation吗?有什么心里发毛的?
:p
回复 支持 反对

使用道具 举报

G70 该用户已被删除
30#
发表于 2005-6-4 02:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
31#
发表于 2005-6-4 02:51 | 只看该作者
画个图好理解点
回复 支持 反对

使用道具 举报

32#
发表于 2005-6-4 02:51 | 只看该作者
Originally posted by G70 at 2005-6-4 02:46

被扁为垃圾的P4E,结果还不是...=.=市场全胜.

恩,因为很多人迷信
回复 支持 反对

使用道具 举报

G70 该用户已被删除
33#
发表于 2005-6-4 03:02 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

34#
发表于 2005-6-4 04:30 | 只看该作者
Originally posted by G70 at 2005-6-4 03:02

完全是迷信么?可能是有人看不出其价值吧.


选择性失明的人太多了 -_-
回复 支持 反对

使用道具 举报

35#
发表于 2005-6-4 10:53 | 只看该作者

回复 #38 jaguard 的帖子

A64更快才是迷信。这个要看实际情况的,就算P4杀败了A64也不希奇。前两天不是EM64T在SM2.0中用XMM寄存器挫了x86-64的锐气?我是要看实际的,不听人乱说的。
回复 支持 反对

使用道具 举报

36#
发表于 2005-6-4 10:55 | 只看该作者
要看跑什么类型的软件
没有绝对哪个比哪个更快。。
回复 支持 反对

使用道具 举报

37#
发表于 2005-6-4 14:08 | 只看该作者
..........
回复 支持 反对

使用道具 举报

38#
发表于 2005-6-4 14:39 | 只看该作者
各位别吵,此贴就事论事,别把amd给扯进来
回复 支持 反对

使用道具 举报

39#
发表于 2005-6-4 19:53 | 只看该作者

回复 #45 wenmind 的帖子

是啊,我要求删除我的那几句无关的话。
回复 支持 反对

使用道具 举报

40#
发表于 2006-5-4 12:13 | 只看该作者
现在还讨论是否有点迟?就连intel自己都承认NetBurst是失败的,将要推出Conroe纠正这个过失。
不管它好不好,都是被淘汰的东西,不要在意。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-4-19 22:43

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表