POPPUR爱换

标题: 关于CPU之“位”的指标定义的一点疑惑 [打印本页]

作者: complexmind    时间: 2007-11-15 18:32
标题: 关于CPU之“位”的指标定义的一点疑惑
1。关于CPU“位”的指标定义,一般看法是指指令字长,但是我们大学的一位国家计算机实验室的老师在给我们上课时说:“这是代表着CPU每个时钟周期可以处理32位的数据。”我觉得这很扯淡:p ,32位的奔腾4还不是可以同时钟周期处理64位浮点乘和浮点加,我对之提出疑问时,老师却说:“这是软件的模拟。”我彻底无语了:funk: :funk: ,唉,这是我第一次听说这样的解释,各位大虾,开发者,小弟想问问这个说法对不对。
2。但是经过一番找资料,我也发现指令字长这个说法有问题,X86指令是变长的,这是不是说,X86的指令最长仅可以到32位?而且奔腾四的通用寄存器只有32位,可是它的定长微操作码为118位:funk: :funk: ,这似乎放不进control unit的通用寄存器里,这到底是怎么回事:huh: :huh: ??
望各位大虾达人指教,小弟不胜感激,谢了!!!
作者: maxmusic    时间: 2007-11-15 18:41
只知道所谓的64位程序在32位的系统上不能用,其它的不知道哦,我是文盲呢,这会用的手写板上网的
作者: maxmusic    时间: 2007-11-15 18:42
不小心竟给我占到了沙发?
作者: potomac    时间: 2007-11-15 18:46
提示: 作者被禁止或删除 内容自动屏蔽
作者: Prescott    时间: 2007-11-15 18:47
所谓的字长,现在已经没有什么意义了。所以,定义多少“位”,主要就是指通用寄存器宽度。
作者: 晶晶守护神    时间: 2007-11-15 18:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-11-15 19:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: 夜里睡觉的猫    时间: 2007-11-15 19:01
好复杂啊
还是不问了啊
大多数人就是使用而已
作者: 晶晶守护神    时间: 2007-11-15 19:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: 罗菜鸟    时间: 2007-11-15 19:14
一般还是以通用寄存器宽
现在的CPU都采用了哈佛结构的思想,数据总线可以做很宽(前提是有相应的指令支持),而指令长度决定的是指令的信息量,但是CPU一般只需要32位的指令长度就可以了,X86的指令不止32位,其长度不固定。118位微码怎么来的我也觉得不可思议,intel的核心技术没有人能接触到
作者: 鲁爾    时间: 2007-11-15 19:17
主要就是指通用寄存器宽度
作者: complexmind    时间: 2007-11-15 19:23
原帖由 Prescott 于 2007-11-15 06:47 PM 发表
所谓的字长,现在已经没有什么意义了。所以,定义多少“位”,主要就是指通用寄存器宽度。

:wub: :wub: 又见老大,问好!
那个118位的微操作码到底放哪里呢??我看了P4 的寄存器组织,没有那么大的寄存器的说。。。。。
作者: 罗菜鸟    时间: 2007-11-15 19:25
原帖由 complexmind 于 2007-11-15 19:23 发表

:wub: :wub: 又见老大,问好!
那个118位的微操作码到底放哪里呢??我看了P4 的寄存器组织,没有那么大的寄存器的说。。。。。

晕,寄存器是存数据的好不好?
作者: complexmind    时间: 2007-11-15 19:28
原帖由 晶晶守护神 于 2007-11-15 06:56 PM 发表
标准定义  来自  计算机组成原理  CPU 位就是cpu字长 的位数 。
即使cpu一次能处理多少位的数据 。。你们老师说对了的 .这里的一次指一个电路周期 。。P4 能处理64浮点 是因为有专门的多媒体指令  里面的寄存器有12 ...

电路周期和时钟周期是一回事么:a) ??
P4 内部的总线是L2到L1是256位的,直接连到指令调度站的是128位的,而且它的整数ALU好像有64位的啊,大虾,这怎么解释?
谢谢!!
作者: complexmind    时间: 2007-11-15 19:31
原帖由 罗菜鸟 于 2007-11-15 07:25 PM 发表

晕,寄存器是存数据的好不好?

也可以放指令啊,通用寄存器是通用的,,,,控制和状态寄存器也有放指令的地方
作者: 晶晶守护神    时间: 2007-11-15 19:34
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-11-15 19:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: Prescott    时间: 2007-11-15 19:45
原帖由 complexmind 于 2007-11-15 19:23 发表

:wub: :wub: 又见老大,问好!
那个118位的微操作码到底放哪里呢??我看了P4 的寄存器组织,没有那么大的寄存器的说。。。。。

微指令不放在你能看见的寄存器里,这种寄存器是程序不可见的。
P4的trace cache就是用来存微指令的。
作者: complexmind    时间: 2007-11-15 19:46
原帖由 晶晶守护神 于 2007-11-15 07:34 PM 发表
电路周期和时钟周期是一回事么:a) ??
P4 内部的总线是L2到L1是256位的,直接连到指令调度站的是128位的,而且它的整数ALU好像有64位的啊,大虾,这怎么解释?
指令调度站? 是指的CPU 内部控制器吗 ?
CACHE 的 ...

一个时钟周期只能处理32位数据我有些接受不了啊:a) :a) ,那不是一个128位的声卡DSP比P4在某种意义上还厉害些,,,,而且P4有那么多ALU,累加起来也改不止区区32位吧:a) :a) ,不理解,希望大虾别怪我笨啊,,,,小弟今年高考才完,,,刚刚自学硬件。:a) :a)
指令调度站是P4out of order开始的地方。
至于硬件模拟,我就更有些摸不着头脑了,,,,,按我的观念看,可以以时一钟周期处理完64位的数据,不管内部结构是什么,都算真实的一时钟周期处理64位数据啊,,,,怎么又成了只能处理32位呢??
恳请赐教:a) :a)
作者: complexmind    时间: 2007-11-15 19:49
原帖由 Prescott 于 2007-11-15 07:45 PM 发表

微指令不放在你能看见的寄存器里,这种寄存器是程序不可见的。
P4的trace cache就是用来存微指令的。

哦,明白了,谢谢:wub: :wub: ,P4一时钟周期真的只能处理32位的数据么,,感觉接受不了,,,太少了啊,光靠ALU累加起来也不止区区32位啊。。。:a)
作者: Prescott    时间: 2007-11-15 19:54
原帖由 complexmind 于 2007-11-15 19:49 发表

哦,明白了,谢谢:wub: :wub: ,P4一时钟周期真的只能处理32位的数据么,,感觉接受不了,,,太少了啊,光靠ALU累加起来也不止区区32位啊。。。:a)

一个周期能处理多少数据并不重要,Larrabee中的小核心一次能处理512bit的数据,难道他就厉害了吗?
重要的是虚拟地址宽度,这决定了一个程序的寻址空间大小,也决定了能够处理多大的问题。
作者: 晶晶守护神    时间: 2007-11-15 19:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: complexmind    时间: 2007-11-15 20:12
原帖由 晶晶守护神 于 2007-11-15 07:59 PM 发表

不是1个时钟周期 是1个电路周期 。。
你要这么想 的话  。。。。声卡的dsp 又不是通用的 。。我记得PS 2 是256位的CPU 。。能说PS 2 很厉害吗?
所谓硬件模拟 就是用专门的微电路 通过 专门的大数算法实现  。。 ...

PS2是64位的MIPS R4000改。
感觉既然是已经做到了硬件,那就无所谓模拟吧,不过是这么定义的话,我就没什么疑问了。
我是道桥专业的,业余爱好是计算机硬件,而且对软件特别没有爱:sweatingbullets:
最近在看《计算机结构体系》,还有什么关于CPU,GPU硬件结构的书么?希望大虾介绍,我喜欢相当硬的书,软的最好仅稍稍触即及:sweatingbullets: 谢谢了!

[ 本帖最后由 complexmind 于 2007-11-15 20:14 编辑 ]
作者: complexmind    时间: 2007-11-15 20:19
原帖由 Prescott 于 2007-11-15 07:54 PM 发表

一个周期能处理多少数据并不重要,Larrabee中的小核心一次能处理512bit的数据,难道他就厉害了吗?
重要的是虚拟地址宽度,这决定了一个程序的寻址空间大小,也决定了能够处理多大的问题。

哦,明白了,但是这个指标在从理论上看最能代表CPU处理问题的速度啊,就像IPC一样,不重要么??小弟不明白啊,难道这是表明了实际运用中对于CPU数据吞吐一般满足不了ALU的需求么?

[ 本帖最后由 complexmind 于 2007-11-15 20:20 编辑 ]
作者: 晶晶守护神    时间: 2007-11-15 20:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: complexmind    时间: 2007-11-15 20:30
原帖由 晶晶守护神 于 2007-11-15 08:24 PM 发表
哦  就看 计算机专业的书吧  按顺序来  模拟电路 数字电路 计算机组成 计算机体系结构   差不多  ~~!!!GPU 还没看过  cpu 哎 就是8086、386 很多  其实主要是讲汇编了

是硬件可以做到的
区别是32位cpu 可以 ...

十分感谢!!:thumbsup: :thumbsup:
作者: aeondxf    时间: 2007-11-15 20:32
:lol: 其实我现在觉得看一块U是多少位还是看整数寄存器好了.
作者: 晶晶守护神    时间: 2007-11-15 20:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: complexmind    时间: 2007-11-15 20:45
原帖由 晶晶守护神 于 2007-11-15 08:32 PM 发表

运1次处理512位就很快吗? 1次 也要看需要好多时间哦 ~~!!~~
下面的1次均指1个电路周期  需要多次时钟周期 假设都是4次  这只是我举个例子  
比如一个500MHZ的 64位cpu 一次处理64位数据 用了4个时钟周期  需要 ...

谢谢!!大虾解决了我好久以来心里不明白的问题,再次感谢!!
作者: yzsxlijunjun    时间: 2007-11-15 21:17
其实和大家说的,这个人家产有9位数的位一个意思。^_^
作者: samhrc    时间: 2007-11-15 21:53
原帖由 potomac 于 2007-11-15 18:46 发表
凡是位高的就快。
凡是针脚多的就先进。
:devil:


PATA 比SATA 针脚多,位数也高 。 RS 232 比 USB 针脚多,位数一样高。:w00t):
作者: 晶晶守护神    时间: 2007-11-15 23:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-11-16 00:05
原帖由 complexmind 于 2007-11-15 19:49 发表

哦,明白了,谢谢:wub: :wub: ,P4一时钟周期真的只能处理32位的数据么,,感觉接受不了,,,太少了啊,光靠ALU累加起来也不止区区32位啊。。。:a)


P4在跑x64指令的时候,是一个指令能处理32bit的数据,而不只是一个周期
P4的2个倍速ALU在一个周期最多可以执行4个指令,也就是处理4*32bit的数据……
作者: itany    时间: 2007-11-16 00:07
原帖由 晶晶守护神 于 2007-11-15 23:58 发表
一般说来cpu 娇娇多 的比较先进
如321


报告,LGA 775没有针脚……

:sweatingbullets:
作者: 晶晶守护神    时间: 2007-11-16 00:18
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-11-16 00:32
原帖由 晶晶守护神 于 2007-11-16 00:18 发表

不是没有脚啊  只是脚很短很短 .....不到1mm


在下以为,能折断,能扎手的才是针脚,呵呵
作者: 晶晶守护神    时间: 2007-11-16 00:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-11-16 00:52
原帖由 晶晶守护神 于 2007-11-16 00:41 发表


:p 好嘛 775 没脚 不过有点~ 而且不只2点


其实,我想说的是,
想要修真,必先断针……

:ph34r:
作者: james0258    时间: 2007-11-19 12:03
原帖由 potomac 于 2007-11-15 18:46 发表
凡是位高的就快。
凡是针脚多的就先进。
:devil:


很好,很强大!!!
作者: PeachMMX    时间: 2007-11-19 12:32
对哦,这样的问题很专业哦。有这么多高人来回答,能学到很多东西。

虽然偶是搞ARM的,不过有些底层的东西还是要补补。
作者: 动力音熊II    时间: 2007-11-19 15:38
告诉楼主一个邪恶的事情。。。。扣肉6300,是32位的U。。。

含泪飘过~ :crying:




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4