POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 5055|回复: 27
打印 上一主题 下一主题

一些关于构架的问题

[复制链接]
跳转到指定楼层
1#
发表于 2009-5-16 12:06 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
1 超标量构架,标量构架具体是指什么啊?

2 SIMD,MIMD是什么?

3 单精度浮点运算,双精度浮点运算是啥?

4 浮点运算能力如何计算?

5 warp,thread是指啥?

6 co-issue是什么?

7 ALU是什么?

8 ILP是啥?

9 gather-scatter是啥?store是啥?

期待高手的解答~~~~~~
2#
 楼主| 发表于 2009-5-16 12:11 | 只看该作者
还有什么叫并行,串行,我小白啊,高手们耐心些吧谢谢了
回复 支持 反对

使用道具 举报

3#
发表于 2009-5-16 12:35 | 只看该作者
你可以找一个本计算机体系结构的书先看看 ,比如 Computer architecture - a Quantitative Approach。
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2009-5-16 13:07 | 只看该作者
有。。。有中文的吗。。。。
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2009-5-16 13:10 | 只看该作者
还有我的那些问题可以简单的解答一下吗。。。。。
回复 支持 反对

使用道具 举报

6#
发表于 2009-5-16 14:05 | 只看该作者
1、标量处理器是最简单的处理器形式,一个标量处理器同一时间只跑一个或者两个数据项。和标量处理器对应的就是向量处理器,在向量处理器上一条指令同时处理多个数据项。

超标量处理器可以说是标量处理器和向量处理器的结合物,同一时间内可以有多条指令在跑分离的数据项。

2、SIMD 就是单指令多数据,MIMD 就是多指令多数据,所有的多核处理器都是 MIMD。

3、单精度浮点运算就是 32-bit 浮点运算,双精度就是 64-bit 浮点,多少的 bit 代表的是这个浮点数存储空间。

4、浮点计算和整数运算一样在计算机里都是可以二进制方式进行,但是更复杂,你要了解浮点数的运算,首先还是得了解浮点数的定义、表示格式、规格化、异常等规定。

5、在 CUDA 中,thread 是 GPU stream processor 执行的最小单位,一个 warp 包含 32 个 thread, stream processor 和显存的一次传输动作可以实现半个 warp 的搭配式传输。

6、co-issue 就是指处理器本身设计有两个运算单元可以在某些情况下实现同时发射、执行两条指令。

7、ALU 就是算术逻辑单元。

8、ILP 是指令级并行,例如超标量。

9、gather/scatter 是指可以往存储器的任意位置进行同时的读/存,store 在指令上而言就是指存入指令。

10、如果是指运算的话,以简单的生产线为例,一条生产线就是串行,多条生产线就是并行。
回复 支持 反对

使用道具 举报

7#
 楼主| 发表于 2009-5-16 14:13 | 只看该作者
6# Edison

太感谢了!!!~~~~~~
回复 支持 反对

使用道具 举报

8#
 楼主| 发表于 2009-5-16 14:18 | 只看该作者
大大

标量的ALU1可以跑1个ADD,也就是1 flops。
向量的ALU2可以分别跑3个ADD/MUL/MADD,这里最大化也就是3个MADD了,也就是6 flops。
标量的ALU2可以分别跑1个ADD/MUL/MADD,这里最大化也就是跑2个MADD,

你看这个算法对不
回复 支持 反对

使用道具 举报

9#
发表于 2009-5-16 14:37 | 只看该作者
标量的话,应该就是一个。
回复 支持 反对

使用道具 举报

10#
发表于 2009-5-16 16:58 | 只看该作者
建议搂主WIKI一下,上面解释的比我更解释的专业。

至于书,可以考虑这本 http://211.157.25.130/20255&ref=ps  别买第四版,第四版实在裁减的太过分了,居然很多重要知识都放到附录了。
回复 支持 反对

使用道具 举报

11#
发表于 2009-5-16 17:26 | 只看该作者
附录都在 CD 里,其实没啥裁剪,不过感觉上还是稍微跟不上时代。
回复 支持 反对

使用道具 举报

12#
发表于 2009-5-16 17:53 | 只看该作者
本帖最后由 ic.expert 于 2009-5-16 19:11 编辑

这哥们要看中文版,但是CD都没翻译,所以让他选第三版,中文还多一点……

量化主要作为Master入门教材,各个领域还有各个领域不同的教材,比如流处理体系结构/数据流体系结构/超常指令字体系结构/TTA体系结构/集群体系结构/网格体系结构/向量体系结构/图形体系结构等等都有专门的教材讲解,甚至连存储器体系结构也有专门的教材。如果想进一步更深入可以阅读Paper。

而且真正研究技术的话一定要了解技术的历史,这些历史会解释为什么这个东西会这样?比如Thread这个概念,为什么会有Thread?Thread和图灵机有什么关系?Thread是怎么诞生的,最开始他解决了什么问题?只有知道了这些,我们才有能力更好的发现新的并行模型,或是某种合适粒度下的Thread模型,而不仅仅局限于当前固有的TLP/ILP/DLP。所以,要有过去才有未来,技术从来就不分什么先进和落后,从1834年开始算起,基于ISA-baesd Architecture的计算机从诞生到现在已经170多年了,而想Graphics Pipeline这种API-based的计算机最早可以追溯到1822年。如果了解这之间技术的演化,就会发现很多技术来了又去,去了又来,反复出现和消亡。其实说到底,技术不过是权衡的一种手段而已。而《量化》只是讲解原理,并且分析当前最典型的“案例”。一般来说,如果研究和学习体系结构,《量化》不读5遍以上,不足以说看过这本书。如果这些基本概念都掌握不好,更不要说什么分析GPU Architecture了。当然,我不是说陈先生的文章,陈先生主要从User的角度来看,出测评数据给广大显卡选购者看的,和科研目的不一样。我是说的是科研的态度大致大致如此。

我总能听到有人说GPU Inside的资料很难找,有人说这话的兄台甚至做了5年以上的D3D编程。在相关领域内,其实能说出这种话的人只有两种人,一种是做CPU Architecture,另一种是写Game的。对于一个研究Graphics的人来说,是不可能说中这种话的。

实际上我们所看到的商业化的技术比起其学术领域的成果要落后很多年,无论是图形方面还是并行计算方面。图形上,目前的商业技术还主要集中在80年代的科研成果基础之上的。而并行计算方面,CUDA和Stream Processing在效率上的差距更是不可同日而语,当然,CUDA好处是比Stream processing更通用一些。但是这并不是说CUDA更有前瞻性,只能说SM4“很不负责任的”提供了一个更通用的底层硬件,CUDA仅仅是用了这个硬件而已。
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2009-5-16 19:04 | 只看该作者
11# Edison

那大大还有什么推荐的书籍吗?基础一点的最好,当然也别太基础了。。。。
回复 支持 反对

使用道具 举报

14#
 楼主| 发表于 2009-5-16 19:09 | 只看该作者
12# ic.expert 如果我是管理员可真想给你加点分
回复 支持 反对

使用道具 举报

15#
发表于 2009-5-16 19:13 | 只看该作者
中文方面资料很少,你可以再看看〈OpenGL超级宝典〉《实时计算机图形学〉这三本就够看一年的。
回复 支持 反对

使用道具 举报

16#
 楼主| 发表于 2009-5-16 19:18 | 只看该作者
这些书像我这类初学者可以看明白吗?多看几遍也无妨
回复 支持 反对

使用道具 举报

17#
发表于 2009-5-16 19:50 | 只看该作者
这个有点专业了,得有个高手来为你解答。
回复 支持 反对

使用道具 举报

18#
发表于 2009-5-16 21:38 | 只看该作者
回复 支持 反对

使用道具 举报

19#
 楼主| 发表于 2009-5-16 21:56 | 只看该作者
我看不懂英文啊。。。。。。。。
回复 支持 反对

使用道具 举报

Emu10k2 该用户已被删除
20#
发表于 2009-5-17 02:17 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-27 00:41

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表