一些关于构架的问题

跳海自殺的鱼 · 发表于 2009-5-16 12:06

1 超标量构架，标量构架具体是指什么啊？

2 SIMD，MIMD是什么？

3 单精度浮点运算，双精度浮点运算是啥？

4 浮点运算能力如何计算？

5 warp，thread是指啥？

6 co-issue是什么？

7 ALU是什么？

8 ILP是啥？

9 gather-scatter是啥？store是啥？

期待高手的解答~~~~~~

跳海自殺的鱼 · 发表于 2009-5-16 12:11

还有什么叫并行，串行，我小白啊，高手们耐心些吧谢谢了

ic.expert · 发表于 2009-5-16 12:35

你可以找一个本计算机体系结构的书先看看，比如 Computer architecture - a Quantitative Approach。

跳海自殺的鱼 · 发表于 2009-5-16 13:07

有。。。有中文的吗。。。。

跳海自殺的鱼 · 发表于 2009-5-16 13:10

还有我的那些问题可以简单的解答一下吗。。。。。

Edison · 发表于 2009-5-16 14:05

1、标量处理器是最简单的处理器形式，一个标量处理器同一时间只跑一个或者两个数据项。和标量处理器对应的就是向量处理器，在向量处理器上一条指令同时处理多个数据项。

超标量处理器可以说是标量处理器和向量处理器的结合物，同一时间内可以有多条指令在跑分离的数据项。

2、SIMD 就是单指令多数据，MIMD 就是多指令多数据，所有的多核处理器都是 MIMD。

3、单精度浮点运算就是 32-bit 浮点运算，双精度就是 64-bit 浮点，多少的 bit 代表的是这个浮点数存储空间。

4、浮点计算和整数运算一样在计算机里都是可以二进制方式进行，但是更复杂，你要了解浮点数的运算，首先还是得了解浮点数的定义、表示格式、规格化、异常等规定。

5、在 CUDA 中，thread 是 GPU stream processor 执行的最小单位，一个 warp 包含 32 个 thread， stream processor 和显存的一次传输动作可以实现半个 warp 的搭配式传输。

6、co-issue 就是指处理器本身设计有两个运算单元可以在某些情况下实现同时发射、执行两条指令。

7、ALU 就是算术逻辑单元。

8、ILP 是指令级并行，例如超标量。

9、gather/scatter 是指可以往存储器的任意位置进行同时的读/存，store 在指令上而言就是指存入指令。

10、如果是指运算的话，以简单的生产线为例，一条生产线就是串行，多条生产线就是并行。

跳海自殺的鱼 · 发表于 2009-5-16 14:13

6# Edison

太感谢了！！！~~~~~~

跳海自殺的鱼 · 发表于 2009-5-16 14:18

大大

标量的ALU1可以跑1个ADD，也就是1 flops。
向量的ALU2可以分别跑3个ADD/MUL/MADD，这里最大化也就是3个MADD了，也就是6 flops。
标量的ALU2可以分别跑1个ADD/MUL/MADD，这里最大化也就是跑2个MADD，

你看这个算法对不

Edison · 发表于 2009-5-16 14:37

标量的话，应该就是一个。

ic.expert · 发表于 2009-5-16 16:58

建议搂主WIKI一下，上面解释的比我更解释的专业。

至于书，可以考虑这本 http://211.157.25.130/20255&ref=ps 别买第四版，第四版实在裁减的太过分了，居然很多重要知识都放到附录了。

Edison · 发表于 2009-5-16 17:26

附录都在 CD 里，其实没啥裁剪，不过感觉上还是稍微跟不上时代。

ic.expert · 发表于 2009-5-16 17:53

本帖最后由 ic.expert 于 2009-5-16 19:11 编辑

这哥们要看中文版，但是CD都没翻译，所以让他选第三版，中文还多一点……

量化主要作为Master入门教材，各个领域还有各个领域不同的教材，比如流处理体系结构/数据流体系结构/超常指令字体系结构/TTA体系结构/集群体系结构/网格体系结构/向量体系结构/图形体系结构等等都有专门的教材讲解，甚至连存储器体系结构也有专门的教材。如果想进一步更深入可以阅读Paper。

而且真正研究技术的话一定要了解技术的历史，这些历史会解释为什么这个东西会这样？比如Thread这个概念，为什么会有Thread？Thread和图灵机有什么关系？Thread是怎么诞生的，最开始他解决了什么问题？只有知道了这些，我们才有能力更好的发现新的并行模型，或是某种合适粒度下的Thread模型，而不仅仅局限于当前固有的TLP/ILP/DLP。所以，要有过去才有未来，技术从来就不分什么先进和落后，从1834年开始算起，基于ISA-baesd Architecture的计算机从诞生到现在已经170多年了，而想Graphics Pipeline这种API-based的计算机最早可以追溯到1822年。如果了解这之间技术的演化，就会发现很多技术来了又去，去了又来，反复出现和消亡。其实说到底，技术不过是权衡的一种手段而已。而《量化》只是讲解原理，并且分析当前最典型的“案例”。一般来说，如果研究和学习体系结构，《量化》不读5遍以上，不足以说看过这本书。如果这些基本概念都掌握不好，更不要说什么分析GPU Architecture了。当然，我不是说陈先生的文章，陈先生主要从User的角度来看，出测评数据给广大显卡选购者看的，和科研目的不一样。我是说的是科研的态度大致大致如此。

我总能听到有人说GPU Inside的资料很难找，有人说这话的兄台甚至做了5年以上的D3D编程。在相关领域内，其实能说出这种话的人只有两种人，一种是做CPU Architecture，另一种是写Game的。对于一个研究Graphics的人来说，是不可能说中这种话的。

实际上我们所看到的商业化的技术比起其学术领域的成果要落后很多年，无论是图形方面还是并行计算方面。图形上，目前的商业技术还主要集中在80年代的科研成果基础之上的。而并行计算方面，CUDA和Stream Processing在效率上的差距更是不可同日而语，当然，CUDA好处是比Stream processing更通用一些。但是这并不是说CUDA更有前瞻性，只能说SM4“很不负责任的”提供了一个更通用的底层硬件，CUDA仅仅是用了这个硬件而已。

跳海自殺的鱼 · 发表于 2009-5-16 19:04

11# Edison

那大大还有什么推荐的书籍吗？基础一点的最好，当然也别太基础了。。。。

跳海自殺的鱼 · 发表于 2009-5-16 19:09

12# ic.expert 如果我是管理员可真想给你加点分

ic.expert · 发表于 2009-5-16 19:13

中文方面资料很少，你可以再看看〈OpenGL超级宝典〉《实时计算机图形学〉这三本就够看一年的。

跳海自殺的鱼 · 发表于 2009-5-16 19:18

这些书像我这类初学者可以看明白吗？多看几遍也无妨

wylliang · 发表于 2009-5-16 19:50

这个有点专业了，得有个高手来为你解答。

Edison · 发表于 2009-5-16 21:38

http://www.realtimerendering.com/

跳海自殺的鱼 · 发表于 2009-5-16 21:56

我看不懂英文啊。。。。。。。。

只看该作者 · 发表于 2009-5-17 02:17

提示: 作者被禁止或删除内容自动屏蔽

帐号		自动登录	找回密码
密码			注册

Emu10k2 该用户已被删除	20^# 发表于 2009-5-17 02:17 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Emu10k2 该用户已被删除
	回复支持反对使用道具举报显身卡

一些关于构架的问题

浏览过的版块