POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: gaiban
打印 上一主题 下一主题

拉娜芘的行为艺术larrabee

 关闭 [复制链接]
121#
 楼主| 发表于 2008-9-7 18:34 | 只看该作者
原帖由 我奏是马甲 于 2008-9-7 00:21 发表


居然连XB360播放BD的话都说出来了……我就不和你说了。。

你到底有没有搞清楚360的HD-DVD出现的前因后果?:ermm: :ermm:

和一个根本不了解游戏机平台发展历史的人谈这个,是我的错。
可以详细说说看
回复 支持 反对

使用道具 举报

头像被屏蔽
122#
 楼主| 发表于 2008-9-7 18:35 | 只看该作者
提示: 该帖被管理员或版主屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
123#
 楼主| 发表于 2008-9-7 18:36 | 只看该作者
提示: 该帖被管理员或版主屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
124#
 楼主| 发表于 2008-9-7 18:40 | 只看该作者
提示: 该帖被管理员或版主屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
125#
发表于 2008-9-8 11:02 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

126#
 楼主| 发表于 2008-9-8 11:10 | 只看该作者
突然又想了想fiber的软切换,fiber软切换的时候的分支类指令的时钟延迟开销,可以由其他HW thread内的fiber通过SMT来隐藏掉。  或者,可能有较好的分支预测,直接就切换过去,几乎没有额外延迟。

例如
HW thread 1里有8个fiber 1/2/.../8。
HW thread 2里也有8个fiber A/B/.../H。

而代码类似如下,load为可预知会产生高延迟的指令或命令:

fiber 1为
fiber_1:
        load
        load
        load
        jmp fiber_2     //软切换到fiber2
goback1:
        ...             //计算类指令流

fiber 2类似为
fiber_2:
        load
        load
        load
        jmp fiber_3 //软切换到fiber3
goback2:       
        ...

类似...

fiber 8为
fiber_8:
        load
        load
        load
        jmp goback1  //软切换回fiber1
goback8:       
        ...


为了消除软切换的分支开销,能够跑满载:

如果fiber1执行分支切换指令需要多个延迟时钟才能进入fiber2,那么这些时钟并不会被浪费,HW thread2内的fiber可以通过SMT把它利用起来。

又有可能,分支预测可以让fiber1的分支切换指令的额外延迟为零,几乎无延迟的切到fiber2。

而由于一个HW thread内的fiber切换完全是由指令来控制的,寄存器的使用情况是完全可预知的,同一个物理寄存器也不会被多个fiber在相同的一个时钟内使用。使得一定条件下,同一个物理寄存器可以被分配到多个fiber里去,相当于物理寄存器的数量被放大了好几倍。

相对于是GPU的多线程,那就是各个线程不能分配得到同一个物理寄存器。

[ 本帖最后由 gaiban 于 2008-9-8 11:36 编辑 ]
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
127#
发表于 2008-9-8 11:27 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

128#
 楼主| 发表于 2008-9-8 11:32 | 只看该作者
还有一点,那就是双发射,很多x86指令可以与vpu指令并行执行,软件调度的好的话,其开销也被隐藏了,例如
vpu指令与x86堆栈指令可以同时发射执行,很多x86堆栈指令就可以由编译器实现前移调度,与vpu指令并行执行,其延迟就被隐藏了, 那么fiber切换的时候, 相关的x86 context开销也可以被隐藏了。
回复 支持 反对

使用道具 举报

129#
发表于 2008-9-8 11:49 | 只看该作者
原帖由 我奏是马甲 于 2008-9-7 00:21 发表

居然连XB360播放BD的话都说出来了……我就不和你说了。。
你到底有没有搞清楚360的HD-DVD出现的前因后果?:ermm: :ermm:
和一个根本不了解游戏机平台发展历史的人谈这个,是我的错。


阁下倒是说说看前因后果?
这里在谈主机的机能与硬件设计的选择,阁下就是想扯到BD和HDDVD的争端上?
回复 支持 反对

使用道具 举报

头像被屏蔽
130#
发表于 2008-9-8 11:58 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

xywarii 该用户已被删除
131#
发表于 2008-9-8 12:42 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
132#
发表于 2008-9-8 14:17 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

133#
 楼主| 发表于 2008-9-8 15:31 | 只看该作者
原帖由 RacingPHT 于 2008-9-8 14:17 发表
如果Larrabee只有5 stage,那么再配合上4-way SMT,是不是根本就不需要branch predictor了?
还是有branch predict吧?
intel:
Short in-order pipeline

– Cheap mispredicted branches and cache misses


其实后一句挺吓人的--cache misses的处理,没有排除重新刷新流水线的方式。
回复 支持 反对

使用道具 举报

134#
发表于 2008-9-8 15:41 | 只看该作者
它还是有静态分支预测的亚。
回复 支持 反对

使用道具 举报

135#
 楼主| 发表于 2008-9-8 15:54 | 只看该作者
恩,细想想,你说的对,也有可能是没有branch predictor,都是假定分支的方向是固定的或用hint指示。 如果执行中是和默认方向相反,就称为"mispredicted branch"。
回复 支持 反对

使用道具 举报

136#
 楼主| 发表于 2008-9-8 17:03 | 只看该作者
楼上说的道理,更有说服力。
回复 支持 反对

使用道具 举报

137#
发表于 2009-2-12 08:20 | 只看该作者
看上去挺美好
回复 支持 反对

使用道具 举报

138#
发表于 2009-2-24 00:12 | 只看该作者
拖拖拖,等到ATI的9800上市才出么?
回复 支持 反对

使用道具 举报

139#
发表于 2009-2-24 00:29 | 只看该作者
真是好帖,不知道拉瑞比何时可以上市呢?
回复 支持 反对

使用道具 举报

140#
发表于 2009-5-23 23:35 | 只看该作者
看上去不错
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-4-18 17:58

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表