POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Edison
打印 上一主题 下一主题

英特尔 Larrabee 体系架构讨论主题

[复制链接]
RacingPHT 该用户已被删除
101#
发表于 2008-4-23 20:51 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

102#
发表于 2008-4-25 14:03 | 只看该作者
原帖由 complexmind 于 2008-4-22 17:32 发表
:)
小弟看了回答又想到两个问题:
1。现在GPU的ISA和CPU的ISA在通用性上还有没有决定性的差异?
2。为什么CPU的内核里集成像GPU那么多的乘法器除法器和大量的寄存器来提升浮点运算效能呢?除了在制程和发热量及良 ...

1. 有,差异巨大。CPU处理器的指令集可以用随心所欲来形容,而GPU的指令集嘛,所谓处处掣肘就对了。不单处处掣肘而且这个ISA还不停的变,还属于东打一个补丁,西打一个补丁来满足DX升级的要求的阶段。
2. 因为通用程序本质上就有ILP上面的限制,处理器没有办法做得很宽。而GPU,你可以看作是一个多核心的处理器,但是每个核心的处理能力都弱智到了和ALU没什么区别。Larrabee的目的就是使用最简单的,但是支持完整X86 ISA的小核心取代GPU中的核心,一劳永逸的解决编程性问题。Larrabee一出,就再也没有这个GPU支不支持DX几的说法,支不支持完全是驱动程序的事情。
回复 支持 反对

使用道具 举报

103#
发表于 2008-4-25 14:06 | 只看该作者
原帖由 RacingPHT 于 2008-4-23 20:51 发表


通用性能大体是如何计算的呢?
目前也没有一个标准的benchmark。我觉得如果能跑Spec, 才比较有说服力.

呵呵,Larrabee跑Spec当然没有任何问题,spec无需修改就能运行于Larrabee。不过NV/ATI,嘿嘿,慢慢来吧。至于性能,Edison老大的话,你就暂时当没听见吧。
回复 支持 反对

使用道具 举报

104#
发表于 2008-4-26 14:47 | 只看该作者
谢谢P大的回答,小弟从中获益匪浅,谢谢!:loveliness: :loveliness:
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
105#
发表于 2008-4-28 12:05 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

106#
发表于 2008-4-28 12:10 | 只看该作者
原帖由 Prescott 于 2008-4-25 14:03 发表

Larrabee一出,就再也没有这个GPU支不支持DX几的说法,支不支持完全是驱动程序的事情


这个就太夸张,虽然理论上可以这么去做,但是要让x86把支持DX的任务也承担起来的话,我真的非常怀疑其执行效率了。
如果这是真的,那么我丝毫不怀疑其1TFlops的能力就只能做到8600GTS的表现了。
回复 支持 反对

使用道具 举报

107#
发表于 2008-4-28 12:17 | 只看该作者
奔腾就支持DX11

何必等larrabee
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
108#
发表于 2008-4-28 13:04 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

109#
发表于 2008-4-28 15:51 | 只看该作者
原帖由 RacingPHT 于 2008-4-28 12:05 发表

另外我想你说的意思大概是用x86的mini vector core来替换fixed function unit?但是我想Larrabee一定还会有fixed function units吧? 除了texture filter/fetch unit之外,是不是还会有rasterize相关的unit呢?

我很感兴趣的是, Larrabee的设计思想究竟是optimize x86 for Raterize, 还是直接加入fixed function units, x86只是作为shader power用。

另外我觉得Larrabee似乎是x3100的co-processor思路的延伸化。我看intel的文档的介绍, x3100也是采用了比较通用的计算单元作为协处理器。只不过Larrabee直接变为x86了。不知道我的猜测合理否。

这张图大概可以回答你的大部分问题吧

其实x86只不过用来保证软件兼容性,shader power几乎全部来自于vector unit,目前为止,GMA和Larrabee的关系仅限于Larrabee使用了GMA系列的一些部件。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

110#
发表于 2008-4-28 16:01 | 只看该作者
原帖由 jhj9 于 2008-4-28 12:10 发表


这个就太夸张,虽然理论上可以这么去做,但是要让x86把支持DX的任务也承担起来的话,我真的非常怀疑其执行效率了。
如果这是真的,那么我丝毫不怀疑其1TFlops的能力就只能做到8600GTS的表现了。

最好NV也象你这么想,不过看NV这几天抓狂的样子,似乎他们没有你这么乐观啊。
所谓支持DX的任务,大概你自己也说不清楚是什么任务吧 :lol:

[ 本帖最后由 Prescott 于 2008-4-28 16:14 编辑 ]
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
111#
发表于 2008-4-28 16:09 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

112#
发表于 2008-4-28 16:14 | 只看该作者
原帖由 来不及思考 于 2008-4-28 16:09 发表


Intel曾经在某个文档里宣称,larrabee有一个很很有意思的编译器,功能也很强大,老P贴些简介看看 :huh:

shader compiler? 这个大家都有吧。
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
113#
发表于 2008-4-28 16:19 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

114#
发表于 2008-4-28 16:58 | 只看该作者
原帖由 来不及思考 于 2008-4-28 16:19 发表
OK,换一种问法

现在公开的larrabee资料,INTEL官方的

有没有?

老P给个URL o:)

没有。
回复 支持 反对

使用道具 举报

115#
发表于 2008-4-28 17:08 | 只看该作者
原帖由 Prescott 于 2008-4-28 16:01 发表

最好NV也象你这么想,不过看NV这几天抓狂的样子,似乎他们没有你这么乐观啊。
所谓支持DX的任务,大概你自己也说不清楚是什么任务吧 :lol:


现在按你的说法,似乎TMU和ROP的运算也要占用这些X86资源来完成了?
支持DX的任务,也就是对一些API的支持,但是这些支持也是需要相应的硬件支持为基础的。
比如ROP,它决定了AA、AF等特效的效率和方式,如果ROP是使用专门的硬件来做,而非x86来做,是否会导致以后DX规范中制定的AA新需求(比如采样点位置指定,跨点采样支持等等)无法支持,从而导致整个核心无法支持未来DX?
新的DX版本牵扯的细节可能会很多,任何一个在设计上是非可编程的部件都可能会导致支持新DX版本的失败,但是把Setup、TMU、ROP都做成可编程的,并且占用Larrabee的x86核心来处理,是否性能还能保证?用于Shader的x86资源又还剩多少?

更新:从你的图上看,除了TMU外其他的确实是都可编程了。那么岂不是相当于把Reference Raster针对特殊的x86多核协处理器去跑?如果Larrabee只有1TFlops的能力,那么用于Shader的运算资源成问题啊,现在光是Shader有1TFlops的显卡都快出来了。

[ 本帖最后由 jhj9 于 2008-4-28 17:15 编辑 ]
回复 支持 反对

使用道具 举报

116#
 楼主| 发表于 2008-4-28 17:25 | 只看该作者
G965的setup已经是EU来完成的。

Larrabee的texture sampler是基于专门的硬件,而不是那个IA++的内核来做。
回复 支持 反对

使用道具 举报

117#
发表于 2008-4-28 19:10 | 只看该作者
原帖由 jhj9 于 2008-4-28 17:08 发表
更新:从你的图上看,除了TMU外其他的确实是都可编程了。那么岂不是相当于把ReferenceRaster针对特殊的x86多核协处理器去跑?如果Larrabee只有1TFlops的能力,那么用于Shader的运算资源成问题啊,现在光是Shader有1TFlops的显卡都快出来了。

R600 475 GFLOPS
G80 518.4 GFLOPS
如果按照ATI/NV的算法,Larrabee肯定不是1T。
回复 支持 反对

使用道具 举报

118#
发表于 2008-4-29 11:47 | 只看该作者
原帖由 Prescott 于 2008-4-28 19:10 发表

R600 475 GFLOPS
G80 518.4 GFLOPS
如果按照ATI/NV的算法,Larrabee肯定不是1T。


G80没那么高,因为没有Dual-Issue,所以是384GFlops
Labrrabee总运算能力按照当初公布的规格来看,是1T多一点,这是其24核的全部运算能力,现在来看,因为不可能全部用于Shader运算,所以应该不到1T了。
回复 支持 反对

使用道具 举报

119#
发表于 2008-4-29 12:40 | 只看该作者
原帖由 jhj9 于 2008-4-29 11:47 发表


G80没那么高,因为没有Dual-Issue,所以是384GFlops
Labrrabee总运算能力按照当初公布的规格来看,是1T多一点,这是其24核的全部运算能力,现在来看,因为不可能全部用于Shader运算,所以应该不到1T了。

Larrabee到底是什么规格,好像应该是我告诉你吧,你在这里教育我好像有点滑稽啊。:unsure:
按照ATI/NV的算法,Larrabee-1是2T。

[ 本帖最后由 Prescott 于 2008-4-29 12:44 编辑 ]
回复 支持 反对

使用道具 举报

120#
发表于 2008-4-29 13:13 | 只看该作者
原帖由 Prescott 于 2008-4-29 12:40 发表

Larrabee到底是什么规格,好像应该是我告诉你吧,你在这里教育我好像有点滑稽啊。:unsure:
按照ATI/NV的算法,Larrabee-1是2T。


P大~~~intel未来会不会搞出类似松散CELL的超级系统来~~~就是让几块LARRABEE PCI-E卡充当分别充当SPE的角色~~~而CPU充当PPE的角色~~~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-7-28 13:15

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表