英特尔 Larrabee 体系架构讨论主题

只看该作者 · 发表于 2008-4-23 20:51

提示: 作者被禁止或删除内容自动屏蔽

Prescott · 发表于 2008-4-25 14:03

原帖由 complexmind 于 2008-4-22 17:32 发表
:)
小弟看了回答又想到两个问题：
1。现在GPU的ISA和CPU的ISA在通用性上还有没有决定性的差异？
2。为什么CPU的内核里集成像GPU那么多的乘法器除法器和大量的寄存器来提升浮点运算效能呢？除了在制程和发热量及良 ...

1. 有，差异巨大。CPU处理器的指令集可以用随心所欲来形容，而GPU的指令集嘛，所谓处处掣肘就对了。不单处处掣肘而且这个ISA还不停的变，还属于东打一个补丁，西打一个补丁来满足DX升级的要求的阶段。
2. 因为通用程序本质上就有ILP上面的限制，处理器没有办法做得很宽。而GPU，你可以看作是一个多核心的处理器，但是每个核心的处理能力都弱智到了和ALU没什么区别。Larrabee的目的就是使用最简单的，但是支持完整X86 ISA的小核心取代GPU中的核心，一劳永逸的解决编程性问题。Larrabee一出，就再也没有这个GPU支不支持DX几的说法，支不支持完全是驱动程序的事情。

Prescott · 发表于 2008-4-25 14:06

原帖由 RacingPHT 于 2008-4-23 20:51 发表

通用性能大体是如何计算的呢？
目前也没有一个标准的benchmark。我觉得如果能跑Spec, 才比较有说服力.

呵呵，Larrabee跑Spec当然没有任何问题，spec无需修改就能运行于Larrabee。不过NV/ATI，嘿嘿，慢慢来吧。至于性能，Edison老大的话，你就暂时当没听见吧。

complexmind · 发表于 2008-4-26 14:47

谢谢P大的回答，小弟从中获益匪浅，谢谢！:loveliness: :loveliness:

只看该作者 · 发表于 2008-4-28 12:05

提示: 作者被禁止或删除内容自动屏蔽

jhj9 · 发表于 2008-4-28 12:10

原帖由 Prescott 于 2008-4-25 14:03 发表

Larrabee一出，就再也没有这个GPU支不支持DX几的说法，支不支持完全是驱动程序的事情

这个就太夸张，虽然理论上可以这么去做，但是要让x86把支持DX的任务也承担起来的话，我真的非常怀疑其执行效率了。
如果这是真的，那么我丝毫不怀疑其1TFlops的能力就只能做到8600GTS的表现了。

Asuka · 发表于 2008-4-28 12:17

奔腾就支持DX11

何必等larrabee

只看该作者 · 发表于 2008-4-28 13:04

提示: 作者被禁止或删除内容自动屏蔽

Prescott · 发表于 2008-4-28 15:51

原帖由 RacingPHT 于 2008-4-28 12:05 发表

另外我想你说的意思大概是用x86的mini vector core来替换fixed function unit?但是我想Larrabee一定还会有fixed function units吧? 除了texture filter/fetch unit之外,是不是还会有rasterize相关的unit呢？

我很感兴趣的是, Larrabee的设计思想究竟是optimize x86 for Raterize, 还是直接加入fixed function units, x86只是作为shader power用。

另外我觉得Larrabee似乎是x3100的co-processor思路的延伸化。我看intel的文档的介绍, x3100也是采用了比较通用的计算单元作为协处理器。只不过Larrabee直接变为x86了。不知道我的猜测合理否。

这张图大概可以回答你的大部分问题吧

其实x86只不过用来保证软件兼容性，shader power几乎全部来自于vector unit，目前为止，GMA和Larrabee的关系仅限于Larrabee使用了GMA系列的一些部件。

Prescott · 发表于 2008-4-28 16:01

原帖由 jhj9 于 2008-4-28 12:10 发表

这个就太夸张，虽然理论上可以这么去做，但是要让x86把支持DX的任务也承担起来的话，我真的非常怀疑其执行效率了。
如果这是真的，那么我丝毫不怀疑其1TFlops的能力就只能做到8600GTS的表现了。

最好NV也象你这么想，不过看NV这几天抓狂的样子，似乎他们没有你这么乐观啊。
所谓支持DX的任务，大概你自己也说不清楚是什么任务吧 :lol:

[ 本帖最后由 Prescott 于 2008-4-28 16:14 编辑 ]

只看该作者 · 发表于 2008-4-28 16:09

提示: 作者被禁止或删除内容自动屏蔽

Prescott · 发表于 2008-4-28 16:14

原帖由 来不及思考 于 2008-4-28 16:09 发表

Intel曾经在某个文档里宣称，larrabee有一个很很有意思的编译器，功能也很强大，老P贴些简介看看 :huh:

shader compiler? 这个大家都有吧。

只看该作者 · 发表于 2008-4-28 16:19

提示: 作者被禁止或删除内容自动屏蔽

Prescott · 发表于 2008-4-28 16:58

原帖由 来不及思考 于 2008-4-28 16:19 发表
OK，换一种问法

现在公开的larrabee资料，INTEL官方的

有没有？

老P给个URL o:)

没有。

jhj9 · 发表于 2008-4-28 17:08

原帖由 Prescott 于 2008-4-28 16:01 发表

最好NV也象你这么想，不过看NV这几天抓狂的样子，似乎他们没有你这么乐观啊。
所谓支持DX的任务，大概你自己也说不清楚是什么任务吧 :lol:

现在按你的说法，似乎TMU和ROP的运算也要占用这些X86资源来完成了？
支持DX的任务，也就是对一些API的支持，但是这些支持也是需要相应的硬件支持为基础的。
比如ROP，它决定了AA、AF等特效的效率和方式，如果ROP是使用专门的硬件来做，而非x86来做，是否会导致以后DX规范中制定的AA新需求（比如采样点位置指定，跨点采样支持等等）无法支持，从而导致整个核心无法支持未来DX？
新的DX版本牵扯的细节可能会很多，任何一个在设计上是非可编程的部件都可能会导致支持新DX版本的失败，但是把Setup、TMU、ROP都做成可编程的，并且占用Larrabee的x86核心来处理，是否性能还能保证？用于Shader的x86资源又还剩多少？

更新：从你的图上看，除了TMU外其他的确实是都可编程了。那么岂不是相当于把Reference Raster针对特殊的x86多核协处理器去跑？如果Larrabee只有1TFlops的能力，那么用于Shader的运算资源成问题啊，现在光是Shader有1TFlops的显卡都快出来了。

[ 本帖最后由 jhj9 于 2008-4-28 17:15 编辑 ]

Edison · 发表于 2008-4-28 17:25

G965的setup已经是EU来完成的。

Larrabee的texture sampler是基于专门的硬件，而不是那个IA++的内核来做。

Prescott · 发表于 2008-4-28 19:10

原帖由 jhj9 于 2008-4-28 17:08 发表
更新：从你的图上看，除了TMU外其他的确实是都可编程了。那么岂不是相当于把ReferenceRaster针对特殊的x86多核协处理器去跑？如果Larrabee只有1TFlops的能力，那么用于Shader的运算资源成问题啊，现在光是Shader有1TFlops的显卡都快出来了。

R600 475 GFLOPS
G80 518.4 GFLOPS
如果按照ATI/NV的算法，Larrabee肯定不是1T。

jhj9 · 发表于 2008-4-29 11:47

原帖由 Prescott 于 2008-4-28 19:10 发表

R600 475 GFLOPS
G80 518.4 GFLOPS
如果按照ATI/NV的算法，Larrabee肯定不是1T。

G80没那么高，因为没有Dual-Issue，所以是384GFlops
Labrrabee总运算能力按照当初公布的规格来看，是1T多一点，这是其24核的全部运算能力，现在来看，因为不可能全部用于Shader运算，所以应该不到1T了。

Prescott · 发表于 2008-4-29 12:40

原帖由 jhj9 于 2008-4-29 11:47 发表

G80没那么高，因为没有Dual-Issue，所以是384GFlops
Labrrabee总运算能力按照当初公布的规格来看，是1T多一点，这是其24核的全部运算能力，现在来看，因为不可能全部用于Shader运算，所以应该不到1T了。

Larrabee到底是什么规格，好像应该是我告诉你吧，你在这里教育我好像有点滑稽啊。:unsure:
按照ATI/NV的算法，Larrabee-1是2T。

[ 本帖最后由 Prescott 于 2008-4-29 12:44 编辑 ]

jump_sun · 发表于 2008-4-29 13:13

原帖由 Prescott 于 2008-4-29 12:40 发表

Larrabee到底是什么规格，好像应该是我告诉你吧，你在这里教育我好像有点滑稽啊。:unsure:
按照ATI/NV的算法，Larrabee-1是2T。

P大~~~intel未来会不会搞出类似松散CELL的超级系统来~~~就是让几块LARRABEE PCI-E卡充当分别充当SPE的角色~~~而CPU充当PPE的角色~~~

帐号		自动登录	找回密码
密码			注册

RacingPHT 该用户已被删除	101^# 发表于 2008-4-23 20:51 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡

RacingPHT 该用户已被删除	105^# 发表于 2008-4-28 12:05 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡

RacingPHT 该用户已被删除	108^# 发表于 2008-4-28 13:04 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
RacingPHT 该用户已被删除
	回复支持反对使用道具举报显身卡

来不及思考该用户已被删除	111^# 发表于 2008-4-28 16:09 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡

英特尔 Larrabee 体系架构讨论主题

本帖子中包含更多资源

浏览过的版块

来不及思考该用户已被删除	113^# 发表于 2008-4-28 16:19 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
来不及思考该用户已被删除
	回复支持反对使用道具举报显身卡