原帖由 <i>slice</i> 于 2007-10-5 09:51 PM 发表 <a href="http://we.pcinlife.com/redirect.php?goto=findpost&pid=15497221&ptid=828668" target="_blank"><img src="http://we.pcinlife.com/images/common/back.gif" border="0" onload="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new windownCTRL+Mouse wheel to zoom in/out';}" onmouseover="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new windownCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open('http://we.pcinlife.com/images/common/back.gif');}" onmousewheel="return imgzoom(this);" alt="" /></a><br />
<img src="images/smilies/loveliness.gif" smilieid="60" border="0" alt="" /> <br />
我是个外行,说错了大家不要笑我。<br />
由于较强的通用性容易得到软件的良好支持支持,3DMAX或 maya等等最后渲染是不是也可以获益匪浅。目前这些还是靠CPU,啥专业显卡一点帮助也没有。<br />
Larrabee针 ...
原帖由 slice 于 2007-10-5 21:51 发表
:loveliness:
我是个外行,说错了大家不要笑我。
由于较强的通用性容易得到软件的良好支持支持,3DMAX或 maya等等最后渲染是不是也可以获益匪浅。目前这些还是靠CPU,啥专业显卡一点帮助也没有。
Larrabee针 ...
原帖由 RacingPHT 于 2007-10-6 18:35 发表
1: x86
SSE指令系统其实和X86没有什么关系, 所以不会出现x86拖累系统性能的问题。而x86的历史积累, 不是其他指令集可以替代的。
2: 512(1024)bit SIMD
这个可能有潜在的问题, 由于目前的系统都是基于SIMD128 ...
原帖由 RacingPHT 于 2007-10-6 22:32 发表
其实我觉得这东西和CELL的思想没什么相似性。
类比的话, 我觉得CELL是把一堆SPE打包在一起, 用一个PPE来协调, 而Intel就是把直接一堆加强版PPE包一块了。(和XBOX360的想法蛮像的)
原帖由 Edison 于 2007-10-5 14:28 发表
本主题是专门为讨论Larrabee开设的,因此要求相关的讨论以技术为主。
1、Intel的Doug Carmean为Larrabee的首席架构师
原帖由 HeavenPR 于 2007-10-6 19:24 发表
128-bit SIMD 的代码再来一个 4-SMT 不就成了 512-bit SIMD 了么?指令动态打包吧,Intel 肯定比 ATI 玩的好的多了
原帖由 RacingPHT 于 2007-10-6 22:37 发表
官方的Ct Pdf, 不过我觉得没几个人会认真看就是了
http://www.intel.com/research/pl ... cale_whitepaper.pdf
(看了一下pdf, 不少是华人在做的这个东东, 可惜不是primary author)
128 registers似乎不是x86的风格...我很怀疑...不过Intel在IA64也这么做过, 所以可以拭目以待.
总之几乎全是一样的
x86 vs PPC
512bit SIMD vs VMX128
2 threads vs 4 threads
双方的单线程通用指令性能都很烂(~1/3于该指令集的最高水准)
两边的基础指令集都不怎么样
所以根据这个惯性推论的是, 同样的Peak的前提下, Larrabee的实际性能不如SPE
[quote]128 registers似乎不是x86的风格...我很怀疑...不过Intel在IA64也这么做过, 所以可以拭目以待.
总之几乎全是一样的
x86 vs PPC
512bit SIMD vs VMX128
2 threads vs 4 threads
双方的单线程通用指令性能都很烂(~1/3于该指令集的最高水准)
两边的基础指令集都不怎么样
所以根据这个惯性推论的是, 同样的Peak的前提下, Larrabee的实际性能不如SPE
原帖由 紫色 于 2007-10-7 13:08 发表
在这种异构的处理器上进行编程很困难,编译器自动优化是不可能完成的任务,所以larrabee的“理论”能力只是个画饼。还不如增加核心数目,增加执行单元,减少指令吞吐量延迟来的实际。
原帖由 紫色 于 2007-10-7 16:56 发表
[quote]原帖由 RacingPHT 于 2007-10-7 16:38 发表
拜托看懂我的意思。我少写了几句,你就晕了?还来个“核心数目增加了”,“执行单元增加了”反驳我~~
这 ...
原帖由 紫色 于 2007-10-7 17:38 发表
是的,目前几乎所有的多路系统都支持mpi,但是他们都是同构的。
mpi的实现与程序员的编程模式是两码事。程序员的角度,其实也就是进程模型的角度,要么是mpi那样进程间通信,或者openmp的多线程,都是基于“ ...
原帖由 potomac 于 2007-10-7 23:04 发表
偶还是不大相信。
Cell不过两线程,也能填饱8个SPE。:sweatingbullets:
弄4线程出来,岂不是执行效率比2005年的SPE都不如。:ermm:
原帖由 1empress 于 2007-10-7 20:06 发表
larrabee只是一颗实验性的东西,目的是验证x86做图形处理的可行性
larrabee的最终产品可以做大也可以做小
做小的话,可以与与网络处理器结合为强大的移动设备
干掉arm 占领移动市场才是intel的目的
原帖由 Prescott 于 2007-10-8 18:09 发表
无聊,看了看RacingPHT的http://we.pcinlife.com/viewthread.php?tid=606808&extra=page%3D1%26amp%3Bfilter%3Dtype%26amp%3Btypeid%3D62
貌似Larrabee比较适合Kyro或者PowerVR模式啊,各位有什么意见啊?
原帖由 Eji 于 2008-4-9 10:15 发表
sparse voxel octree有個好處是,他可以用來把"需要ray tracer的區域分出來,也就是利用區域性。
實際上沒有複雜光源反射的話,ray tracer和Rasterizer相比並沒有優勢....
另外一點是,為了滿足大規模的亂數行為所 ...
原帖由 Edison 于 2008-4-9 01:08 发表
我这里收到最新的消息,Larrabee的45nm版发热相当高,根据第三方厂商的测试,其通用性能也比对手的下一代65nm GPU产品低不少。
原帖由 complexmind 于 2008-4-19 11:29 发表
感觉Intel希望把高性能计算(典型代表:科学计算)和工业计算(典型代表:流计算)结合起来,而鼓捣出了Larrabee,所以用很多的含通用计算成分的核心做出了Larrabee,由于P大所说的通用核心和定制核心的特点,所以显得累赘了些,不过我有一些不明白:
1.既然强调通用性,为什么用顺序结构?超标量和乱序执行为什么不加入?如果是为了控制晶体管的规模,那么这么做是不是暗示着其实现在大一统通用计算结构完全占领机箱还需要材料学,物理学的理论突破来支撑,而现在的制程技术无法支撑真正的万能通用核心进入工业计算领域而实现统一?
2.观察GPU,一些DSP,是不是一般的定制核心都优先考虑顺序结构,如果是,那么可不可以理解为顺序计算是非通用计算的特征之一呢?
3.多线程技术能在多大程度上取代乱序执行和超标量的作用?
4.最后,是不是顺序计算结构在某种程度上相对乱序结构有天生缺陷?
原帖由 RacingPHT 于 2007-11-24 17:50 发表
Kyro或者PowerVR的模式?
那么首先看看这个模式的特点是什么
1: 在fill-rate上的bandwith需求很低, 因为很多东西做到on-chip
2: pixel throuphput很低, 主要用高效率来补偿
3: geometry的处理能力很低, 因为每个t ...
欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |