POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Edison
打印 上一主题 下一主题

英特尔 Larrabee 体系架构讨论主题

[复制链接]
381#
 楼主| 发表于 2009-11-18 20:33 | 只看该作者
单精度 1TFLOPS 出头...似乎也都不怎么样,因为是超频的。

http://www.hpcwire.com/home/spec ... -Life-70347992.html

Apparently though, Intel thinks they can do an end-around the PCI bus and have the CPU and Larrabee talk directly through a "shared virtual memory" to allow for seamless data sharing.

There's no evidence that Intel has built such a system, but Rattner did apparently have a Larrabee chip on hand to put it through its paces. Running SGEMM, a general matrix multiply subroutine in the Basic Linear Algebra Subprograms (BLAS) library, Larrabee delivered about 800 gigaflops, and just over 1 teraflop when they overclocked it. Keep in mind though, SGEMM is the single precession floating point version of the general matrix multiplication routine. A more modest 8 gigaflops was delivered by Larrabee on a couple of sparse matrix codes (QCD and FEM_CANT).
回复 支持 反对

使用道具 举报

382#
 楼主| 发表于 2009-11-18 21:22 | 只看该作者
http://www.theregister.co.uk/200 ... _keynote/page2.html

Sparse matrix math is what is commonly needed in simulations involving cloth and water. And on that test, a Larrabee chip that was not overclocked was able to do between 7.9 and 8.1 gigaflops, depending on the test and the size of the matrices.
回复 支持 反对

使用道具 举报

383#
发表于 2009-11-19 07:36 | 只看该作者
本帖最后由 bessel 于 2009-11-19 07:54 编辑

老大你的typo.



不过1T的单精度也不错了,fermi不也是这个能力么?
bsn的说法
2Q 2010: C2050 3GB  - $2499 - 1040 GFLOPS / 520 GFLOPS DP
3Q 2010:
C2070 6GB  - $3999 - 1260 GFLOPS / 630 GFLOPS DP
回复 支持 反对

使用道具 举报

384#
发表于 2009-11-19 07:53 | 只看该作者
这个对比sc07的文章,相当于2颗cell 的能力略强,
似乎说明这块larrabee的内存/显存带宽很不大够。
http://www.theregister.co.uk/2009/11/17/sc09_rattner_keynote/page2.html

Sparse matrix math is what is commonly needed in simulations involving cloth and water. And on that test, a Larrabee chip tha ...
Edison 发表于 2009-11-18 21:22
回复 支持 反对

使用道具 举报

385#
 楼主| 发表于 2009-11-19 14:15 | 只看该作者
如果它这里说的是 SPMV ,这个成绩的确不怎么样,要知道它的 cache 相对 GT200 来说也是很大呀。

http://domino.watson.ibm.com/library/CyberDig.nsf/papers/1D32F6D23B99F7898525752200618339/$File/rc24704.pdf

1TFLOPS,如果按照 70% 的效率计算大概频率在 1.42GHz 的水平,如果考虑到它这里要完成 triangle setup、ROP 等计算,那这样的性能实在让人担心,当然如果作为 CPU 卖还是不错的:)
回复 支持 反对

使用道具 举报

386#
发表于 2009-11-19 20:00 | 只看该作者
不能全指着cache,这里cache更主要的还是消除延时,那几个benchmark基本上正比于内存带宽。
大概一个flop要4到8个byte。成绩很奇怪的不够高,或许只是样品的原因

如果它这里说的是 SPMV ,这个成绩的确不怎么样,要知道它的 cache 相对 GT200 来说也是很大呀。
http://domino.watson.ibm.com/library/CyberDig.nsf/papers/1D32F6D23B99F7898525752200618339/$File/rc24704.pd ...
Edison 发表于 2009-11-19 14:15
回复 支持 反对

使用道具 举报

387#
发表于 2009-11-20 21:37 | 只看该作者
老大你的typo.



不过1T的单精度也不错了,fermi不也是这个能力么?
bsn的说法
2Q 2010: C2050 3GB  - $2499 - 1040 GFLOPS / 520 GFLOPS DP
3Q 2010: C2070 6GB  - $3999 - 1260 GFLOPS / 630 GFLOPS  ...
bessel 发表于 2009-11-19 07:36

Fermi的SP恐怕不止1TB,但是貌似就现在的数据来看,能用在HPC上的,DP性能也就650多的样子
回复 支持 反对

使用道具 举报

388#
 楼主| 发表于 2009-12-5 14:40 | 只看该作者
RWT DK 的新作:

Larrabee 1 Defers Graphics, Bins Rendering

http://realworldtech.com/page.cfm?ArticleID=RWT120409180449

软件渲染在目前来看是行不通呀。
回复 支持 反对

使用道具 举报

389#
发表于 2009-12-5 22:52 | 只看该作者
完蛋了,larrabee不会出现在消费市场了。白激动了半天,靠。
回复 支持 反对

使用道具 举报

390#
发表于 2009-12-6 08:43 | 只看该作者
搞什么  这就砍了?
回复 支持 反对

使用道具 举报

391#
发表于 2009-12-6 10:09 | 只看该作者
本帖最后由 lik 于 2009-12-6 13:17 编辑

我早就说了(http://we.pcinlife.com/redirect. ... 979310&pid=22675179)
,LRB如果不能赢得一个console deal比如PS4, 下一代的Wii或者xbox的话,基本上作为GPU就是死定了。所以这个消息我觉得不奇怪.

RWT的文章里面里面提到"The graphics drivers and software stack is likely to be the limitingfactor that lead to the cancellation of Larrabee 1 graphics products." 这个我很同意。 前面我发的一个帖子也认为"走software rendering的道路对software要求太高, Intel没有这个能力.".

另外这次杀掉的只是LRB GPU, Intel还会继续推动LRB在高性能计算领域的应用.
回复 支持 反对

使用道具 举报

392#
发表于 2010-1-7 12:02 | 只看该作者
我看没什么前途
回复 支持 反对

使用道具 举报

393#
发表于 2010-2-11 14:18 | 只看该作者
性能会强大过独立显卡么?
回复 支持 反对

使用道具 举报

394#
发表于 2010-3-11 13:10 | 只看该作者
L2怎么会没有必要呢?二级缓存在保障稳定性方面的功能不言而喻,对于专业制作而言,连稳定都保障不了,再快也没有用的。
回复 支持 反对

使用道具 举报

395#
 楼主| 发表于 2010-3-11 17:50 | 只看该作者
L2 cache 是作为 tile buffer 使用,和稳定性(stability)没有直接的关系。
回复 支持 反对

使用道具 举报

396#
发表于 2010-4-24 08:10 | 只看该作者
不错   这个技术讲解  能多了解INTEL CPU
回复 支持 反对

使用道具 举报

397#
发表于 2010-5-6 12:03 | 只看该作者
有必要弄个L3么?
回复 支持 反对

使用道具 举报

398#
 楼主| 发表于 2010-5-6 12:33 | 只看该作者
有必要弄个L3么?
dongbo218 发表于 2010-5-6 12:03


on-chip cache L2 足够了, L3 交给显存。
回复 支持 反对

使用道具 举报

399#
发表于 2010-5-31 21:25 | 只看该作者

Knights Ferry: larrabee复活

本帖最后由 bessel 于 2010-6-1 05:04 编辑

32核心,1.2G @ 32nm
大约50核心,22nm。
from ISC 2010

这里有演讲的 slide下载:
http://www.intel.com/pressroom/archive/releases/20100531comp.htm

Larrabee不做显卡还是很有前途的,平均售价200$的东西还是留给 n/a做去吧。
回复 支持 反对

使用道具 举报

400#
发表于 2010-5-31 21:50 | 只看该作者
这就是intel准备用来干Tesla 的大杀器?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-7-29 02:50

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表