NVIDIA Tesla GPU computing solutions for HPC will be available August, 2007.

zzhang · 发表于 2007-6-21 17:47

原帖由 Edison 于 2007-6-21 17:39 发表
G80本身就是多核心设计，128个SP可以看作是128个完整的内核。

这个和Intel的多核心GPU设计以及Cell的多核心不是一个层次上的概念吧。感觉Intel的方案里每个核心就是一个微型的G80这样的东东。

fineday · 发表于 2007-6-21 17:58

原帖由 Eji 于 2007-6-21 12:43 发表

開了也不一定可以好好利用.... 這和R600是一樣的狀況。
所以他們乾脆限制在Stream Processor產品底下才開....
G86可以開、但G84不能開的狀況可能也是G86實在太弱了不開不行。

而且可能會產生G80前後期 ...

:p 当然这是实话
不过我觉得如果MUL的问题是制造过后才发现的，那么应该还是有理由会开启的。

aibo · 发表于 2007-6-21 19:15

原帖由 fineday 于 2007-6-21 17:58 发表

:p 当然这是实话
不过我觉得如果MUL的问题是制造过后才发现的，那么应该还是有理由会开启的。

觉得最大的理由是amd的威胁，可是现在这个理由不成立。而且要是现在打开了，多少会对自己后一代的产品有些威胁。

Eji · 发表于 2007-6-21 21:42

原帖由 zzhang 于 2007-6-21 17:35 发表
不过我觉得这种方式的一个致命缺陷是功耗太高，计算能力/功耗比太差了，还是AMD和Intel那种集成多核心的方案更合适，用造CPU的方式造GPU，:p

要算算嗎？

上面G80的spec是去掉MUL的，如果不去掉mul的話，SP flops per watt則會變成2.9GFLOPS、per mm^2則是1.08GFLOPS，所以論die size效率的話雖然不見得最高，但是功耗效能比卻是最高的。
可以看到，雖然die size因為DX10對應與Unified Shader結構而大幅成長，但其實G80的TDP控制非常驚人，耗電量與性能比例是目前最佳的。
R600現在的理論數字其實與Tesla規格下的G80並沒有多少差異(都大約500GFLOPS上下)，R600有80nm帶來的per mm^2優勢(約1.14GFLOPS)，但耗電量性能比就輸掉了。

Larrabee和Fusion會因為x86多耗的電還不知道會多少，目前看來真的確實能贏G8x的，只有同是專用ISA的CELL SPE了吧。

[ 本帖最后由 Eji 于 2007-6-22 04:35 编辑 ]

Edison · 发表于 2007-6-22 10:53

We're basically just fishing to see if you'll support GPU computing equally across the entire business, not just with the big guys using Tesla. Are you going to look after everybody.Absolutely, yes, and that decision is made by business unit and how they want to invest in their customer base and their ISV base to allow that to happen and opportunities to happen.
So let me answer part of the underlying question directly. The single-precision capability for example is available across all of the CUDA-supporting product lines, and will continue to be available everywhere, and that's the model that goes forward. So take the G84 and G86, we support CUDA there too. Now there's a separate roadmap that the computing products will follow, so double precision is a feature that clearly maps into HPC and GPU computing, but we can't see much use for it in the consumer space, so it's something that'll be available with Tesla and the high-end of the Quadro product line, but below that it'll only be single precision and DP will not be on the die.

So you must be happy to split things up like that, where DP is only available on Tesla or certain Quadro and GeForce doesn't get that. You're happy with that?Yeah, that maps to our product stack and business and markets that we're in. Professional customers don't buy mid-range boards.

http://www.beyond3d.com/content/interviews/41/3

看来DP和GeForce无缘了。

不过NVIDIA并没有说这个dp是不是G92上实现的。

rongronglulu · 发表于 2007-6-22 19:32

原帖由 Eji 于 2007-6-21 12:43 发表

開了也不一定可以好好利用.... 這和R600是一樣的狀況。
所以他們乾脆限制在Stream Processor產品底下才開....
G86可以開、但G84不能開的狀況可能也是G86實在太弱了不開不行。

而且可能會產生G80前後期 ...

不是，很久以前就有人说过。那个mul只能用于通用计算，用作GPU的时候就是不行的。

clawhammer · 发表于 2007-6-22 19:38

原帖由 rongronglulu 于 2007-6-22 19:32 发表

不是，很久以前就有人说过。那个mul只能用于通用计算，用作GPU的时候就是不行的。

谁说得。。。。。只是性能提升比较小而已

XXR600 · 发表于 2007-6-23 00:06

原帖由 rongronglulu 于 2007-6-22 19:32 发表

不是，很久以前就有人说过。那个mul只能用于通用计算，用作GPU的时候就是不行的。

作GPU最少提升10%，没理论那么大罢了
C大有测试，开了mul的8500在farcry中有提升

XXR600 · 发表于 2007-6-23 00:20

原帖由 zzhang 于 2007-6-21 17:47 发表

这个和Intel的多核心GPU设计以及Cell的多核心不是一个层次上的概念吧。感觉Intel的方案里每个核心就是一个微型的G80这样的东东。

你是说Larrabee 48核心每核心还有大量ALU并行？不觉得太夸张了吗？

Eji · 发表于 2007-6-23 01:14

原帖由 XXR600 于 2007-6-23 00:20 发表
你是说Larrabee 48核心每核心还有大量ALU并行？不觉得太夸张了吗？

其實這就是過去以quad (2x2)為單位的GPU系統啊。
G80其實ALU數量和G70的時代在1quad的狀況下幾乎沒有什麼變化，Larrabee的16way Vector 對4thread其實可能也有這種感覺。
所以Larrabee的核心算法其實也有這種爭議存在，48core到底是6個4way4D的集合體，還是真的48個16way。

Eji · 发表于 2007-6-23 01:17

原帖由 rongronglulu 于 2007-6-22 19:32 发表
不是，很久以前就有人说过。那个mul只能用于通用计算，用作GPU的时候就是不行的。

應該是沒這麼明顯，從uiuc的教學文件可以看到，GPGPU很多好幾次最佳化才得到最佳值的case。
這年頭遊戲不會這樣寫了(都在爭time to market)。

所以其實如果在GPGPU底下，R600和G80應該不會真的差很多，兩邊都有很多case可以衝到幾乎理論值才對。
但是graphic最近co-issue實在是很派不上用場...._A_

XXR600 · 发表于 2007-6-23 02:31

原帖由 Eji 于 2007-6-23 01:17 发表

應該是沒這麼明顯，從uiuc的教學文件可以看到，GPGPU很多好幾次最佳化才得到最佳值的case。
這年頭遊戲不會這樣寫了(都在爭time to market)。

所以其實如果在GPGPU底下，R600和G80應該不會真的差很多，兩 ...

R600和G80双方都冲到理论值的话，G80有518GF？ R600 475GF？

Eji · 发表于 2007-6-24 16:03

理論嗎....
R600：64Shader x5 x 2(MAD) x 750MHz = 480GFLOPS
G80：128SP x 3(MAD+MUL) x 1350MHz =518.4GFLOPS (8800GTX)、88U是1.5GHz所以有576GFLOPS

帐号		自动登录	找回密码
密码			注册

NVIDIA Tesla GPU computing solutions for HPC will be available August, 2007.

浏览过的版块