POPPUR爱换

标题: NVIDIA 官方确认:Kepler (2?) 是拥有 70 亿晶体管的怪兽 [打印本页]

作者: Edison    时间: 2012-4-20 12:22
标题: NVIDIA 官方确认:Kepler (2?) 是拥有 70 亿晶体管的怪兽
S0642 - Inside Kepler
Stephen Jones ( CUDA Developer, NVIDIA )
Lars Nyland ( Senior Architect, NVIDIA )

In this talk, individuals from the GPU architecture and CUDA software groups will dive into the features of the compute architecture for “Kepler” – NVIDIA’s new 7-billion transistor GPU. From the reorganized processing cores with new instructions and processing capabilities, to an improved memory system with faster atomic processing and low-overhead ECC, we will explore how the Kepler GPU achieves world leading performance and efficiency, and how it enables wholly new types of parallel problems to be solved.

Topic Areas: Parallel Programming Languages & Compilers
Session Level: Beginner


作者: 久泉苍月    时间: 2012-4-20 12:24
GK110?.双倍GK104?
作者: Elwin    时间: 2012-4-20 12:24
30-70,还行。要到90才是怪兽
作者: disruptor    时间: 2012-4-20 12:25
v587
作者: BDFMK2    时间: 2012-4-20 12:25
期待新的井盖
作者: jeff_999    时间: 2012-4-20 12:32
680是35亿?
果断翻倍?性能翻倍?
那个谁。。。不是死翘翘了
作者: asdfjkl    时间: 2012-4-20 12:33
8970敌得过gk110么? 或者是9970呢?
作者: 天下第一    时间: 2012-4-20 12:33
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2012-4-20 12:35
S0641 - CUDA 5 and Beyond
Mark Harris ( Chief Technologist, GPU Computing, NVIDIA )

CUDA, NVIDIA's platform for parallel computing, has grown rapidly in the past 5 years. The performance and efficiency of software built on CUDA, combined with a thriving ecosystem of programming languages, libraries, tools, training, and service providers, have helped make GPU computing a leading HPC technology. CUDA 5 and the Kepler GPU architecture don’t just increase application performance; they enable a more powerful parallel programming model that expands the possibilities of GPU computing, and language features that improve programmer productivity. In this talk you’ll hear about these revolutionary features and get insight into the philosophy driving the development of new CUDA hardware and software. You will learn about NVIDIA's vision for CUDA and the challenges for the future of parallel software development.
作者: defencelsj    时间: 2012-4-20 12:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: vista@xp    时间: 2012-4-20 12:44
不管如何,就等实物亮相
作者: monishuzi    时间: 2012-4-20 12:44
真够狠的
作者: NORAWITHMYCALL    时间: 2012-4-20 12:45
如果以AMD的晶体管密度来说,同样单位面积下,肯定比NV更多,但是毕竟不是拼晶体管数量为取胜唯一条件,关键在晶体管的有效利用率的高低。
作者: GTX999    时间: 2012-4-20 12:46
牛逼啊哈哈哈
作者: 久泉苍月    时间: 2012-4-20 12:50
NORAWITHMYCALL 发表于 2012-4-20 12:45
如果以AMD的晶体管密度来说,同样单位面积下,肯定比NV更多,但是毕竟不是拼晶体管数量为取胜唯一条件,关键 ...

[attach]1846280[/attach]
你还有脸么?还晶体管密度。。。。。。。。

作者: 骨刺    时间: 2012-4-20 13:05
直接104翻倍啊~ 512bit显存带宽?
作者: yyzjp    时间: 2012-4-20 13:06
这个功耗多少啊? 能控制好吗28nm?
作者: 围观    时间: 2012-4-20 13:09
久泉苍月 发表于 2012-4-20 12:50
你还有脸么?还晶体管密度。。。。。。。。

pit cairn 比较虎,
tahiti确实不够看的.
作者: laoyoufen    时间: 2012-4-20 13:14
只看不买,淡定
作者: 久泉苍月    时间: 2012-4-20 13:16
严重怀疑说的就是GK104 X2。。。。。。。。。。
作者: 扫帚    时间: 2012-4-20 13:17
这次开始忽悠的真早啊...
作者: iamspy    时间: 2012-4-20 13:37
CHO,你想多了。
这货就是GK110 == GK104 X 2
再2周,采用GK110的GTX690就要发布了。
作者: caoshichun    时间: 2012-4-20 13:46
无图无真相
作者: krisman    时间: 2012-4-20 13:46
功耗的多给力啊,双8PIN?
作者: ak75    时间: 2012-4-20 13:47
670呢还不出咩

nv搞什么东西
作者: Edison    时间: 2012-4-20 13:49
iamspy 发表于 2012-4-20 13:37
CHO,你想多了。
这货就是GK110 == GK104 X 2
再2周,采用GK110的GTX690就要发布了。

GK110 是单独的芯片,不是双芯产品。

GTX 690 是 GK104*2,和 GK110 毫无关系,GK104 不支持 ECC。

GK110 主攻 Tesla,但是会有 GeForce 和 Quadro 产品。

我不会对你说更多的东西,别指望套料。
作者: loverlong    时间: 2012-4-20 14:00
Edison 发表于 2012-4-20 13:49
GK110 是单独的芯片,不是双芯产品。

GTX 690 是 GK104*2,和 GK110 毫无关系,GK104 不支持 ECC。

爆尿了。。。等110是正确的。
作者: sasasasa    时间: 2012-4-20 14:17
提示: 作者被禁止或删除 内容自动屏蔽
作者: sasasasa    时间: 2012-4-20 14:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: SnakeLee    时间: 2012-4-20 14:26
这消息实在是.....
作者: sasasasa    时间: 2012-4-20 14:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: 骨刺    时间: 2012-4-20 14:35
Edison 发表于 2012-4-20 13:49
GK110 是单独的芯片,不是双芯产品。

GTX 690 是 GK104*2,和 GK110 毫无关系,GK104 不支持 ECC。

好吧 GK104真是中端卖坑爹高端价
作者: asd04122661    时间: 2012-4-20 14:40
ms去年就有人爆gtx780在70亿到80亿之间,看来很准啊。
作者: caoshichun    时间: 2012-4-20 14:41
[attach]1846425[/attach]





作者: Windyson    时间: 2012-4-20 14:53
70亿,588mm2,
要是只搭配384bit-MC,那就可能超过3kSP了
作者: 扫帚    时间: 2012-4-20 14:54
110是怪物, 104给他提鞋都不配
作者: GTX999    时间: 2012-4-20 14:57
标题: RE: NVIDIA 官方确认:Kepler (2?) 是拥有 70 亿晶体管的怪兽
扫帚 发表于 2012-4-20 14:54
110是怪物, 104给他提鞋都不配

能耗比,面积性能比110不仅要输给104 还要输给7970
作者: 扫帚    时间: 2012-4-20 15:06
GTX999 发表于 2012-4-20 14:57
能耗比,面积性能比110不仅要输给104 还要输给7970

"耗"很好理解, 耗电量嘛
"能"你是怎么理解的? 跑分? fps? 难道hpc性能不能算作"能"?
作者: asdfjkl    时间: 2012-4-20 15:12
iamspy 发表于 2012-4-20 13:37
CHO,你想多了。
这货就是GK110 == GK104 X 2
再2周,采用GK110的GTX690就要发布了。

双芯的卡从来就没有芯片的代号。 但凡有芯片代号的,都是独立的芯片!!!


作者: sasasasa    时间: 2012-4-20 15:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: asdfjkl    时间: 2012-4-20 15:40
sasasasa 发表于 2012-4-20 14:21
不用担心。别看晶体管到70亿(我姑且相信这消息可靠)。游戏性能能提高40%不?

40%,可不少了!!! AMD一代工艺+一代架构,也才提升了40%

作者: pantherjj    时间: 2012-4-20 15:51
我只觉得放弃交火是个错误!!!!!!!
作者: 绝峰傲翔    时间: 2012-4-20 16:02
Edison 发表于 2012-4-20 13:49
GK110 是单独的芯片,不是双芯产品。

GTX 690 是 GK104*2,和 GK110 毫无关系,GK104 不支持 ECC。

GK100呢?
作者: Edison    时间: 2012-4-20 16:09
绝峰傲翔 发表于 2012-4-20 16:02
GK100呢?

从来就不存在 GK100.
作者: badchris    时间: 2012-4-20 16:13
提示: 作者被禁止或删除 内容自动屏蔽
作者: 绝峰傲翔    时间: 2012-4-20 16:14
Edison 发表于 2012-4-20 16:09
从来就不存在 GK100.

可是存在GF100啊!
作者: goodfull    时间: 2012-4-20 16:36
早呢 半年后出来!!!  通用计算首选
作者: 猥琐的民工    时间: 2012-4-20 17:00
本帖最后由 猥琐的民工 于 2012-4-20 17:00 编辑

nv一直有一个远大的理想,就是造一个巨大的单核干掉农企的双核……
其实gt200的时候他们就是这么想的……只是没能实现
作者: csqaclp    时间: 2012-4-20 18:04
本帖最后由 csqaclp 于 2012-4-20 18:11 编辑
久泉苍月 发表于 2012-4-20 12:50
你还有脸么?还晶体管密度。。。。。。。。

GTX680应该是35亿。

作者: coollab    时间: 2012-4-20 18:15
iamspy 发表于 2012-4-20 13:37
CHO,你想多了。
这货就是GK110 == GK104 X 2
再2周,采用GK110的GTX690就要发布了。

呵呵呵……

还真的有上当的
作者: GTX999    时间: 2012-4-20 18:18
标题: RE: NVIDIA 官方确认:Kepler (2?) 是拥有 70 亿晶体管的怪兽
猥琐的民工 发表于 2012-4-20 17:00
nv一直有一个远大的理想,就是造一个巨大的单核干掉农企的双核……
其实gt200的时候他们就是这么想的……只 ...

显然gk110不可能打掉双7970
作者: coollab    时间: 2012-4-20 18:19
GTX999 发表于 2012-4-20 14:57
能耗比,面积性能比110不仅要输给104 还要输给7970

继续YY,看AMD 8970怎么办
作者: westlee    时间: 2012-4-20 18:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: coollab    时间: 2012-4-20 18:51
westlee 发表于 2012-4-20 18:37
一直比较奇怪,8970到底怎么做?7870和680的差距大约有40%+。7870面积增加50%,晶体管增加50%+,考虑到效 ...

AMD第一次做类似架构,能做成这样就不错了
大概是NV在GT200上遇到的那些问题都遇到了
作者: BDFMK2    时间: 2012-4-20 18:53
本帖最后由 BDFMK2 于 2012-4-20 18:54 编辑
westlee 发表于 2012-4-20 18:37
一直比较奇怪,8970到底怎么做?7870和680的差距大约有40%+。7870面积增加50%,晶体管增加50%+,考虑到效 ...

必须得改变GCN的架构。

如G100->G104那样。减少CU组数,但增加每组CU里的SP。这样有一些好处,比如降低ACE的负载,使得每组CU得到线程数量增加。减少了并非瓶颈的TMU和L1,节省晶体管。

这样一改,游戏性能会增加,但通用计算性能会有所降低
作者: sasasasa    时间: 2012-4-20 18:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: sucKing    时间: 2012-4-20 19:29
9970能否一战
作者: asd1508    时间: 2012-4-20 19:31
AMD全家被秒了,哈哈。
作者: lee05178    时间: 2012-4-20 20:02
要是双芯就没劲了。一定要单芯70亿晶体管,当然更多更好。哦偶就喜欢超大核心的怪兽,至少要像GF110那样才行
作者: rSKip    时间: 2012-4-20 20:08
本帖最后由 rSKip 于 2012-4-20 20:14 编辑
BDFMK2 发表于 2012-4-20 18:53
必须得改变GCN的架构。

如G100->G104那样。减少CU组数,但增加每组CU里的SP。这样有一些好处,比如降低 ...

GCN的四组SIMD钉死的 而且每组SIMD有16个SP对应10个Wavefront一般也不会变
GCN用大量的线程数/寄存器去换取极简化的任务分配(但是Kepler把这部分工作一大部分交给CPU了) 一个CU的寄存器数量和一个SMX相当 一个CU的work-item比一个SMX多25%。总体上看4CU和1SMX性能应该差不多,两种思路吧。
作者: Edison    时间: 2012-4-20 20:14
GK104 所谓的把部分任务交给 CPU 只是指那些时延确定的指令排序交给 JIT 驱动完成,对于不确定或者很长延时的指令(例如内存存取指令)排序依然是由 GPU 内的硬件 scoreboard 来执行。
作者: luckissy    时间: 2012-4-20 20:27
NV和AMD越走越远啊。。。
作者: defencelsj    时间: 2012-4-20 22:00
提示: 作者被禁止或删除 内容自动屏蔽
作者: BDFMK2    时间: 2012-4-20 22:05
defencelsj 发表于 2012-4-20 22:00
那样岂不是很多AD要被抽耳光?本来就是注重通用计算的GCN架构,现在你又要做回去。

回不去,以GCN的超强的通用计算架构,就算通用计算性能有所降低,那也远比以前的5系和6系A卡强。够游戏用就行了
作者: xyyu    时间: 2012-4-21 06:41
650呢还不出
作者: wwq1233    时间: 2012-4-21 09:58
论坛上YY的人以为做半导体和搭积木一样。想怎么搭怎么搭?
不用考虑实际制造?
作者: CCTV5    时间: 2012-4-21 10:08
微软说:我出一个DX12把你们统统打回原形
作者: NORAWITHMYCALL    时间: 2012-4-21 10:25
本帖最后由 NORAWITHMYCALL 于 2012-4-21 10:26 编辑
CCTV5 发表于 2012-4-21 10:08
微软说:我出一个DX12把你们统统打回原形

兄弟这话讲到最关键问题了,现在民用游戏领域最主要的限制就是MS制定的API规则,AMD很想重新回归底层读取,但是以其目前的实力根本摆脱不了。
作者: happyxxyyoo    时间: 2012-4-21 11:46
期待GK110
作者: fengpc    时间: 2012-4-21 12:17
BDFMK2 发表于 2012-4-20 18:53
必须得改变GCN的架构。

如G100->G104那样。减少CU组数,但增加每组CU里的SP。这样有一些好处,比如降低 ...

“如G100->G104那样。减少CU组数,但增加每组CU里的SP。”这是增加每组ACE负载~~

7970和7870的都是两个ACE,就CU和SP的区别~~GCN架构的规模延伸性明显没有GF/GK的好,GCN跟以前VLIW4/VLIW5架构暴力堆流处理器的做法没本质的区别,堆多了效率就下来了
作者: coollab    时间: 2012-4-21 12:21
NORAWITHMYCALL 发表于 2012-4-21 10:25
兄弟这话讲到最关键问题了,现在民用游戏领域最主要的限制就是MS制定的API规则,AMD很想重新回归底层读取 ...

MS的DX11都是一坨屎,现在搞得厂商痛苦不堪,无论是游戏厂商还是硬件厂商都蛋疼无比
DX12?还早
作者: 1394    时间: 2012-4-21 14:46
提示: 作者被禁止或删除 内容自动屏蔽
作者: sasasasa    时间: 2012-4-21 15:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: stanwich    时间: 2012-4-22 10:26
猥琐的民工 发表于 2012-4-20 17:00
nv一直有一个远大的理想,就是造一个巨大的单核干掉农企的双核……
其实gt200的时候他们就是这么想的……只 ...

这话经典:) 赞

作者: stanwich    时间: 2012-4-22 10:27
GTX999 发表于 2012-4-20 18:18
显然gk110不可能打掉双7970


一直在接近,总有一天会实现:)
作者: 文明之手    时间: 2012-4-22 18:32
感觉如同CPU一样,这一代就是酷睿和速龙来临了,难道AMD从此在显卡里面也要被彻底的拉远?
作者: yoyo2012    时间: 2012-4-22 19:53
GK110么,准备把PSB弄个20层来做
作者: PS5    时间: 2012-4-23 14:54
588mm2  1Ghz主频
作者: PS5    时间: 2012-4-23 21:57
yoyo2012 发表于 2012-4-22 19:53
GK110么,准备把PSB弄个20层来做

这个可以有
作者: PS5    时间: 2012-4-23 22:29
Edison 发表于 2012-4-20 13:49
GK110 是单独的芯片,不是双芯产品。

GTX 690 是 GK104*2,和 GK110 毫无关系,GK104 不支持 ECC。

GK110真是单芯吗?
作者: 莱家栋123456    时间: 2012-4-24 12:02
直接在GK104的基础上翻倍
作者: sasasasa    时间: 2012-4-24 14:29
提示: 作者被禁止或删除 内容自动屏蔽
作者: 莱家栋123456    时间: 2012-4-24 15:55
GK110会不会放在三星位于德州的奥蒂斯工厂制造呢?
作者: R620    时间: 2012-4-24 19:59
70亿的怪兽可以打趴AMD一家子
作者: G70    时间: 2012-4-24 20:06
提示: 作者被禁止或删除 内容自动屏蔽
作者: PS5    时间: 2012-4-24 22:26
sasasasa 发表于 2012-4-24 14:29
你希望显卡着火吗

1.5GHz都不会起火
作者: G81    时间: 2012-4-25 15:10
CUDA5.0快来了
作者: gzeasy2006    时间: 2012-4-25 22:49
GK110出了买一块做家庭用服务器
作者: 32nm    时间: 2012-4-26 08:08
Edison 发表于 2012-4-20 16:09
从来就不存在 GK100.

希望以后一直不出100系列...直接出110系列
作者: G81    时间: 2012-4-26 17:38
现在就是不知道GK110显存位宽是512bit还是384bit的?
作者: gzeasy2006    时间: 2012-4-26 23:27
这个70亿晶体管的大家伙的竞争对手应该是英特尔的至强和安腾系列
作者: gzeasy2006    时间: 2012-4-26 23:30
这个大家伙出来后不知道能从英特尔的手中抢得多少市场份额呢
作者: gzeasy2006    时间: 2012-4-26 23:38
Edison 发表于 2012-4-20 13:49
GK110 是单独的芯片,不是双芯产品。

GTX 690 是 GK104*2,和 GK110 毫无关系,GK104 不支持 ECC。

GK110基于Quadro的产品在性能上不知道是否有惊喜呢?
作者: 莱家栋123456    时间: 2012-4-28 18:31
看看这个70亿晶体管的怪兽的DX11性能能比GTX680高多少




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4