POPPUR爱换

标题: 我已經知道GK110 Kelper的CUDA數量啦! [打印本页]

作者: empressgirl2010    时间: 2012-5-16 05:57
标题: 我已經知道GK110 Kelper的CUDA數量啦!
機密在此:
http://www.nvidia.cn/object/nvidia-kepler-cn.html
http://www.nvidia.cn/content/PDF/kepler/NV_DS_Tesla_KCompute_Arch_May_2012_LR.pdf
每個SMX是192CUDA SP,而SMX的數量是15,那麼數量就是2880個!
[attach]1878243[/attach]
但是不知道中上部的藍色是什麼?還有中間的深藍色。紫色的應該是SMX之間的通訊模塊吧?!


作者: bobcat    时间: 2012-5-16 06:28
标题: .
本帖最后由 bobcat 于 2012-11-1 15:57 编辑

.......................
作者: gtx5    时间: 2012-5-16 06:33
2680sp.........

http://pc.pcinlife.com/Graphics/20120507/128.html
作者: eDRAM    时间: 2012-5-16 07:22
本帖最后由 eDRAM 于 2012-5-16 07:23 编辑

现在就是不知道游戏卡是否能全开15个SMX  频率要拔高是肯定的了
作者: 奥斯卡奖    时间: 2012-5-16 07:49
本帖最后由 奥斯卡奖 于 2012-5-16 07:51 编辑
gtx5 发表于 2012-5-16 06:33
2680sp.........

http://pc.pcinlife.com/Graphics/20120507/128.html


cho打错字了吧,上边还说GK110具有和GK104差不多的SMX,一组192CUDA Core,下面却说一共15组,实际上市会屏蔽掉1组仅剩下14组2680SP,怎么算都是2880-192=2688。。。
作者: bobcat    时间: 2012-5-16 07:52
本帖最后由 bobcat 于 2012-11-1 15:57 编辑
.......

.......................
作者: GTX999    时间: 2012-5-16 08:06
标题: RE: 我已經知道GK110 Kelper的CUDA數量啦!
bobcat 发表于 2012-5-16 06:28
你知道得太多了.

680是8个SMX. 如果大怪物是15个, 将是超过690的性能.  不给农企任何幻想的余地啊.

110频率定个800算不错了,再高功耗超标
作者: hjgkl    时间: 2012-5-16 08:06
bobcat 发表于 2012-5-16 06:28
你知道得太多了.

680是8个SMX. 如果大怪物是15个, 将是超过690的性能.  不给农企任何幻想的余地啊.

690好歹是8个SMXX2,即便不考虑流处理器的边际效率递减,15个SMX超过16个SMX???况且还没出,就又阉了一个,不要YY了。。。。。。
作者: 奥斯卡奖    时间: 2012-5-16 08:32
hjgkl 发表于 2012-5-16 08:06
690好歹是8个SMXX2,即便不考虑流处理器的边际效率递减,15个SMX超过16个SMX???况且还没出,就又阉了一个, ...

又来一个新注册的马甲。。。
GTX690只不过是小幅度降频版的GK104 SLI,SLI的实际效率只提升了70-80%左右,并且GK104存在带宽瓶颈,显存不过256bit 6000Mhz,总带宽只有192G,而GK110按照CHO那个前瞻文章里面提到的数据,GK110比GK104提升了33%达到256G,也就是GK110的显存位宽必然是384bit了,至于显存频率应该是5000Mhz出头
简单点说,之前的GTX280是240SP,而9800GX2是G92*2=256SP,受限于显存瓶颈和SLI效率,实际性能不照样是GTX280干倒9800GX2,9800GX2的实际频率比GTX280还要高一点,核心600Mhz,shader1500Mhz,而GTX280不过核心602Mhz,shader1296Mhz
全规格15SMX的GK110干倒双GK104 SLI的GTX690也真的不是什么太天方夜谭的事情
作者: GTX999    时间: 2012-5-16 08:36
cho都说了2680sp
作者: Edison    时间: 2012-5-16 08:38
2688
作者: G81    时间: 2012-5-16 08:45
Edison 发表于 2012-5-16 08:38
2688

桌面显卡110有没有可能15个SMX全开呢?另外还想知道GK110的纹理单元是多少个呢?TS单元是多少个?
作者: GTX999    时间: 2012-5-16 08:48
标题: RE: 我已經知道GK110 Kelper的CUDA數量啦!
G81 发表于 2012-5-16 08:45
桌面显卡110有没有可能15个SMX全开呢?另外还想知道GK110的纹理单元是多少个呢?TS单元是多少个?

tesla都不全开估计更不可能轮到桌面了
作者: G81    时间: 2012-5-16 08:49
GTX999 发表于 2012-5-16 08:48
tesla都不全开估计更不可能轮到桌面了

那纹理单元和TS各是多少个呢?
作者: Edison    时间: 2012-5-16 08:51
G81 发表于 2012-5-16 08:45
桌面显卡110有没有可能15个SMX全开呢?另外还想知道GK110的纹理单元是多少个呢?TS单元是多少个?

不知道


作者: GTX999    时间: 2012-5-16 08:51
标题: RE: 我已經知道GK110 Kelper的CUDA數量啦!
Edison 发表于 2012-5-16 08:38
2688

按782频率算性能比680高35% 比7970高43%
作者: G81    时间: 2012-5-16 08:53
Edison 发表于 2012-5-16 08:51
不知道

你怎么可能会不知道?
作者: G81    时间: 2012-5-16 08:56
GTX999 发表于 2012-5-16 08:48
tesla都不全开估计更不可能轮到桌面了

桌面版要冲单芯卡皇所以有可能15个SMX全开,而且还是1Ghz的主频
作者: G81    时间: 2012-5-16 09:04
隔壁有人爆料说GK110的显存位宽是512bit  显存频率是 4000Mhz  E大快出来证实阿
作者: hjgkl    时间: 2012-5-16 09:06
奥斯卡奖 发表于 2012-5-16 08:32
又来一个新注册的马甲。。。
GTX690只不过是小幅度降频版的GK104 SLI,SLI的实际效率只提升了70-80%左右 ...

gtx 280干到了9800GX2???480干到了gtx295???意淫还意淫出这么多,不容易,佩服。

作者: Elwin    时间: 2012-5-16 09:07
geforce不太讲究,因此规格频率功耗必然是各版本之首,反过来显存容量却是最少,但如果仅用于游戏也足够多了。
作者: 奥斯卡奖    时间: 2012-5-16 09:11
本帖最后由 奥斯卡奖 于 2012-5-16 09:12 编辑
G81 发表于 2012-5-16 09:04
隔壁有人爆料说GK110的显存位宽是512bit  显存频率是 4000Mhz  E大快出来证实阿


我觉得是384bit
这张是GTX680的架构图,注意一共4个64bit MC分布在两侧

这张是GK110的,一共6个,4个分布在两侧,2个在底部




作者: G81    时间: 2012-5-16 09:17
本帖最后由 G81 于 2012-5-16 09:17 编辑
奥斯卡奖 发表于 2012-5-16 09:11
我觉得是384bit
这张是GTX680的架构图,注意一共4个64bit MC分布在两侧

现在就是不是知道是512bit 4000Mhz  还是384bit  5350Mhz?
作者: GTX999    时间: 2012-5-16 09:19
标题: RE: 我已經知道GK110 Kelper的CUDA數量啦!
G81 发表于 2012-5-16 08:56
桌面版要冲单芯卡皇所以有可能15个SMX全开,而且还是1Ghz的主频

800频率就够单芯卡皇了。680 7970风冷冒烟也赶不上的性能
作者: 奥斯卡奖    时间: 2012-5-16 09:19
G81 发表于 2012-5-16 09:17
现在就是不是知道是512bit 4000Mhz  还是384bit  5350Mhz?

一个MC是64bit,6个就是384bit,哪来的什么512bit
带点基本判断力回来吧
作者: G81    时间: 2012-5-16 09:20
奥斯卡奖 发表于 2012-5-16 09:19
一个MC是64bit,6个就是384bit,哪来的什么512bit
带点基本判断力回来吧

那你说256GB/s的带宽是怎么来的?
作者: GTX999    时间: 2012-5-16 09:20
标题: RE: 我已經知道GK110 Kelper的CUDA數量啦!
G81 发表于 2012-5-16 09:17
现在就是不是知道是512bit 4000Mhz  还是384bit  5350Mhz?

512bit没必要,4000的gddr5都几年前的东西了
作者: G81    时间: 2012-5-16 09:22
GTX999 发表于 2012-5-16 09:20
512bit没必要,4000的gddr5都几年前的东西了

问题是4000Mhz  512bit的带宽正好是256GB/s
作者: 奥斯卡奖    时间: 2012-5-16 09:23
G81 发表于 2012-5-16 09:20
那你说256GB/s的带宽是怎么来的?

你是不是真的有问题,连思考都不会?
自己算算不就清楚了,GK104不过256bit MC 6000Mhz频率就有192G的带宽,GK110提升到384bit,显存频率降低到5000多就已经有256G的带宽
这个参数只是现在初步估计,又不是最终规格,GK110是Q4才正式发布,有的是时间修改和确定最终的频率参数,没发布之前一切都会变
作者: 扫帚    时间: 2012-5-16 09:24
G81 发表于 2012-5-16 09:04
隔壁有人爆料说GK110的显存位宽是512bit  显存频率是 4000Mhz  E大快出来证实阿

很显然是假的
作者: G81    时间: 2012-5-16 09:26
奥斯卡奖 发表于 2012-5-16 09:23
你是不是真的有问题,连思考都不会?
自己算算不就清楚了,GK104不过256bit MC 6000Mhz频率就有192G的带 ...

5000根本就不可能256GB/s
作者: xiaxin222a    时间: 2012-5-16 09:27
奥斯卡奖 发表于 2012-5-16 08:32
又来一个新注册的马甲。。。
GTX690只不过是小幅度降频版的GK104 SLI,SLI的实际效率只提升了70-80%左右 ...

G92和GT280的SP效率不能直接比对,GT280有优化
作者: 奥斯卡奖    时间: 2012-5-16 09:27
G81 发表于 2012-5-16 09:26
5000根本就不可能256GB/s

卧槽,我发现我是对牛弹琴
不再回复你了,没有任何用
作者: GTX999    时间: 2012-5-16 09:30
标题: RE: 我已經知道GK110 Kelper的CUDA數量啦!
奥斯卡奖 发表于 2012-5-16 09:27
卧槽,我发现我是对牛弹琴
不再回复你了,没有任何用

哈哈。看你俩对话笑死了
作者: G81    时间: 2012-5-16 09:31
奥斯卡奖 发表于 2012-5-16 09:27
卧槽,我发现我是对牛弹琴
不再回复你了,没有任何用

你有点耐心不可以啊
作者: 奥斯卡奖    时间: 2012-5-16 09:33
GTX999 发表于 2012-5-16 09:30
哈哈。看你俩对话笑死了

对一个死脑筋,没任何判断力,只看数据硬算出哪个频率比较相符常规频率就得出MC规格的id,我已经彻底没兴趣纠缠下去了。。。
作者: chulei104    时间: 2012-5-16 09:37
奥斯卡奖 发表于 2012-5-16 09:33
对一个死脑筋,没任何判断力,只看数据硬算出哪个频率比较相符常规频率就得出MC规格的id,我已经彻底没兴 ...

细看晶圆图,你说的6个mc还是挺靠谱的。
作者: 奥斯卡奖    时间: 2012-5-16 09:41
chulei104 发表于 2012-5-16 09:37
细看晶圆图,你说的6个mc还是挺靠谱的。

我自己看那个晶圆图觉得是6个,左右各两个+下面2个,也就是64bit*6=384bit
上面那两个看颜色和左右还有下面的不太一样,应该不是MC吧
作者: Windyson    时间: 2012-5-16 10:20
5组GPC,每组GPC含3组SMX
15组SMX(绿色),192SPx15=2880SP
6组MC(浅紫色),64Bitx6=384Bit
预感有带宽瓶颈.
作者: 明镜止水    时间: 2012-5-16 10:25
Windyson 发表于 2012-5-16 10:20
5组GPC,每组GPC含3组SMX
15组SMX(绿色),192SPx15=2880SP
6组MC(浅紫色),64Bitx6=384Bit

有一组SMX是冗余的
作者: Windyson    时间: 2012-5-16 10:29
本帖最后由 Windyson 于 2012-5-16 10:30 编辑
G81 发表于 2012-5-16 09:31
你有点耐心不可以啊


GK104有4块紫,MC64bit*4
[attach]1878358[/attach]
GK110有6块紫,MC64bit*6
[attach]1878359[/attach]

作者: Windyson    时间: 2012-5-16 10:32
明镜止水 发表于 2012-5-16 10:25
有一组SMX是冗余的

你意思是减5个SMX,还是减1个GPC
作者: rSKip    时间: 2012-5-16 10:41
外圈是MC、紫色是后端吧
作者: defencelsj    时间: 2012-5-16 10:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: 1394    时间: 2012-5-16 11:07
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2012-5-16 11:11
1394 发表于 2012-5-16 11:07
大家YY一下 11月发布  完整核心 频率1g   这是何等的恐怖啊!!  amd的8790 注定是 只能田纪赛马 买4870的价 ...

依照 浮点性能规格来看,内核频率应该是 782MHz 的水平。
作者: Saltius    时间: 2012-5-16 11:35
新图一张。
[attach]1878418[/attach]
作者: mooncocoon    时间: 2012-5-16 11:36
Edison 发表于 2012-5-16 11:11
依照 浮点性能规格来看,内核频率应该是 782MHz 的水平。

可以考虑先关闭一个GPC,然后以50%的规模提升+高频来“冒充”下一代出锅。
作者: GTX999    时间: 2012-5-16 11:40
标题: RE: 我已經知道GK110 Kelper的CUDA數量啦!
本帖最后由 GTX999 于 2012-5-16 11:44 编辑
1394 发表于 2012-5-16 11:07
大家YY一下 11月发布  完整核心 频率1g   这是何等的恐怖啊!!  amd的8970 注定是 只能田纪赛马 买4870的价 ...


1ghz散热控制不了, 782mhz就足够了 超频留给用户,价格6000以上。。。。
作者: Windyson    时间: 2012-5-16 11:42
rSKip 发表于 2012-5-16 10:41
外圈是MC、紫色是后端吧

NV的后端和MC是挂钩的,多少后端就多少MC
作者: luckissy    时间: 2012-5-16 11:43
给力 6GB显存吗?
作者: Edison    时间: 2012-5-16 11:44
mooncocoon 发表于 2012-5-16 11:36
可以考虑先关闭一个GPC,然后以50%的规模提升+高频来“冒充”下一代出锅。

什么乱七八糟呀?
作者: G81    时间: 2012-5-16 11:46
期待游戏卡是2880SP  384bit   7Ghz频率
作者: mooncocoon    时间: 2012-5-16 11:50
Edison 发表于 2012-5-16 11:44
什么乱七八糟呀?

你看,用熔丝关仨SMX,剩下的资源总量还是比GK104多50%。
然后EDA好好做,走个高频比如9XX什么的,这不就跟NV40~G70一个路数了么,够当一次换代用了。

当然,我们说的是GeForce,你可能理解成了Tesla。
作者: 刘丹    时间: 2012-5-16 11:55
mooncocoon 发表于 2012-5-16 11:50
你看,用熔丝关仨SMX,剩下的资源总量还是比GK104多50%。
然后EDA好好做,走个高频比如9XX什么的,这不就 ...

你也可以写一个GK110显卡版的分析报告之类的文章
作者: chulei104    时间: 2012-5-16 12:04
Saltius 发表于 2012-5-16 11:35
新图一张。

command processor是啥?传说中的arm?
作者: 1394    时间: 2012-5-16 12:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: krisman    时间: 2012-5-16 12:12
Tesla  除了稳定,显存规模还有ECC内存还有什么特性和桌面显卡不一样呢?就是K10和690有什么特性区别,这个与i7和E3的关系一样的吧?
作者: Edison    时间: 2012-5-16 12:23
chulei104 发表于 2012-5-16 12:04
command processor是啥?传说中的arm?

Command Processor: An application sends commands (such as set memory addresses and formats, invalidate and flush caches, and start program) to the DPVM by writing them into command buffers in memory, and then sending them to the DPVM.

Methods to open and close a device, submit a command buffer, and wait for a command buffer are exported via a shared library. Global information, such as memory pool sizes and addresses are
returned upon device open. This interface simplifies device communication, and eliminates unwanted policy.
作者: csqaclp    时间: 2012-5-16 12:49
核心频率能上700吗
作者: clermont    时间: 2012-5-16 13:14
还在用64个sp的掩面路过
作者: caoshichun    时间: 2012-5-16 13:43
本帖最后由 caoshichun 于 2012-5-16 13:43 编辑

小月月快来歌功颂德,CHO快来爆尿~
作者: Windyson    时间: 2012-5-16 13:49
730MHzx2880SPx2=4.2TFlops
780MHzx2688SPx2=4.2TFlops
840MHzx2496SPx2=4.2TFlops
作者: 久泉苍月    时间: 2012-5-16 14:03
消息透露的还是很少啊。不过GTX版本确实比想象中猛啊。。。。。。
作者: GTX999    时间: 2012-5-16 15:19
标题: RE: 我已經知道GK110 Kelper的CUDA數量啦!
Windyson 发表于 2012-5-16 13:49
730MHzx2880SPx2=4.2TFlops
780MHzx2688SPx2=4.2TFlops
840MHzx2496SPx2=4.2TFlops

780是最靠谱的,风冷有机会1GHz
作者: GTX999    时间: 2012-5-16 15:24
标题: RE: 我已經知道GK110 Kelper的CUDA數量啦!
本帖最后由 GTX999 于 2012-5-16 18:48 编辑
久泉苍月 发表于 2012-5-16 14:03
消息透露的还是很少啊。不过GTX版本确实比想象中猛啊。。。。。。


据说110的目前情况和480差不多

点评的ngun还是继续yy 8970cf不如gk110好了 哈哈

作者: NORAWITHMYCALL    时间: 2012-5-16 18:04
奥斯卡奖 发表于 2012-5-16 09:23
你是不是真的有问题,连思考都不会?
自己算算不就清楚了,GK104不过256bit MC 6000Mhz频率就有192G的带 ...

计划内的TESLA版,GEFORCE版没有具体上市计划表。
作者: sucKing    时间: 2012-5-16 18:06
本帖最后由 sucKing 于 2012-5-16 18:06 编辑
刘丹 发表于 2012-5-16 11:55
你也可以写一个GK110显卡版的分析报告之类的文章

说,和53楼什么关系
作者: gzeasy2006    时间: 2012-5-16 18:18
提示: 该帖被管理员或版主屏蔽
作者: gzeasy2006    时间: 2012-5-16 18:36
屏蔽一组smx是特斯拉吧?游戏卡是不屏蔽的




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4