NVIDIA GeForce GTX 680预览

gtx5 · 发表于 2012-2-11 17:29

继昨天3DCenter.org后，一向善于深度分析的BSN网站也于今日放出了关于NVIDIA 28nm工艺Kepler架构GK104核心的消息：部分和本站昨日报道的大体相同，不过还有一些细微之处值得玩味。（关于昨日的传闻PCINLIFE管理员cho此次一反常态没有扔出一句"Fake"或者“瞎编”就走，此外多方来源已经间接暗示多数细节为真）
首先关于NVIDIA将核心频率和Shader频率统一这个早有相关报道。Kepler架构中一组SM的CUDA Core数量对比Fermi翻倍，由32升为96个。显存控制器为256bit界面，这些都与昨天3DCenter的消息相同。
接下来让我们来看看GK104的核心示意图：

大眼一看和GF110类似，不过仔细看就能发现SP数量由512暴增至1536。BSN称，起初NVIDIA考虑GK104上市初的名称是GeForce GTX 660，但现在有99%的可能正式上市名称为GeForce GTX 680，剩下1%为GTX 660/670。价格方面也和之前大嘴查理所说的不同：GeForce GTX 680定位于GeForce GTX 560 Ti 2GB/GeForce GTX 560 Ti 448 Core/GeForce GTX 570的替代者，初步定价为349-399美元。性能方面当然要比上代旗舰GeForce GTX 580要高很多，最重要的是GK104不仅能干掉449美元的Radeon HD 7950 3GB，549美元的Radeon HD 7970也不在话下，有消息称3DMark 11 X模式得分可能会在3000左右，一夜爆降千元看来即将出现……（提示：1536/1024或768/512）
接下来是GK104的架构分析，Kepler时代一组SM以96个CUDA Core为基准，1个GPC（Graphics Processing Clusters）含4组SM共384个CUDA Core。GK104含1536个（4GPC），不难推测顶级的GK110可能含6GPC即2304个CUDA Core。显存控制器方面可能仍为低端入门级64bit，中端主流128bit，中高端256bit，顶级384/512bit——应先用在HPC上，或者采用GK110的GeForce GTX 690。而Kepler的移动图形核心其实已经早已流片完成，CES上三星已经展示了搭载最低端（96CUDA Core）的笔记本电脑。（驱动程序对频率/规格识别有误）

和AMD的Tahiti XT对比，GK104在ROP和TMU数量上一样——均为32个和128个，但显存控制器指标仍然延续不如AMD的“传统”，2GB 256bit GDDR5显存对上Raeon HD 7970/7950的3GB。不过价格和性能上的优势相信届时也会迫使对手产品降价。
和GF110一样，GK104其实也有两个版本——生产Quadro和Tesla的双精度浮点性能为单精度的一半，而生产GeForce的理论上为四分之一。
目前GK104的核心频率暂定为950MHz，但BSN称消息来源表示在NVIDIA的实验室中起初有两个版本：772MHz用来和相同的GeForce GTX 580比较，925MHz用来和相同的Tahiti XT做比较，实际出货版本核心频率可能会在950-1000MHz之间。当然，类似AMD的蓝色小药丸，NVIDIA目前也在加紧调整BIOS，争取使公版的GK104核心频率届时站上1GHz。如果NVIDIA无法完成这一目标，那么将第一时间开放非公版/AIC超频版。
显存方面，目前暂定的频率为1.25GHz等效5GHz，相对GF100/110的提升了25%。这方面AMD在GDDR5显存/控制器上算是标准制订者之一，因此AMD的GPU工程师在提高GDDR5显存方面具有优势也就不稀奇。由前面所述的频率计算，GK104拥有160GB/s的显存带宽，对比GTX 580的192.4GB/s略有下降，但比起预计替代的产品GTX 560 Ti和GTX 560 Ti GF110核心版本/GTX 570的128.27GB/s和152GB/s均有提升。
所有这些规格带来的单精度浮点运算能力为2.9-3.05TFLOPS，双精度浮点为486-500GFLOPS。Quadro和Tesla版本会拥有解锁的双精度浮点运算能力——也就是1.5-1.6TFLOPS左右，和GTX 580的单精度浮点运算能力相当，显著高于Fermi核心的Quadro和Tesla。
BSN最后称，用户们不会等待太长时间，NVIDIA已经准备开始Kepler的预售/铺货等行动（包括中端的GK107——GeForce GTX 650等），在市场行动上用来反击AMD将于2月15日发布的"Cape Verde"Radeon HD 7700系列和3月6日德国汉诺威CeBIT展会上发布的"Pitcairn"Radeon HD 7800系列。或许下个月市场上就能见到Kepler的实体。

SupperSix · 发表于 2012-2-11 17:37

唉，本来想说什么，算了还是

043265 · 发表于 2012-2-11 18:11

坐等降千元

w7231665 · 发表于 2012-2-11 18:13

按这个规格- -灭7XXX全家真是没压力了

hmj1982427 · 发表于 2012-2-11 18:29

要真是这样，把原定的660改名680卖，AMD可怎么活啊，除非还有什么后手

chenhua007very · 发表于 2012-2-11 18:38

铁杆A可以去交易区等收2000出头的7970了

BDFMK2 · 发表于 2012-2-11 18:49

这文可说灭掉7970不在话下哦

蕊珠 · 发表于 2012-2-11 19:19

w7231665 发表于 2012-2-11 18:13
按这个规格- -灭7XXX全家真是没压力了

此1536非fermi时代的sp，GK104 1536sp，950M主频，达到的单精度浮点运算是2.918T的话，只能说明GK104构架的3sp相当于GF110构架的1sp，因为580规格512sp，772M主频就达到了2.372T的单精度浮点运算。

aixiangsui2012 · 发表于 2012-2-11 19:22

如果规模这么搞，说明内部架构已经大变了
那么费米和之前几代也全算白费了

f0f0f0 · 发表于 2012-2-11 19:25

蕊珠发表于 2012-2-11 19:19
此1536非fermi时代的sp，GK104 1536sp，950M主频，达到的单精度浮点运算是2.918T的话，只能说明GK104构架 ...

http://www.nvidia.cn/docs/IO/43395/DS-Tesla-M-Class-Aug11.pdf

krisman · 发表于 2012-2-11 19:28

这么说660也得1000SP左右，再买1499左右，又个高性价比产品出世，有木有？

66666 · 发表于 2012-2-11 19:31

蕊珠发表于 2012-2-11 19:19
此1536非fermi时代的sp，GK104 1536sp，950M主频，达到的单精度浮点运算是2.918T的话，只能说明GK104构架 ...

GTX580哪来的2.3T单精度？

GTX999 · 发表于 2012-2-11 19:34

66666 发表于 2012-2-11 19:31
GTX580哪来的2.3T单精度？

相当于768sp

蕊珠 · 发表于 2012-2-11 19:41

66666 发表于 2012-2-11 19:31
GTX580哪来的2.3T单精度？

NV核心单精度浮点运算的计算公式是流处理器频率*3*流处理器数量，当初GTX280的规格是240sp，流处理器频率1296M，算的单精度浮点运算为0.933T，与标称相符。用这种方法算得580单精度浮点运算是2.372T，和标称不符，标称未必正确，因为按照2.372T来计算580的性能是216.5（280是116.6），与实际相符。这和6970类似，只有按照3.379T而不是2.703T来计算6970的性能才能得到194.1的理论值（5870是162.7）

蕊珠 · 发表于 2012-2-11 19:44

66666 发表于 2012-2-11 19:31
GTX580哪来的2.3T单精度？

还有一点，GK104按照2.918T浮点运算，160G显存带宽来计算理论性能值是219（580是216.5）。

cbr250xc · 发表于 2012-2-11 19:45

還是這裡氣氛好一點可以客觀討論一下馬勒隔壁就像打翻了個醋澄子一樣酸溜溜的一有新卡性能比7970強就好像刺到他媽媽的g點一樣亂叫。還各種黑，好像很願意看到nv拿出個殘廢卡似的這種情況、

66666 · 发表于 2012-2-11 19:53

蕊珠发表于 2012-2-11 19:41
NV核心单精度浮点运算的计算公式是流处理器频率*3*流处理器数量，当初GTX280的规格是240sp，流处理器频率 ...

恩恩，原来NV自己公布的1.5T是胡扯，您自己YY的2.3T才正确是吧？

你所谓的计算公式依据在哪？有CUDA程序可以重现？

李主任 · 发表于 2012-2-11 20:05

年纪大了，现在只想用集显玩玩小游戏。

sunstarmoon · 发表于 2012-2-11 20:12

本帖最后由 sunstarmoon 于 2012-2-11 20:12 编辑

蕊珠发表于 2012-2-11 19:41
NV核心单精度浮点运算的计算公式是流处理器频率*3*流处理器数量，当初GTX280的规格是240sp，流处理器频率 ...

因为根据官方数据套进你自己想出来的公式计算出来的结果不符合现实情况，所以错的是NV公布出来的数据不是你的公式，你是这么认为？

蕊珠 · 发表于 2012-2-11 20:12

66666 发表于 2012-2-11 19:53
恩恩，原来NV自己公布的1.5T是胡扯，您自己YY的2.3T才正确是吧？

你所谓的计算公式依据在哪？有CUDA程 ...

280的浮点运算就是0.933T了，580才1.5T你觉得靠谱吗？要用脑子想想，不要光相信别人的答案，当然2.9如果也不是GK104的真是浮点运算的话那GK104的性能值将达到268.3

帐号		自动登录	找回密码
密码			注册

NVIDIA GeForce GTX 680预览

相关帖子

浏览过的版块