POPPUR爱换

标题: 随便谈谈对460来历的看法 [打印本页]

作者: anolen01    时间: 2010-7-13 21:13
标题: 随便谈谈对460来历的看法
NV的460(104)总算上市了,距离480(100)宣布上市近半年。现在有资深N饭和版主言之凿凿曰,104和100是两条并行开发的GPU。在下不在,对这种说法有些疑虑,望知情者斧正。

GPU的开发是个长期的过程,现有100和104的具体架构确定至少应当是2-3年前,而前瞻性研究可能更早。100的架构更通用化,因而核心面积更大架构更复杂,设计和制造更困难;而104的架构更适合游戏渲染,核心面积也小一半架构简化,制造上也应该更容易。从NV历史上说,高端GPU总是优先开发,而做适当裁减后成为中端和低端GPU。而104显然不会是100的裁减,但104是不是和100同步平行开发的呢?

在下认为,104的确是和100平行开发,但显然是晚于100的架构开发,在下猜想更可能是得知AMD的HD4系的架构而看到了HD4系乃至以后HD5系的实力,而在100架构的基础上做了相应的调整重新开发了104,更适合游戏用途,并在成本上能和AMD做较量。而且这种二次开发的开始时间得还比较晚,原因如下,如果NV在100架构开发早期就意识到这一点,鉴于104架构的复杂程度和核心大小,104很可能更适合被用来做40nm工艺的探路石,至少是能和100基本同步发布,而不是100单独冲锋陷阵,而后104才姗姗来迟。而NV采用两种架构路线的原因呢,我猜想更多是因为对HD4系和5系的市场压力所致,NV早就明白用100架构来做游戏市场的争夺,搞不好会赔了夫人又折兵,干脆开发一款游戏专用GPU来做竞争。这样的技术和市场路线,起始和HD3系以来的小核心战略不谋而和,应该说是英雄所见略同,虽然晚了一步认识到这一点可能会变成狗熊。

NV也会犯错,104的出现应该说是NV重新对其过去通用计算市场和游戏市场策略的修正。当然如今的104仍然不够令人满意,作为一款专用的游戏GPU,它起始并不具有市场的领袖地位,不仅弱于同级的5850,更弱于核心面积相近的5870。当然104架构的如此抉择,或许也是为了保持不至于过于影响100架构GPU的市场地位,毕竟100架构的Telsa需要Geforce来摊平制造成本。可以设想,NV今后的道路会更加艰难,因为NV实际上要花双倍的研发投入来达到过去同样的效果,而这很可能就是AMD的市场机遇所在。
作者: 1101    时间: 2010-7-13 21:24
提示: 该帖被管理员或版主屏蔽
作者: ikinari    时间: 2010-7-13 21:35
提示: 作者被禁止或删除 内容自动屏蔽
作者: iBruce    时间: 2010-7-13 23:37
我只是看完世界杯决赛 一觉醒来 看到评测 然后淘宝入手了460 期间不到半个小时 我没有楼主那么有远见……
作者: Duron750    时间: 2010-7-13 23:41
在下不在,对这种说法有些疑虑,望知情者斧正。

斧正下 你的错别字  估计是在下布菜
作者: shu0202    时间: 2010-7-14 00:24
同时开发根本就是胡扯……二者是同一架构,在GF100架构的基础上作一定的改进推出GF104,这是衍生的关系。
作者: cardex_sp    时间: 2010-7-14 01:55
同时开发根本就是胡扯……二者是同一架构,在GF100架构的基础上作一定的改进推出GF104,这是衍生的关系。
shu0202 发表于 2010-7-14 00:24



  附议。
作者: luckissy    时间: 2010-7-14 02:01
GT200 GT215 是两个并行发展的
作者: Edison    时间: 2010-7-14 02:23
其实 GF104 与 GF100 的关系就和 G92 与 G80 的关系差不多,一个是 CUDA caps 2.1 vs CUDA caps 2.0,一个是 CUDA caps 1.1 vs CUDA caps 1.0,都属于衍生品,整个基石都是在 GF100 或者 G80 上。

至于为何大家觉得 GF104 是一个并行开发的产品,更多的是因为 GF100 的延期上市,比预期晚了至少半年,这也就相对拉近时间,给人似乎都是同期产品的感觉。G92 就是在 G80 差不多一年左右推出的。其实在 GT200 的时候,NVIDIA 就有做 GT21X 的类 G92 档次产品,但是可能是对 GF100 过于乐观以及认为金融危机降低了消费欲望等因素影响(个人猜测),这档产品被取消掉了。好在 GT200 采用的是 ad-hoc crossbar 设计,内部各个部件的互联可以做到无中心式的按需任意直连,冗余设计发挥到几乎极限,在空前的 GPU 芯片面积下居然能维持相对较高的供应量。不过即使在这样的情况下,亚高端产品依然有很高的需求,玩家一直都渴望 G92 的真正换代产品。

是否并行设计,这取决于你对并行设计的定义,广义上来说,的确是并行设计,因为 GF104 有大量的技术源自 GF100,例如多核设计、内核程序并行执行、L2 cache,这些实际上都是 GF104 的基石。所以我认为从 ISA 来说,GF104 和 GF100 都是一样的,但是它们在工程上而言并非同期产品,而是类似 G92/G80 的关系,正常情况下时间间隔至少半年,这个关系在 Tesla 20 时代断掉,在 Fermi 上重现,由于 GF104 的成功,下一代产品将依然会有相应关系的产品出现,但是推出时间的次序将极可能会...相反(信不信由你:p)。
作者: jhg1159    时间: 2010-7-14 10:53
E大,G200由传统的ROP分割成光栅单元+ROP的组合是不是GF100架构8XMSAA效率大幅度提高的原因。
核心内部带宽不如与峰值指令数量不如上代和减少一个并发浮点,是否是GF100 DX9 DX10性能的不如预期的一个重要原因。
作者: anolen01    时间: 2010-7-14 10:59
非常感谢管理员的详尽回复!

我的看法也是基本如此,104本身应该是100主体架构完成后为游戏市场作优化开发的产物。不过我认为104和100的关系更类似G80和G94而不是G80和G92,NV应该并未打算用104取代100在游戏市场的定位,更不可能取代100在通用和超算市场的地位。因此我只是在推测,NV是不是今后也会采取小核心战略耕耘游戏市场,而用全功能大核心主要逐鹿通用计算和超算市场。
作者: 很黄很暴力    时间: 2010-7-14 11:00
能上市就是好事了,总算看到58XX开始降价了
作者: shu0202    时间: 2010-7-14 11:14
其实 GF104 与 GF100 的关系就和 G92 与 G80 的关系差不多,一个是 CUDA caps 2.1 vs CUDA caps 2.0,一个是 ...
Edison 发表于 2010-7-14 02:23


我也倾向于GF104的后代会比GF100的后代早出来,HPC这一块GF100至少能坚持一年半……
作者: clawhammer    时间: 2010-7-14 11:21
楼主你拿阉割的GF104和完整的RV870比性能,本来就不对
完整的GF104出来灭了5870
作者: pdfa    时间: 2010-7-14 11:27
很期待这样的良性竞争,消费者将是最终受益者
作者: clawhammer    时间: 2010-7-14 13:02
嘿嘿,连别人的阉割版现在都搞不定,就开始YY完整版了??
tft1122 发表于 2010-7-14 11:54

欢迎到时挖坟
作者: anolen01    时间: 2010-7-14 13:12
同级是指核心面积、性能、定位是同级,价格属于市场策略,就如同4850当年也只以1399开卖,但实际上4850具有不输于当时卖1999的98GTX的性能实力。
作者: Buffer    时间: 2010-7-14 13:15
可以设想,NV今后的道路会更加艰难,因为NV实际上要花双倍的研发投入来达到过去同样的效果,---------如果特斯拉失败,卖不出去也许就可这样“猜想(因为是不是花两倍都还难说)”。
作者: jeff_999    时间: 2010-7-14 13:32
南岛不是A1挂了么?
风水轮流转的
作者: mooncocoon    时间: 2010-7-14 13:32
本帖最后由 mooncocoon 于 2010-7-14 13:35 编辑

其实应该这么说——并行设计并不代表没有联系。gf100和gf104是费米构架下并行开发的两组不同的游戏构架。他们具备费米构架的灵魂,比如并行kernel执行力,多核互联和cache体系。

那为啥说他俩是不同构架~?举个例子——SM被重新设计。
也许你会说,不就是SM里面多放了几个SP么。如果这是在过去,尤其是GT200时代,那这件事情就无所谓了,加点减点SP你只要找齐shared就无所谓了,反正对程序员来说延迟都是可见的,你面前只不过是多了点ALU罢了,NV剩下的事情就是通过crossbar把它们连起来。
但是在使用unifield cache的费米身上,这就是两码事了,因为它牵扯到一个极端致命的问题——cache命中。
在不可预期延迟出现的现在,费米构架下改变sp/cache资源的比例,意味着完全不同的命中环境和命中方式。这可不是以前那样连连线那么简单的事情了。
如果没有在模拟机上长时间的独立模拟和积累,直接使用GF100的缓存操作方式和命中算法去套用,GF104不可能有稳定的性能表现。
好吧,这里还牵扯到更多的tex,unifield cache也是可以拿来放指针的。
至于其他东西,比如说tex与其他部分的联系,GF100和GF104倒是可以做到G80-G92那样的事情,改进即可。


至于时间表,表面上看两个产品之所以挨得那么近发布是因为GF100延迟了
OK,这就是问题的关键——被延迟的究竟是GF100,还是费米tesla~
明白了么~?

gf104的立项不仅独立在GF100之外,开始时间也跟GF100不相上下。NV在tesla发布之后直接把费米组分成了两个规模相当的团队同步进行,投注的资源也是相当的,甚至由于弄了某个小玩具,104这边还在前不久追加了很多EDA资源进去,这也就是为什么会有好像是开玩笑是的Plan B这种说法。
我觉得这是很现实很实在的支撑GF104与GF100平行进行的证据
NV的有意无意的隐藏其实做得很好,如果不是后来被追加的EDA资源,我根本就不知道原来104的团队是如此独立,算是偶然碰上了真相吧


明白没有~?并不是说GF100和GF104是两个独立的不相干的东西,他们都出自费米构架,灵魂上是相通的。但是他们的细节注定是有不可忽视的不同的,这已经超越了G80-G92的差距
作者: mooncocoon    时间: 2010-7-14 13:38
0202,我单独拿出来这个完全就是对你说的
你不是一直不满足于信息的不对等么,我挨点骂没啥,告诉你一些事情也好,省的你整天自我现实
只希望你能不要急着说别人是不是胡扯,还是那句话——想好了在说话
作者: mooncocoon    时间: 2010-7-14 15:39
本帖最后由 mooncocoon 于 2010-7-14 15:45 编辑

我之前在群里说过,完美的费米游戏型,就是砍掉DP相关的ALU和寄存器,保留SFU,然后把这部分晶体管全部拿来强化tex,同时减小规模走高频。这样既可以保证整个构架原本就完美的shader能力、运算能力以及灵活度,还能弥补GF100相对短板的tex部分。
这种形态的费米游戏型,不论DX10还是DX11都是通杀的,尤其是CS性能不会受到影响。
NV做了,做到了几乎我全部希望做到的东西,这让我很欣慰。
但是让我不爽同时也极端意外的是NV使用了不同的sp/cache比,重新设计了SM,而且是削减以及加大。效果好坏有待观察,但这是我个人观点上GF104唯一的瑕疵。


好吧,回这段画蛇添足的话就当是顶起这贴给0202看吧
作者: houwudong    时间: 2010-7-14 15:57
其实应该这么说——并行设计并不代表没有联系。gf100和gf104是费米构架下并行开发的两组不同的游戏构架。他 ...
mooncocoon 发表于 2010-7-14 13:32

写的比之前看到的A版之流的好多了,不会看到别人写的有错误就狂喷,或是不屑一顾,即使错了,多鼓励大家发言或者是写出正确的或者是个人的见解,估计坛子里风气会好很多(个人见解,要喷我也当看不到
作者: 608yjl    时间: 2010-7-14 16:00
路过顶顶~~~~~~~
作者: shu0202    时间: 2010-7-14 16:05
0202,我单独拿出来这个完全就是对你说的
你不是一直不满足于信息的不对等么,我挨点骂没啥,告诉你一些事 ...
mooncocoon 发表于 2010-7-14 13:38


你很敏感……不过包括我在内的不少人希望你能有比较详细的说明,而不是一句很容易引起不同理解的话……你的说明很好,这些内容不是我们这些人能了解到的。至于说我表达的对与错只是我自己的理解还有某些靠谱不靠谱的消息,我本来就不代表官方,而论坛本来就是比较自由表达见解的地方,这里面一大堆枪贩颠倒是非的水平比我强多了……我所说的胡扯不是指你说的话,而是某些人不明就里然后作出歪曲解释。不管怎么说,GF100和GF104不是两种截然分开的东西。
作者: shu0202    时间: 2010-7-14 16:12
我之前在群里说过,完美的费米游戏型,就是砍掉DP相关的ALU和寄存器,保留SFU,然后把这部分晶体管全部拿来 ...
mooncocoon 发表于 2010-7-14 15:39


NV在GF104上付出的努力比AMD对RV870的努力要多得多,力求完美是学院派的风气,但是过去的NV和现在的AMD信奉的是时间就是优势,时间就是金钱。这才是商战哲学。当然有得必有失,有失必有得,就看损失能不能够承受得住,大浪淘沙方显真金。
作者: shu0202    时间: 2010-7-14 16:17
其实应该这么说——并行设计并不代表没有联系。gf100和gf104是费米构架下并行开发的两组不同的游戏构架。他 ...
mooncocoon 发表于 2010-7-14 13:32


技术方面你是高人,能看到你写的技术方面的言论我很高兴。如果我的信口开河能套出你这样的文章不是很值么?论坛里乱七八糟的东西太多,有分量的东西太少。
作者: shu0202    时间: 2010-7-14 16:27
无论是从表面判断还是形而上分析某类运算架构的优劣都是错误的,这玩意就像是生物进化,适者生存。能生存发展获得优势的不一定是最好的,而是最适合的。当然如果市场环境发生改变,最适合的反而也最容易灭绝。所以NV和AMD都想着要主动把握市场方向,自己去创造市场环境。AMD考虑得相对简单些,拿时间换市场;NV考虑得复杂些,拿架构主导市场。当然结果都是力不从心。AMD有对他来说更重要的CPU业务,GPU这块不会全力以赴,NV则是太多东西受制于人,野心超出了驾驭能力。
作者: 66666    时间: 2010-7-14 16:35
NV在GF104上付出的努力比AMD对RV870的努力要多得多,力求完美是学院派的风气,但是过去的NV和现在的AMD ...
shu0202 发表于 2010-7-14 16:12



   
为什么GZ很多技术流大大都偏向NV,这不是偶然。CHO在04年那篇精彩的NV40测试标题就写的很明白,现实的理想主义
作者: shu0202    时间: 2010-7-14 16:46
为什么GZ很多技术流大大都偏向NV,这不是偶然。CHO在04年那篇精彩的NV40测试标题就写的很明白, ...
66666 发表于 2010-7-14 16:35


没有IBM,NV40的理想很难现实起来……这背后牵扯的东西多了。况且从NV40到G70再到G71,NV跟自己妥协了很多东西,特别是寄存器问题,当时ATi太逊了,没有实力攻击NV投机取巧的诸多地方。如今HD5000也有一堆投机取巧的地方NV不是抓住不放么?AMD为什么这么做?就是看准了这些问题到了下一代产品推出的时候还来得及弥补,这和NV当初的做法完全一样。
作者: ak75    时间: 2010-7-14 17:07
本帖最后由 ak75 于 2010-7-14 17:09 编辑

回复 28# houwudong


    +1  当然拿工资的和玩家是有区别的你要理解

论坛里本来懂技术的就不是很多,但至少大家可以讨论,而且104和100的区别,不是所有人都关注,大家现在主要是关注费米游戏版的具体性能。说道通用运算,几个普通玩家会去看得?

或者说你有比较详细的解释,可以给大家分享,而不是用尖酸刻薄的话来讽刺别人。

某a版就一幅高高在上的样子:你们都是小白,都不懂,我就是要喷你们。不就是460比别人早玩几天么?臭p的很。 那是不是在我的专业领域,我也要鄙视你这个菜bi 了?
作者: ak75    时间: 2010-7-14 17:16
回复 34# 66666


    以前感觉ati在技术上更激进,更专注,结果。。。。

nv现在也在走,当然很多时候没办法。104能这个样子,说明g92的经验发挥了巨大作用

但是以后继续这样的模式么?总是比对手晚上市,同时再推出衍生版?市场很难说了
作者: 66666    时间: 2010-7-14 17:36
回复 37# ak75


   
作为一个纯玩家,大家只需要关心自己能承受价位最好的卡就行了。作为一个N饭,我觉得从GF104可以看出NV的生命力还是很强的,近2年还无需担心其倒闭
作者: cardex_sp    时间: 2010-7-14 17:41
gf104的立项不仅独立在GF100之外,开始时间也跟GF100不相上下。NV在tesla发布之后直接把费米组分成了两个规模相当的团队同步进行,投注的资源也是相当的,甚至由于弄了某个小玩具,104这边还在前不久追加了很多EDA资源进去,这也就是为什么会有好像是开玩笑是的Plan B这种说法。
我觉得这是很现实很实在的支撑GF104与GF100平行进行的证据
mooncocoon 发表于 2010-7-14 13:32

这个绝对是瞎说。
作者: 晨之晖    时间: 2010-7-17 10:26
NV转型成败在此一举
作者: ddbaba    时间: 2010-7-17 11:31
提示: 作者被禁止或删除 内容自动屏蔽
作者: spy_j    时间: 2010-7-17 17:55
回复 33# shu0202
我很赞同~~~~




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4