POPPUR爱换
标题: 必须用掌声向AMD予以它应得的赞誉 HD5000背后的故事 [打印本页]
作者: phehoo 时间: 2010-2-26 19:40
标题: 必须用掌声向AMD予以它应得的赞誉 HD5000背后的故事
第1页:让人心焦的电话结果很值得
我与AMD公关“爱恨交加”的关系去年一直在持续,但近来,“恨意”全无。让我们回到2009年的夏天,那时,我已经等AMD的电话等了好几周了。我们知道RV870将在年底前的某个时候发布,而且在我们得到新显卡前大约一个月左右,就已被正式的告知有关新GPU的相关情况了。
有谣言说新显卡的发布会推后。但就像钟表机械有规律的活动一样,在去年6月亦或7月的一天,我接到了一个电话,是我的老朋友Chris Hook打来的,他是AMD的公关。原来他是想邀请我参加一个在加利副尼亚沿岸的一个航母上举办的新闻发布会。
美国“大黄蜂号”航母,新GPUs就在那儿
唉.........!倒不是我对航母不感冒,因为我所关心的只是期待已久的RV770的后继芯片。毫无疑问,RV770是我对ATI显卡重树信心的GPU,这也是去年6月对其它人造成重大影响的GPU。但忽悠也不是这么玩的吧,AMD向它的管理层和合作伙伴承诺,他们将在一个房间里(或者航母上)举办一场隆重的发布会。他们还许诺可以在发布会上采访他们的工程师,能得到非常有用的信息,而且还有免费的饮料。
我可不是免费饮料就能轻易打动的人,但Chris Hook很了解我,他知道我更想要什么。
我很不情愿的提早离开晚宴,因为华硕董事长施崇棠也在那里,在他离开前只有一次和我见面的机会。只要我们俩人在相同城市时,总是千方百计要碰下面,而这次我也不会让他失望。Steve Jobs(苹果公司创始人)取得了极大成功,他掌控着一个产品名声响誉全球的公司,因为本质上他是一个与产品打交道的人。有趣的是,施崇棠本质上说也是一名工程师,他运营的公司因为一直以来在电子工程设备制造方面的卓越成就而响誉海内外。
等我的车就停在外面,我确信已将刚才晚宴时记下的13页稿件保存好后,合上笔记本,然后与Chris Hook握手告别。在我离开前,Chris Hook说“最好不要报道关于我的故事,是成百上千的工程师的辛勤工作,才换来了这个芯片的诞生。”
就像施崇棠,Carrell Killebrew(AMD绘图产品规划总监)也是其自身诸多特点的集合体,这些特点让他在这个行业里与众不同。所有了不起的人物都是这样,他们都有个人的经历,这些经历将他们融入了至今为之奋斗的公司。他们也有自身的一些个性,当这些个性特点结合在一起时,会让他们卓尔不群。Carrell Killebrew,是集智慧、实用主义、激情和谦卑于一身的人,这种人非常少见。他的一个信条是,你应该总是期待别人有最好的表现。如果你期待的不是最好表现,那么在他们身上,你得到的永远也不会是最好的结果。这是对人进行价值判断时的积极因素,不可思议的是这个因素带来的效果只让Carrell失望过一次,也许他比大多数人都要幸运。
Carrell并不参与设计RV870,他不做摆弄仪器设备的工作,而是如何确保RV870能够取得成功。接下来将要讲述的,只是RV870 GPU(Radeon HD 5800系列)故事中的一小部分而已。之所以称它只是故事的一小部分,是因为这篇文章只用了8000多个单词,但实际发生的事情却历经数年,是成百上千工程师呕心沥血,辛勤努力的见证。就像其它的GPU(甚至Fermi),这款GPU的研发已成了这个行业中一些最杰出工程师一生中最重要的工作。他们是这个行业的骄傲,我希望能够竭尽所能把他们的故事
作者: ft5555 时间: 2010-2-26 19:41
掌声没用,lz买几块回来上连发票一起上图才是王道
作者: phehoo 时间: 2010-2-26 19:42
第5页:调整方向与延期计划
Carrell不相信造大芯片的那些怪论,不是因为大芯片造起来太难,而是这会让一个$600的GPU变成$200 的GPU的时间大大加长。AMD相信最重要的市场是更大(数量和收益两方面来说)的性能级主流显卡市场。
与其制造$200— $300价位的显卡,然后坐等新的工艺,不如先发布一个主流性能级的显卡,然后再此基础上再划分/制造更昂贵或更便宜的市场/显卡。
RV770的风险在于架构和显存技术,而RV870的风险在于架构和制程,而制程完全不在AMD的控制范围内。
在早期,Carrell就相信台积电的40nm制程还不够成熟,即使可以使用,但代价要比预期的高得多。那时Carrell在这一点上倒并没有大做文章,他告诉我在那时有大量被“某种水产”的信息,这些信息都表明台积电的40nm制程看起来比实际用起来要便宜些。这点我在下文中还会谈到。
Carrell极不情愿的继续着那个造一个大于400 mm2 的(20mm×20mm)RV870的工作,因为他相信当硬件工程师如梦初醒,意识到造这样一个芯片并不便宜时,他们又要再一次进行讨论。
2008年早期,在进入2月份的时候,台积电开始发出种种暗示:关于40nm制程的成本,ATI不要过于兴奋。ATI对于将要耗费的成本,在先前可能还是有点乐观情绪,但从台积电返回的工程师说,RV870的制造成本将会非常昂贵,并建议重新考虑芯片的架构。于是,他们实实在在的再次进行了讨论。
团队再次碰头,并坚持沿着Rick Bergman的“妥协方案”前进:RV870的性能要达到RV770的2倍,但芯片面积必须降下来。ATI在2008年3月修改了Cypress(高端,单芯RV870)的架构。
这就是新ATI的真实一面。他们既不想迟滞原定计划,也不想放弃设计最大GPU芯片的可能性。然而为了要保留这种可能性,原定计划必须做出牺牲——延期!
你必须明白,都这么迟了,在芯片发布一年半前,还在修改芯片的架构,这会把一切都搞砸。在RV770完成的时候,RV870却连八字还没一撇。任何修改,即使时间上比当时还早一年,也会打乱很多计划安排。必须重新设计芯片平面图和修改架构,必须做大量的调整。这至少得花几周的时间,有时得几个月的时间,来做这些调整和修改。这种调整会影响到原定的计划,ATI不得不努力想尽办法尽量减少这种调整带来的影响。因为这个变故,Radeon HD 5870比原定计划大约晚了30 – 45天。
还记得ATI 的“无论发生什么事都不能让计划延期”的政策吗?让工程师团队和Rick Bergman临时接受花一个多月的时间来重新设计RV870的现实,是需要很大勇气和毅力的。“如果不能直面挑战,那么默认你已认输了”。这就是ATI为什么敢于冒这个风险,同意重新设计Cypress的原因。
理解这一点非常重要,因为这点也在某种程度上暗示着NVIDA也下意识地做出了延期推出Fermi的决定。ATI不是唯一一个知道DX11/Win7面世时间的公司,NVIDA也很清楚这点,宁可错过这个市场增长点,也要对延期Fermi面世的新特性的优先级进行排序。没有遇到预先警告,这些GPU是不会延期的。AMD冒着产品延期发布的风险是为了制造一个小点的芯片,而NVIDIA冒着产品延期发布的风险是为了制造一个大点的芯片,两个公司走的路截然不同。 
实际的RV870
工程部纠结无比,RV870要比先前小很多,但却要有2倍于RV770的计算能力,那么一些特性必须要砍掉。
第6页:Carrell对Sideport说再见
老实说,能与Eric Demers和Carrell Killebrew共进晚餐是我与ATI工作的美好经历之一。在Pat Gelsinger 离开英特尔前, 我过去常与他共赴年宴。这些人真让人不可思议,Demers和Killebrew像Gelsinger一样才能禀赋并富有激情,能和他们同坐一张桌子,让我感到自己很幸运,感到更应该珍惜这份工作。
Eric告诉我,他们是如何将RV870从超过400mm2 减到334 mm2 的,而且最终产品又是多么棒。我打断他,想知道更多细节。我想请他举个例子,举个那种他们非常想设计进GPU里,但又不得不舍弃的特性的例子。工程部人员很少告诉你他们抛弃了什么,而市场部的人则更喜欢关注芯片里有什么,他们会让任何事情都听起来更像是运筹帷幄,早有胜算的样子。谢天谢地,市场部的人没和我共进晚餐。Eric把脸转向Carrell,对他说:“我想有一个特性我们可以说说”,那就是“Sideport”
Carrell 回应,“哦,我的天,这太不公平了” (注,Carrell说这话的时候语气听起来可不像是清纯少女,想像一下,他说这话的时候可是十足的工程师味儿)
当 ATI第一次谈及Radeon HD 4870 X2时,他们告诉我有一个叫做“Sideport”的特性,这是每一个RV770 GPU芯片可用来进行芯片间通信的端口。 
原本准备使用的“Sideport”
当交火任务以交替渲染模式进行时,芯片之间并没有通信产生,当不得不进行同步渲染时,性能也随之降低。“Sideport”的作用就是用来缓解这种性能下降情况的。
不幸的是,由于功耗原因,Sideport 从未在4870 X2上得到使用。ATI在设计公版时把它禁用了,所有的其它厂商也把它禁用了。Sidepor是Carrell Killebrew喜欢的特性,但他不得不舍弃。
在2008年早期的时候,ATI意识到他们不得不把这个芯片的边长从20~22mm砍至18mm,每个人都不得不有所放弃才行。Carrell是最提倡设计一个小点的RV870 的人,他不可能做一个虚伪的人,不放弃任何东西。
我不能在文章里长篇累牍的描述我和Carrell之间关于这个特性的谈话。“Sideport”本将在RV870里发挥作用的,但只可惜它不在里面。他还告诉我,如果不定哪天再次看到了“Sideport”也不要感到奇怪。Carrell不是个轻言放弃的人。
作者: phehoo 时间: 2010-2-26 19:42
第7页:ATI如何6个月内发布4款GPU?
在众多员工,即便Carrell也一样,经历了诸多的艰辛工作和牺牲之后,ATI将边长为22mm的RV870芯片削减成为大约18mm x 18mm的芯片。问题是,RV770的芯片边长大约只有16mm,RV870的芯片面积仍然太大了。
Carrell想对芯片面积再进行更多的削减,但有两个因素让他改变了想法。一是,如果想要在RV770芯片大小的面积上造RV870,ATI就不得不将这个芯片的面积砍得更小,砍掉的面积大小甚至超过了Carrell 原先的设想。另一个因素是,必须要削减掉一些着色渲染核心(流处理器)。
为了让GDDR5显存以ATI为HD5870设计的目标速率运行,芯片上类似物理运算的这部分也必须要有相当可观的提升才行。如果芯片边长要达到16mm, ATI要么缩减显存带宽,要么缩减流处理器的数量。这两种方案都会让RV870的处理速度变慢。
我问Carrell ,如果芯片的边长只有16mm,是否会让发布时的RV870售价便宜$100 ,达到和RV770发布时的售价一样,他说不会。直到很久以后我才搞明白为什么,但这个具体原因我以后再讲。
为了达到16mm x 16mm 的芯片面积而牺牲性能的情况并没有发生,但这次让Carrell信服“设计一个大点的芯片是可行的”根本原因是,ATI在不到6个月的时间内发布4款不同的40nm DirectX 显示芯片的能力。ATI拥有这种能力,但它得到的赞许还远远不够。
记住,Carrell质疑造大GPU的合理性,是因为大多数消费者要等待更长的时间才能买到大GPU的衍生产品。看看G80或GT200,等了多长时间才造出其衍生出的中低端产品吧,谁又知道我们什么时候才能看到$150的 Fermi/GF100衍生产品呢? 
但ATI的工程部承诺了两件事。第一,Cypress会有一个大约能同时准备就绪的称为“Juniper”的后续产品。第二,另外两个GPU也会紧随其后,整个新一代产品线将在不到6个月的时间内布局完毕。ATI在2008年接近3个月的时间里发布了3款GPU产品,但HD4000系列的第4个成员直到2009年4月才发布。
这不是一件做不到的壮举。ATI有多个协同工作的设计团队,在印度/中国有大量的工程设计资源。对Cypress和Juniper的设计工作一前一后的展开,假设没有会使研发工作中断的大的缺陷出现 ,ATI就能够极大的拓展两个设计团队在设计同样硬件(Juniper 的规格只是Cypress的一半)方面的工作效率。.
要冒这样巨大风险的想法让Carrell感到不安。要并行的设计两个GPU芯片,对于同一代的芯片而言,风险着实不小。如果一切都非常顺利,可以在同一时间设计出两种芯片。反之,就会把两个设计团队都拴在同一代产品上,产品的延期会让ATI吞食自己的“Fermi”苦果。
最终让Carrell接受这个方案的原因是工程部的人告诉他,他们能够实现这个目标。Carrell 信任和他共事的人,他认为如果你期待你周围的人有最好的表现,那么他们就会表现得最好。他不可能让自己怀疑设计部的人正给他提出的方案。Carrell惴惴不安的在方案上签了字,“常绿”家族就这样诞生了。 
Cypress和Juniper几乎是同时交付的。实际上,Juniper比Cypress还稍早一点就准备就绪了,样卡在ATI发布HD5000系列几个月前就交到开发人员手里了。Cedar和Redwood也接踵而至,更不要说一个双Cypress的Radeon HD 5970了。所有的这些都在6个月不到的时间内就完成了,而且准备就绪(芯片本身在4个月内就准备就绪了)。
当烟幕散尽,ATI $600, $400, $300, $200, $150, $100 和$60的新DX 11产品也整装待发。Windows 7/DirectX 11带来的市场增长点,被ATI牢牢抓住,恰如其时,恰如其分。第8页:跃进到40nm制程所付出的代价
故事的这一部分本可以独立成章,但因为它直接影响到了Cypress和整个“常绿”系列显卡,所以还是值得说一下。
到目前为止,你肯定已经听说了不少关于台积电40nm制程的事情,这些事情其实都已经过去了。良率极差,改进缓慢,这导致了去年Cypress核心显卡的缺货和NVIDA Fermi/GF100的延期。在接下来的几页里,我想谈谈向40nm制程迈进以及为什么这个迈进如此艰难的事情。
作为一个无工厂半导体公司,当你试图推出新产品,在寻求销售伙伴时,你会有不止一个选择。除了与显存公司、元件制造厂商以及拥有你所需要的知识产权的家伙打交道外,你还得与第三方,也就是实际上帮你制造芯片的代工公司打交道。糟糕的是,差不多每年,你的代工伙伴就会跑过来向你兜售新的制程,让你使用。
兜售手段总是大同小异:这个新制程更精细,制成的芯片要小很多,但运行得更快,功耗更低。就像任何公司的推销员一样,你的代工伙伴总是希望你能尽快的使用他们最新和最棒的制程。在计算机行业里,这一点儿也不鲜见:他们总是希望你能先行购买他们的产品,但实际上你想要的产品还根本未准备好,但他们在推销时毫无惧色。
通常发生的情况是,你的代工伙伴会找到你,给你出示一个列满设计标准和各种注意事项的目录。如果你动心了,他就会向你保证他们能为你生产出那种芯片,而且生产出来的芯片肯定可以使用。换句话说就是“ 照我们说的做,你的芯片肯定能够量产”。 
Global Foundries' 2010 – 2011制程路线图
问题是,你即便遵照全部这些设计标准和注意事项,新的芯片也不会比以旧一代制程造出的芯片快多少,良率还差不多。因为想到有这些“注意事项”护航,在设计芯片时,你会变得更大胆,这样一来你付出的成本反而要高不少。
通常情况下,在两个制程节点之间,晶元的大小不会发生变化。之前我们一度使用200mm的晶元,现在更先进的工厂则使用300mm的晶元。然而晶体管的大小确实在不断缩小,因此理论上,随着制程的进步,你在一张晶元上可塞入的核心晶片也更多。
新制程也会带来问题——每张晶元的价格也在上涨。因为是新制程,也就意味着复杂程度可能也更高,因此晶元的成本也高。如果晶元的成本高50%,为了和旧一代制程的晶元成本持平,你在每一张晶元上就要至少多塞入50%的核心。现实中,在新制程的晶元上,你实际上得塞入超过50%的核心才能持平,因为新制程的良率开始都很低。但如果你相信代工伙伴的话,所谓能保证量产, 那么你的成本可能连持平都难。
最终的结果就是,你转向新的制程,但得不到任何收益。对于实际上想利用摩尔定律来实现收益的公司来说,尤其对GPU公司来说,这不是一个好的选择。
对于这个问题的解决方法就是,在你的公司里一定要有非常有头脑的人,他能够审慎的对待代工伙伴提供的这些设计标准和注意事项,能够决定哪些是可以忽视的,他还能找出对那些需要重视的方面的针对性解决方案。在这一点上,ATI和NVIDIA有着天壤之别。
第9页:制程vs架构: ATI与NVIDIA的不同
从NV30 (GeForce FX系列)的挫折以后,NVIDA就再不是第一个过渡到新制程的公司。不是让硬件工程师把更多的精力放在制程技术上,相反,NVIDIA是选择把它更多的资源放在架构设计上。而ATI则正好与NVIDIA相反。ATI对于新制程节点倒并没有NVIDA那么恐惧,因此它把更多的工程设计资源都放在制造方面。这两种方案都不正确,都有利有弊。
NVIDIA的方案对于一个成熟的制程来讲可以运用得很好,这个方案也意味着在重要的两个制程间(例如,55nm至40nm)转换时,NVIDIA的竞争力会弱些。因此,它需要花更多的时间来把它的架构设计的更有竞争力才行,你只需要在架构方面投入更多就可以了。ATI在RV770上投入的努力主要是在架构设计上,结果也没有让ATI失望,对比RV670便知。
NVIDIA以史为鉴的认为,应该让ATI冒所有的风险去尝试新制程。一旦制程成熟了,NVIDIA也将转向这个制程。这个想法对NVIDA来说非常好,但这也意味着在使用全新的制程方面,ATI将拥有更多的经验。因为ATI把自己置于一个早于竞争对手尝试未经检验的新制程的处境里,为了降低风险,ATI 就必须让更多的硬件工程师致力于了解制程技术。
在与我交谈时,Carrell很快指出制程间的转换不能称之为过渡。过渡意指从一项技术到另一项技术的平稳转移。但在任何晶体管主要制程节点之间的转换(例如55nm到45nm的转换,而非像90nm到80nm的转换)过程不像是过渡,到更像是跃进。你在跃进前就要做准备,你会尽力在落地时力求毫发无损,但一旦你的双脚离开地面,你对落地的情况就很难控制了。
在任何制程节点上进行跃进都会冒很大风险。作为一个半导体制造商,诀窍就在于如何降低这种风险。
在某种程度上,两个制造商都不得不使用新的制程节点制造芯片,否则他们就要承担守旧落后的风险。如果你落后了不止一代制程,那么这场竞争游戏你就输了。问题是,在使用全新制程上,你要设计制造什么样的芯片?
这儿有两种流派:大跃进或小跃进。这儿的“大或小”是指你在“跃进”时所使用的芯片面积大小。
小跃进的支持者相信下述情况:在新制程里,芯片缺限率(晶元上每单位内的缺陷数量)(与良率相对)情况不会很好。在整个晶元上会遍布大量的有故障的芯片,为了降低良率造成的影响,你需要使用小一点儿的芯片。
如果我们有一张能够塞下1000个芯片的晶元,这个晶元表面上有100个故障芯片,那么每个芯片出现故障的机率就为10%。 
一个假想的晶元,小芯片设计,上面有7个故障芯片,单个芯片受故障影响很小
大跃进的情况自然相反。你在大芯片上使用新制程,现在不是1000个芯片中只会有100个故障芯片了,在只能塞下200个芯片的晶元上,可能就有100个故障芯片。如果故障芯片分布均匀(实际上是不可能的),每个芯片出现故障的机率现在就成了50%......................

一个假想的晶元,大芯片设计,上面有7个故障芯片
光就量产方面来考虑,没有理由去选择大跃进。但选择大跃进的方案也有好的理由。
选择大跃进最显而易见的理由就是,你能够靠制造大芯片获得好处,比如实现在性能上胜过竞争对手,这样可以比制造小芯片获取更多的利润。
另一个不那么明显但甚至更重要的选择大跃进的理由,实际上是因为并不喜欢大跃进的理论。因为大芯片时常陷入失败境地,所以大芯片也更容易暴露制程的问题。失败几率越大,你在过程早期了解其缺点的机会也更多。
对产品来说是要冒很大风险的,但这也给了你很多知识经验,在今后,你在采用同一制程的产品上可以用到这些经验。
作者: phehoo 时间: 2010-2-26 19:43
第10页:回报:RV740是如何拯救Cypress的
ATI在其路线图中选择了比较有意义的最大的架构来制造其第一款40nmGPU,这就是RV740(Radeon HD 4770)。 
ATI第一款采用40nm制程的芯片,Radeon HD 4770, 2009年四月发布
相反,NVIDIA选择了一个小一点儿的芯片来试水40nm制程。RV740芯片面积为137 mm2,而NVIDIA第一批40nm GPU是芯片面积分别为57 mm2和100 mm2的GT210与GT220。G210和GT220在上市的头几个月都是仅供OEM的产品,我想OEM订单中GT 210占的比重比较大。注意,直到GeForce GT 240时,NVIDIA才使其40nm芯片的面积达到RV740的芯片大小。GT 240在2009年11月才发布,而Radeon HD 4770 (RV740) 在2009年4月就发布了,比GT 240早了7个月。

NVIDIA第一批40nm GPU在2009年7月才开始出货
当ATI和NVIDIA同时开始在高性能GPU上试水40nm制程时,ATI在台积电的制程方面和大芯片问题上拥有更多的经验。
ATI绘图工程部的副总裁王启尚,在那时就已对台积电的40nm制程问题感到担忧了, 他早在设计RV740的过程中就把他的担心向Carrell吐露了。王启尚担心在芯片制造过程中金属加工处理方面的不成熟可能导致连接(芯片内不同金属层之间微小的联接物)出现质量问题。40nm制程中的这种连接故障率非常高,足以影响到采用此种制程的产品的生产。即使这些连接不会都出现故障,连接的质量问题也会导致通过这些连接的信号效率有所下降。

AMD绘图工程部的副总裁-王启尚
对台积电40nm制程的第二个担忧是关于芯片晶体管构建差异度方面的。在半导体设计中,你必须要考虑到成千上万的晶体管的差异度。对于任何一种制造,芯片与芯片之间晶体管的差异也是千差万别。王启尚实际上担心的是晶体管通道长度制造上的差异,他担心台积电根本达不到它给ATI提供的允许公差范围。

一个标准的互补型金属氧化物半导体晶体管,它的尺寸通常有非常严格的公差范围
台积电让ATI要相信,晶体管通道长度之间的差异将会相对来说很小。Carrell和设计团队对此都感到不安,但却无可奈何。
金属层之间的连接问题容易(但代价也很大)解决,王启尚决定将RV740芯片内部金属层之间的连接数量翻倍,但凡在RV740芯片两个金属层中间有连接的地方,在设计时就多设计1倍的连接数量。这会让芯片变得大些,但也比芯片造出来时无法工作好。然而晶体管通道长度的差异性却没有马上就能解决的办法——这是他们担心的地方,但也许可以说是莫名的害怕。
台积电开始制造第一批RV740芯片。当芯片拿回来后,它们运行时的温度比ATI预期的还要高些,而且漏电率也超预期。工程设计人员开始工作,他们把芯片拆开,逐一对其中的部件进行分析。没要多久,他们就发现晶体管长度的差异度远远超过了原来的公差范围。如果通道长度的差异度达到一定程度,芯片中一些部件的运行就会慢于预期,而其它一些部件的漏电现象也会更加严重。
工程设计人员最终找到了一个方法,通过改变RV740的设计,修复了漏电的大多数问题。性能仍旧是一个问题,RV740作为一个产品几乎失败了,因为修复所有这些问题所花费的时间太长了。但其实RV740在ATI试水40nm制程方面承担了重要的角色,它担负了“清道夫”产品的职责,为Cypress和“常绿”其它成员走向成功做了很好的铺垫。
所有这发生的一切对NVIDIA也适用吗? 这当然很难说清楚。但传言似乎都认为NVIDIA根本没有ATI在40nm制程上的那些经经验。去年12月,NVIDIA公然抨击台积电,要求台积电在芯片金属层连接上要达到零缺陷。
围绕Fermi的那些谣言,也表明NV在Fermi上也遇到了ATI在RV740上遇到的同样问题。良率偏低,芯片发热量大于预期,核心时钟频率低于原定目标。得承认,我们还未看见任何GF100芯片,因此对于任何一种谣言,都无法确定。
当我问为NVIDIA为什么Fermi/GF100会延期这么久,NVIDIA把其归咎于一些架构部件无法制造。当然,我当时问的是一位架构师。如果Fermi/GF100实际上只是NVIDIA用来获取台积电40nm制程的经验的,那么我估计其后续产品应该会顺利许多。
不是台积电不知道如何运作一个制造工厂,可能是它在向40nm制程跃进时,步子迈得太大了。 
你可能还记得关于Cypress的讨论,Carrell深信台积电的40nm制程实际使用的代价比预期的要高得多。然而,不管是在ATI还是在NVIDIA,很少有人相信这一点。我问Carrell为什么会是这样,为什么他能预料到很多其它人不知道的事情。Carrell把它归结于经验,他还详细讲了一些我在文章里不便说的事情。不必说,他对台积电在40nm制程上的
作者: phehoo 时间: 2010-2-26 19:44
第11页:防泄密工作:“宽域”如何产生(一)
Carrell Killebrew 还为这个显示“视界”做了一件事情。他一个人独自担负起了把“Eyefinity”(AMD起的中文名叫宽域)技术嵌入“常绿”系列显示芯片的责任。
事情还得从头说起。显卡厂商一般都会问他们的客户,他们希望显卡拥有什么样的特性。笔记本销售商希望GPU能够有6屏显示输出的功能,尽管他们实际上只需要2个屏幕能同时显示就行了。2个显示通道能够用于液晶屏,2个显示通道能够用于其它的输出(VGA + DVI/HDMI) ,2个可与笔记本接驳平台连接器相连。
Carrell想,如果拘泥于这些输出限制而不能同时驱动6个显示通道进行工作,这无疑让人感到遗憾。因此他有了一个计划:任何一张“常绿”显卡都要至少能驱动3个显示屏。高端的显卡将同时支持6显输出。
Carrell渴望实现这个特性的愿望并非是凭空幻想出来的,他确实有一个明确的目标。他希望在未来6年里(即从2010到2016年),第一代的全像显示屏能够面世而且能正常工作。第一代的全像显示屏将由1个180度曲面型的半球状显示屏以及两个安放位置适宜的精密相位音源组成。当然我们也需要强大的像素推动力来让这个显示屏显示的画面能够达到栩栩如生的效果,这需要共计至少1亿像素 (7百万像素在你眼睛正对的前方,其它的像素则用来填充画面上的其它部位) ,或者说要达到几乎单个30”显示屏像素的25倍才行。 
我们还没生活在2016年,因此Carrell觉得必须从某个地方开始做起了。而这恰恰就是“常绿”显卡家族中每张单卡最少支持3屏输出,最多支持6屏输出。今天我们知道这个技术叫做“宽域”,但在AMD内部,Carrell称它“太阳黑子”。
Carrell不想让任何人知道“太阳黑子”,因此他没有把这项技术特性放在Cypress的《产品必备特性》(PRS)里。当工程部的人正苦心制定PRS时,他通过一些非常机智的手段,没让他们了解到这个神秘的特性,甚至当他们消减这款GPU的芯片面积时,他还设法让它躲过了这一劫。他知道一旦任何人得到点风声,他们就会在消减芯片面积时让他“扼杀”这个特性。更糟的是,除了仅有的几个了解这个特性的可信赖的人之外,如果其它任何人得到点关于它的蛛丝马迹,那么有可能NVIDIA就有时间抄袭并实现这一特性。Carrell的目标就是要尽可能的保守这个秘密。
他定了一个名单,只有那些切实需要了解“太阳黑子”的人,他们的名字才会出现在这个名单上。如果你的名字不在名单上,不仅你了解不到“太阳黑子”,而且那些知道这个工程计划的人也不能在你身边讨论它。AMD建立了一个内部网站,上面有每一个需要了解“太阳黑子”的人的姓名。
除了定名单,他还定了规矩。
就像我刚才提到的,名单上的人不得在任何非名单上的人可能偷听到的地方谈论“太阳黑子”。如果你想把某个人列入名单,必须要得到批准才行,最终的决定权在Carrell Killebrew手里。
“太阳黑子”的项目工程师开始着手开发这个新特性,只有当绝对需要的时候才吸收其它人进入项目组。这个项目组每次只吸收一个人,最后逐渐达到稳定状态。软件工程师直到最后一刻才被告知有“太阳黑子”这个特性存在。Carrell只给了他们足够的时间来实现“太阳黑子”的特性功能,他们事先并不知情。
Carrell找到David Glenn,ATI软件工程部的负责人,问他,他们可以提供工程师来完成这个特性开发任务的可能的最晚日期是什么时候。David给了他一个日期,Carrell又向他要一个必须知情人的名单,David说了三个人的名字。在那天,“太阳黑子” 项目组把这三个人召集到一起,然后说“我们需要告诉你们一些事情”。不必说,对于Carrell的秘密,没人感到高兴。ATI的一些高层领导知道Carrell正组织人捣鼓些什么,但他们就是不知道那到底是什么东西。

归根结底,是这个软件成就了“宽域”技术
当Carrell 在他自己的办公隔间里时,他总会说起“太阳黑子”,他称它为“特性A”。Carrell有些偏执,但是是有原因的。原来在Carrell 隔间对面坐着的人,现在已经离开ATI为NVIDIA工作了,那时“太阳黑子”项目已经展开了有几个月了。在“太阳黑子”项目开展期间,总共有3个人离开了ATI,选择为NVIDIA工作。Carrell很自信,NVIDIA对ATI正在开发的新特性完全不知情。
除了以上明显的的可能导致泄密的原因以外,Carrell 还面临另一个棘手的情况。为了能够让“宽域”工作,还得取得其它厂商的支持才行。如果你还记得,在Radeon HD 5800系列发布时,三星宣布了它的窄边显示屏,它的1屏、3屏组合或6屏组合可以为专门搭建“宽域”而进行搭配销售。当与像三星这样的OEM厂商进行合作时,不可能再为“太阳黑子”保密了,这会是一个极大的风险。ATI内部人员向NVIDIA泄漏“太阳黑子”秘密的可能性已经不小了,更不要说与双方打交道的OEM厂商的员工泄秘的可能性了,这是肯定的。
在研发GPU的过程中,像“太阳黑子”这种特性在开发期间还能做到神不知鬼不觉,这真是闻所未闻的。Carrell 甚至制定了一套分级系统。黄金级保密标准,是指保守秘密直到发布。如果能将这个秘密保守到显卡发布,这就是黄金级保密标准。如果能保守秘密到芯片流片回来以后,就是白银级保密标准。如果能保守秘密到芯片流片前,这就是青铜级保密标准。到那时,NVIDIA将至少落后ATI一整个产品周期。
最终,Rick Bergman,AMD绘图部门总经理,承诺保守“太阳黑子”的秘密至青铜级保密标准,但他告诉Carrell,当到了芯片流片的时候,他们将要严肃认真的谈谈这个事儿。
第12页:防泄密工作:“宽域”如何产生(二)
时间在一点点的接近,“太阳黑子”项目也在继续,Carrell和项目组成功的将这个秘密保守到了青铜级。芯片流片了,没人知道Carrell的“宠物”项目工程。青铜级保密标准日期刚过没多久,Rick就让Carrel谈谈此事。在与他们关于“太阳黑子”项目和杀手(Cypress)的谈话中,有三个客户真真的受益匪浅,这种谈话也会帮助ATI变得更有竞争力。
Carrell 真的不想冒风险将“太阳黑子”的秘密走漏出去,但他知道为了让这项特性走向成功,他需要OEMs参与进来。方案就是将OEMs中需要了解“太阳黑子”项目的人也列入名单,那些规矩对他们也适用。ATI还与他们签了不同于已有NDA的单独的NDA。AMD法务部门视“太阳黑子”技术为私有知识产权,如果OEM中任何其它人需要了解这个技术,他们首先需要获得许可才行。为了确保任何的泄密都有据可查,Carrell就三个参与 “太阳黑子”项目的OEMs给出了不同的项目名称。
在Cypress发布的前几周,其中一个OEM的首席执行官看到了“宽域”技术,他想把这个技术展示给其它人看看。但即使是首席执行官想与他人共同欣赏这个技术,他的请求也必须得到同意才行。令人不可思议的是, 三个OEM厂商都严格遵守协议,就Carrell所知,这个技术从未走漏风声。

NVIDIA的三屏幕环绕显示技术需要使用两张显卡
NVIDIA在今年的CES上也展示了自己的三屏显示技术,这是一个纯软件解决方案。每个GPU仍只是局限性地双显示通道输出。我问Carrell如何看NVIDIA的解决方案,他总是很实在。

“宽域”技术可让单GPU实现3屏显示输出
ATI 以前曾考虑过纯软件解决方案,但最终由于一些原因把它否决了。如果使用纯软件解决方案,你需要拥有一个多GPU系统,这意味着更贵的主板,更贵的电源以及更繁琐的配置方式,而且还要考虑性能表现方面。
一种情况是,如果你用一张卡驱动一个显示屏,另一张卡驱动另外两个显示屏,那么会出现明显的不对称。这会造成一些奇怪的问题。另一种情况是,三个显示屏的输出都来源于一张单卡,你要么通过PCI-E,要么通过交火/SLI连接线,将一个GPU中的显示数据以交替帧的方式发送至另一个GPU中。如果要搭建6屏显示系统,Carrell担心带宽不够,运行不了那么快。
还要考虑游戏兼容性的问题,这也是为什么ATI对软件解决方案不感兴趣的原因所在。虽然我很快指出在当今的很多游戏中,运用“宽域”时会出现明显的视场和屏幕高宽比问题,Carrell同意这点,但他说这已经比他们预期的要好很多了,也比用纯软件解决的方案好得多。
在这儿不能轻视ATI软件工程师所付出的努力。当Carrell还是负责“太阳黑子”项目的最初的三个人中的一员时,他们并不是能把这项特性开发得非常棒的人。用Carrell自己的话说是“最后,是我们的软件工程师团队做出了关键性的贡献。”太阳黑子’所具有的特征更多的是软件特征,而不是硬件特征”。 尽管ATI的软件团队直到这项特性在植入硬件后才得到相关信息,但他们才是负责“太阳黑子”后期开发并将其成功打造/调试成“宽域”技术的关键。
围绕“太阳黑子”所做出的那些保密措施很荒唐吗?这可不是Carrell用来消遣的。AMD已经将Carrell的信息保密分级方法融入了其对未来其它特性的管理方案中。我真的想知道Carrell是不是设法获得了苹果的那套保密方法。
作者: phehoo 时间: 2010-2-26 19:44
第13页:必须用掌声向AMD予以它应得的赞誉
因为这并不是一个产品评测文章,我能得出的结论不多,无产品导购、也无性能总结。即使这是一篇分析文章,就我从这个故事中获知的东西来说,也没有什么要总结的。去年我就已经知道,ATI已经对GPU设计采取了一种新的,重新定位的态度,那时仅得知他们在研发RV870时几乎抛弃了以往的那些经验。预备在今年晚些时候推出的“北岛”新一代GPUs,在人们还不知道RV870会如何登场前,就肯定已经在设计了。更别提Fermi/GF100了,它们延期这么晚都还没发布。 
我不确信从过去一直到RV770或RV870的迄今历史,能告诉我们我们应该对“北岛”这一代GPU产生什么样的期许。虽然我们不能对ATI的未来产品作结论,但对于AMD的图形部门是如何工作的,在这方面,我切切实实了解到了非常多的情况。
Carrell告诉我,做产品的过程不是一个合乎逻辑的过程,虽然有逻辑在里面,但它确实不是一个合逻辑的过程,这是一个充满变数的过程。那不是一种矛盾感,而是那种当所需的技术资料还不齐全的情况下,却还要开发新的技术特性的无所适从感。当像AMD或NVIDIA这样的公司做一个产品的时候,工程师们并不会知道这个产品的所有答案,他们的认知并不是二元的——它是可能性,是衡量,是臆测。
有时他们能猜对,有时他们却完全猜错。他们能竭尽所能的就是根据他们的人个经验进行权衡,找到各种假设情况,然后去实践。历经数年,似乎ATI已经学会尽可能的让其团队的所有成员都能够投入到他们的产品研发中,并为产品的研发出谋划策,贡献出自己的力量。
绘图团队的奉献和经验似乎在AMD这一代GPU跃进到新制程技术的过程当中得到了回报。从台积电到Global Foundries 的代工转移肯定又会让他们再一次面临挑战,尽管这个挑战还不全是制程技术方面的。除了指令系统外,公司更需要的是团队对于计划和执行力的专注。
Carrell Killebrew帮助ATI从一个业绩糟糕的传统的GPU公司转变成了一个因其执行力而众所周知的公司。这三代GPU产品的研发都非常成功。不管你是A饭,I饭或N饭,你都必须向AMD抱以掌声,予以它应得的赞誉。过去几年,AMD绘图部门已经向我们展示了其激动人心的转变。从R500和R600 GPUs时期的摇摇欲坠,到RV670、RV770和RV870时期,一年年的稳扎稳打,一路走来,是值得称赞的。我们都想知道,AMD的CPU团队在执行力方面是否能向绘图团队学习。我们真的希望,伴随收购ATI的,是那种能够相互学习的开放性思维。
作者: kingdom1943 时间: 2010-2-26 19:55
Fermi/GF100很悲剧
作者: 飞鸟真 时间: 2010-2-26 19:59
就是那些听说folding@home都用不好的卡?
作者: 菲利克丝 时间: 2010-2-26 20:31
回复 15# must999
4850就功耗不完美 其他还行 4850的出现直接令8000 9000系列大放血 呵呵
作者: 迪迪 时间: 2010-2-26 20:36
你这个贱人还敢出现?真当别人忘了你的丑事
人下贱到你这种地步不多见了,召唤hotball
有兴趣的百度下LZ名字,出现的第一个链接就是了
作者: VGASOS 时间: 2010-2-26 20:44
看到現在的AMD5XXX 才真正覺得 他才是做遊戲卡
至於NV 有劍走偏鋒的感覺 想要一手包 肯定要犧牲掉一些東西
作者: Asuka 时间: 2010-2-26 20:52
最关键的部分没有说
RV870几乎突破了线长的极限
作者: jocover 时间: 2010-2-26 20:53
http://we.pcinlife.com/viewthread.php?tid=1358228
AMD先解决最基本的问题吧
作者: toshibacom 时间: 2010-2-26 20:59
AMD先解决最基本的问题吧
jocover 发表于 2010-2-26 20:53 
openCL不是RV870的基本问题,在费米及其中低端衍生品今年年中大量上市后,RV970也将准备就绪。
作者: toshibacom 时间: 2010-2-26 21:10
从驱动下载就能体会出来.
a卡下个驱动,还分纯驱动和控制面板。
下个纯驱动,你不用官方的 ...
must999 发表于 2010-2-26 21:00 
你这属于实在找不出什**病的鸡蛋里挑骨头,要这么说,我也可以说,你看AMD多人性化,把驱动和面板分开,让有些不需要面板的人不必浪费流量,单独下载纯驱动就行了,而NV却不管你需不需要,都要你下载,显得很浪费?
其实这只是2个公司提供驱动的习惯不同而已。
作者: toshibacom 时间: 2010-2-26 21:14
本帖最后由 toshibacom 于 2010-2-26 21:16 编辑
哦,你是这么理解的
请你说说, nv那个驱动包里,哪个是不需要的
must999 发表于 2010-2-26 21:13 
不是所有人都需要控制面板的,也别是商业机器用户,一般都不回去调整驱动,都用默认值。
作者: luckissy 时间: 2010-2-26 21:16
从驱动下载就能体会出来.
a卡下个驱动,还分纯驱动和控制面板。
下个纯驱动,你不用官方的 ...
must999 发表于 2010-2-26 21:00 
你不喜欢的正是我喜欢的 我只装DD
N卡驱动 装了开机启动都有3个 我看着都烦 我喜欢的就是这种纯洁
作者: 菲利克丝 时间: 2010-2-26 21:18
回复 22# must999
现在ati的驱动挺不错的,只是有最小帧的特点。
这位兄台应该理解是市场占有率决定一方驱动先天稳定性吧。只要其中一方市场占有率超过40%,任何游戏开发商都不会小窥,毕竟他们买的是商品,要的是利润。话说r300那年代,ati除了opengl性能差,directx的性能超过nv。不过那时候nv的确犯了一个致命的错误。r600时代ati和nv相互了一下换了位置,2600刚出来的时候那个驱动绝对是糟,(帮朋友配过机 )
现在显卡的价格有点虚高,或者说是炒作。最近也只是把3850换了8800gts。
作者: toshibacom 时间: 2010-2-26 21:21
所以说,a卡不适合我哈。
不过,我是支持amd的
must999 发表于 2010-2-26 21:19 
连多点一下下个控制面板都嫌烦的人,是不会有耐心在控制面板中仔细调整的。
作者: hetachi 时间: 2010-2-26 21:24
AMD现在做的很漂亮,期待CPU再打个翻身仗就好了。
作者: yihua伊华 时间: 2010-2-26 21:32
很多游戏开发商,就是拿n卡做为开发用机。
不是说a卡性能不好,但是没用n卡方便,省心。
远说,老 ...
must999 发表于 2010-2-26 21:26 
真正做游戏的会在意装那点驱动
其实你想说的是A卡不好罢了
作者: 菲利克丝 时间: 2010-2-26 21:32
回复 54# must999
所以现在ati5000系列占了先机 有了宽域这个功能 以后应该会好很多
作者: lunew 时间: 2010-2-26 21:34
写的不错~
作者: phehoo 时间: 2010-2-26 21:38
提示: 该帖被管理员或版主屏蔽
作者: 63723063 时间: 2010-2-26 21:44
如果没有Always Trouble Inside 这个名声,a的桌面卡的占有率不会在5系占了那么大先机后还破不了5成
作者: windone 时间: 2010-2-26 21:44
好长好长……
作者: cool_exorcist 时间: 2010-2-26 21:57
这文章给我一种是似曾相识的感觉,就如同扣肉没出来前的X2一样,amd宣称领先intel 5年。
历史会不会重演呢?
作者: 63723063 时间: 2010-2-26 21:58
因为想你们这样买马甲卡的小白太多啊 没办法~
在移动独显市场不是超过50%了吗?虽然有Nv质量门 ...
nvd11 发表于 2010-2-26 21:46 
买n卡的就是小白,买a卡的都是爱因斯坦,好吧你赢了
作者: 63723063 时间: 2010-2-26 22:06
我说买马甲卡那些是小白, 没指全部N卡哦
例如 9400gt 9500gt 9800gt 9800gtx gts250
gt300系列 ...
nvd11 发表于 2010-2-26 22:02 
你前面不就说我买了马甲卡么?怎么现在马甲卡又变这么几样了,我又被a饭代表了
作者: Gernon 时间: 2010-2-26 22:07
这文章给我一种是似曾相识的感觉,就如同扣肉没出来前的X2一样,amd宣称领先intel 5年。
历史会不会重演呢 ...
cool_exorcist 发表于 2010-2-26 21:57 
你错了,是6年。但人家说的是某技术领先使用了6年,别断章取义。。。
作者: 63723063 时间: 2010-2-26 22:17
居然认为马甲卡=n卡?
jeandja 发表于 2010-2-26 22:06 
他原话就不分青红皂白说别人买马甲卡,我现在在用的就是260+,既然这都算马甲卡了,那不就是指证n卡==马甲卡?
作者: 冰河冰冰水 时间: 2010-2-26 22:17
AMD很好 做实事 为消费者带来福音
比马甲团队强多了
作者: 63723063 时间: 2010-2-26 22:18
因为我觉得你是买马甲卡的那种类型? 难道我猜错了?
nvd11 发表于 2010-2-26 22:12 
想来这位a饭的某个思想精神学的特别棒,喜欢代表别人
作者: sxgrc 时间: 2010-2-26 22:22
太多了,专业的东西也看不懂
作者: 牛奶不老 时间: 2010-2-26 22:25
这文章给我一种是似曾相识的感觉,就如同扣肉没出来前的X2一样,amd宣称领先intel 5年。
历史会不会重演呢 ...
cool_exorcist 发表于 2010-2-26 21:57 
你觉得NV长得像intel吗?
作者: yzwbilly 时间: 2010-2-26 22:45
你这个贱人还敢出现?真当别人忘了你的丑事
人下贱到你这种地步不多见了,召唤hotball
有兴趣的百度下LZ名 ...
迪迪 发表于 2010-2-26 20:36 
没看懂。。。什么意思
作者: PURE布 时间: 2010-2-26 22:54
这文章给我一种是似曾相识的感觉,就如同扣肉没出来前的X2一样,amd宣称领先intel 5年。
历史会不会重演呢 ...
cool_exorcist 发表于 2010-2-26 21:57 
你先去查看一下这个文章的作者是谁吧!
以他在业界的地位 AMD还请不起让他做GUN
作者: 迪迪 时间: 2010-2-26 23:11
本帖最后由 迪迪 于 2010-2-26 23:13 编辑
回复 迪迪
没想到都2010年了,你个FOOLISH还在啊。生存的如何?犯低能病还没有改进啊?更多点为自己的将 ...
phehoo 发表于 2010-2-26 21:38 
你只能算是个P,真笑死
抄袭了整篇文章,自己的东西只有一句我phehoo说,你当你是个什么东西?人可以不【请注意用词】到这种地步不多见了,堂而皇之的将别人的撰文完全抄袭为自己所用,之后又杜撰了一大片错漏百出的可笑之文
你这种人到现在还没有被封id可以说是奇迹了
作者: 迪迪 时间: 2010-2-26 23:18
没看懂。。。什么意思
yzwbilly 发表于 2010-2-26 22:45 
08年一篇文章:http://www.pcinlife.com/article/graphics/2008-06-04/1212575164d532.html 深入浅出谈CUDA
被Phehoo完全抄袭成自己所谓的原创技术文章,在抄袭文章之后,后画蛇添足的添了一大推错漏百出的文字,这还不算什么,发表在另一个论坛之后迫不及待的要求加入精华,人可以【请注意用词】到这种地步
让大家等了2天,今天我PHEHOO的文章就和大家见面了。不知道这里有没有人认识我PHEHOO的。先不管这个,入正题。
估计现在基本上所有热心的显卡FANS都知道,NV的一个基于G80架构体系的显卡系列(GEFORCE 8/9/200)把ATI基于R600的架构给比下去了。NV的这个架构有它的过人之处,就是异频式结构,暴力标量化代码编译统一执行,高缓存执行线程,嵌套CUDA模块,以及著名的THE WAYS计划。这些都是足以让这个架构的系列显卡速度优异的条件,更高的编译效率,随意的游戏编程代码格式,宽裕的后期执行效率,可编程的C/C++特性,和相应的送钱垄断策略。
相信,大家对NV这个架构的一些特性多少已经略有了解,所以我也不重复的,更细致的介绍。这里,我只说一下CUDA和G80架构的暴力标量化代码编译执行,因为这已经是这一体系架构的极限(随后的内容中解释)。
首先,CUDA是 NVIDIA 的 GPGPU 模型,它使用 C 语言为基础,可以直接以大多数人熟悉的 C 语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构。现代的显示芯片已经具有高度的可程序化能力,由于显示芯片通常具有相当高的内存带宽,以及大量的执行单元,因此开始有利用显示芯片来帮助进行一些计算工作的想法,即 GPGPU。CUDA 即是 NVIDIA 的 GPGPU 模型。
使用显示芯片来进行运算工作,和使用 CPU 相比,主要有几个好处:
- 显示芯片通常具有更大的内存带宽。例如,NVIDIA 的 GeForce 8800GTX 具有超过 50GB/s 的内存带宽,而目前高阶 CPU 的内存带宽则在 10GB/s 左右。
- 显示芯片具有更大量的执行单元。例如 GeForce 8800GTX 具有 128 个 "stream processors",频率为 1.35GHz。CPU 频率通常较高,但是执行单元的数目则要少得多。
- 和高阶 CPU 相比,显卡的价格较为低廉。例如目前一张 GeForce 8800GT 包括 512MB 内存的价格,和一颗 2.4GHz 四核心 CPU 的价格相若。
所谓的好处,这些都是比较侧面的优势,也就是说片面的。使用NV G80系列架构显示芯片做GPGPU运算有它的一些缺点:
- 显示芯片的运算单元数量很多,因此对于不能高度并行化的工作,所能带来的帮助就不大。
- 显示芯片目前通常只支持 32 bits 浮点数,且多半不能完全支持 IEEE 754 规格, 有些运算的精确度可能较低。目前许多显示芯片并没有分开的整数运算单元,因此整数运算的效率较差。
- 显示芯片通常不具有分支预测等复杂的流程控制单元,因此对于具有高度分支的程序,效率会比较差。
- 目前 GPGPU 的程序模型仍不成熟(推出GEFORCE 200系列只是一个晃子,以后会做解释),也还没有公认的标准。例如 NVIDIA 和 AMD/ATI 就有各自不同的程序模型。
由于显示芯片大量并行计算的特性,它处理一些问题的方式,和一般 CPU 是不同的。主要的特点包括:
- 内存存取 latency 的问题:CPU 通常使用 cache 来减少存取主内存的次数,以避免内存 latency 影响到执行效率。显示芯片则多半没有 cache(或很小),而利用并行化执行的方式来隐藏内存的 latency(即,当第一个 thread 需要等待内存读取结果时,则开始执行第二个 thread,依此类推)。
- 分支指令的问题:CPU 通常利用分支预测等方式来减少分支指令造成的 pipeline bubble。显示芯片则多半使用类似处理内存 latency 的方式。不过,通常显示芯片处理分支的效率会比较差。
因此,最适合利用 CUDA 处理的问题,是可以大量并行化的问题,才能有效隐藏内存的 latency,并有效利用显示芯片上的大量执行单元。使用 CUDA 时,同时有上千个 thread 在执行是很正常的。因此,如果不能大量并行化的问题,使用 CUDA 就没办法达到最好的效率了。
我们都知道AMD的FUSION架构,通俗的说就是CPU+GPU的合成架构。目的很简单,简单的说就是在需要执行量化thread的时候的时候让其中的GPU核心部分执行,以加快CPU整体速度。那么,对此,NV和ATI的GPU核心存在什么区别呢?通俗的说,NV的G80体系是纯机械化的,无执行先后次序的,无代码繁简区别的,无“思维”的。这个架构是自行对代码判断和编译的,缺少了一个超线程分派处理器设计。因此,在驱动的帮助下,它不能“主动的”对代码作出选择,作出归类,作出优化。所以G80体系是不能够实现和任何CPU的架构融合的,原因在于,已存在的或正在设计的任何类别的CPU架构都不能和G80体系架构做FUSION融合。
这也是G80体系架构的极限。一个半完全的,无“思维”的(“思维”指的是靠驱动来灵活操纵),机械的高速拆分,执行代码的架构。ATI的R600架构正好和它相反。它的设计,从根本上支持了对FUSION架构的实现。R600是一个很超前的设计,虽然因某些设计上的问题(已经有介绍这方面的文章,相信大家也看到了),和游戏策略(例如,THE WAYS方案的侵略)上的问题,在速度上没有能够实现超越,甚至匹敌G80体系的愿望。但是它灵活的主动内核,正好符合了CPU+GPU的FUSION混合架构的需要。相对INTEL,由于INTEL没有类似显卡制作上的经验,所以准备推出Larrabee。目的很简单,因为相对R600,Larrabee对代码更聪明,更“主动”,但是,对比R600也更慢,但是这点却是很要命的。更聪明和聪明,更“主动”和“主动”,这些都可以用驱动来弥补,但是执行速度却。。。这是INTEL未来的CPU+GPU混合架构和AMD的FUSION架构的区别和落后之处。而今天的NV的显卡架构与此无缘。不是因为NV缺少CPU的制作经验,而是从根本上NV目前的显卡架构限制了这个发展。因此,NV希望通过CUDA,通过他在速度上的优势,只求快,不求准的标准,率先侵略市场,并为今后的全新架构做好市场铺垫。
说到这里,我PHEHOO认为,其实NV的GEFORCE 200系列只是一个幌子,在市场还没完全需要和适应CPU+GPU的FUSION混合架构的时候,先利用CUDA和新堆积的流处理器来侵略一下眼球。为的是让自己正在秘密研制的新一带核心架构争取时间。而这里说的新一代,将是融合了类似R600的超线程分派处理器设计和改进的标量执行单元的架构。为今后的市场和竞争做好准备。
而AMD/ATI呢,将会努力实现FUSION这个非常先进和超前的架构,速度会比INTEL的新架构更快(部分运算优势将达50-150%)。ATI的R800呢,将又回到512 BITS的架构(为全新第一阶段FUSION架构的“升级版”做好GPU部分的核心架构设计准备)并继续贯彻GPU多核的策略来制压NV。
写到这里,明显感到手酸了。也没动力写了,其实还有很多东西要说。但
作者: skywalker_hao 时间: 2010-2-26 23:25
你先去查看一下这个文章的作者是谁吧!
以他在业界的地位 AMD还请不起让他做GUN
PURE布 发表于 2010-2-26 22:54 
Anand Lal Shimpi is an American businessman who was born June 26, 1982 to Indian and Iranian parents. He is currently CEO of the tech website AnandTech, which he started in 1997. He is a graduate of Enloe High School and North Carolina State University with a degree in Computer Engineering. AnandTech grew from a small GeoCities website in 1997 to a 50 million page view per month publication as of July 2005[update].
He has been featured in USA Today, 48 Hours, 20/20, Fortune Magazine and on G4. He was one of the keynote speakers at Computex 2003 as a celebrity speaker to entice show goers to return to Taiwan even in the wake of SARS
怎么了?请不动么?
作者: yuanico 时间: 2010-2-27 00:22
多屏输出 角度无关各向异性过滤 ssaa(当然 效果好像一般) 不俗的性能 amd这次没理由不得到掌声 作为次世代的显卡 5870以及一伙小弟绝对是合格的
作者: erodeox 时间: 2010-2-27 00:42
本来也想支持下ATI,但是蓝宝石的首批5770让我这个爱折腾的人也受不了了,换了260GTX+
作者: ak75 时间: 2010-2-27 01:04
回复 22# must999
这个话说到心里去了,不然我也不会入260
48系列的出现,确实具有一定里程碑的意义。否则19999的8800U,2000的9800GTX还会继续出现
作者: clockup 时间: 2010-2-27 01:22
我只觉得nv目前把他们的经历投入到马甲和pro N大军的打造上来了,这贴就是明证。
作者: __峰 时间: 2010-2-27 02:22
从驱动下载就能体会出来.
a卡下个驱动,还分纯驱动和控制面板。
下个纯驱动,你不用官方的 ...
must999 发表于 2010-2-26 21:00 
不仅如此 安装控制面板你还需要下载并安装.net framework
作者: __峰 时间: 2010-2-27 02:26
AMD很好 做实事 为消费者带来福音
比马甲团队强多了
冰河冰冰水 发表于 2010-2-26 22:17 
做实事???把驱动完善了再说这话吧
作者: defv4 时间: 2010-2-27 02:57
做实事???把驱动完善了再说这话吧
__峰 发表于 2010-2-27 02:26 
高达是实事?
作者: pivk 时间: 2010-2-27 03:03
我觉得某某再不干实事也总比某个就知道整天做模型穿马甲纸面发布写写ppt打打口水战但就是丫的一张实卡都没憋出来的某某实干多了
作者: mercurylampe 时间: 2010-2-27 04:20
从驱动下载就能体会出来.
a卡下个驱动,还分纯驱动和控制面板。
下个纯驱动,你不用官方的 ...
must999 发表于 2010-2-26 21:00 
话说我个人还是喜欢选择无控制面板的驱动,装N卡经常是用系统自己搜索的不带控制面板的驱动,A卡则习惯下纯驱动..因为那东西感觉对我没什么用..
作者: anti_alive 时间: 2010-2-27 07:50
怀疑文中一会儿NVIDA一会儿NVIDIA的称呼,怀疑楼主在原本的译文中加入了自己的“原创”;如果怀疑错了,请原谅。
作者: QUADRO2008 时间: 2010-2-27 11:38
作为一个N卡用家,不得不佩服AMD这次干得漂亮
作者: yangyi_allen 时间: 2010-2-27 11:56
路过,不错的看看
作者: hoygosl 时间: 2010-2-27 12:12
好长的文章
作者: temp444 时间: 2010-2-27 12:29
台积电拖累ATI了!
作者: Travis 时间: 2010-2-27 13:36
这文章给我一种是似曾相识的感觉,就如同扣肉没出来前的X2一样,amd宣称领先intel 5年。
历史会不会重演呢 ...
cool_exorcist 发表于 2010-2-26 21:57 
应该说AT围绕RV770和RV870这两篇文章属于ATI媒体公关的一面,SemiAccurate的对Fermi的FUD则属于另一面。不过即便知道是FUD,fanboys们也会不遗余力地转载并广为散发的。
回到AT来,最近一年来AT对NV的态度十分冷淡,显示两者的关系处于低谷期,但在此期间AT围绕Fermi图形架构和Tegra发了两三篇长文,也算是最大程度地给足了NV面子了,不像HardOCP直接戏称Fermi是Paper Dragon :P
作者: BLZ.WOW 时间: 2010-2-27 14:15
太长了。。。。。。
作者: 白云傲霜 时间: 2010-2-27 14:49
好文 鼓掌
作者: 破碎空虚 时间: 2010-2-27 15:35
不错的总结,做系统设计和项目管理的GG必读
作者: Travis 时间: 2010-2-27 15:40
另外关于这篇文章的版权说明一下。
毫无疑问地,原作者是Anandtech的站长Anand本人。围绕Intel SSD、AMD RV770/870、NV Tegra等话题A总已经为我们贡献了很多精彩的文字,不管是从技术参考的角度还是休闲阅读的角度讲都是很好的素材。
至于翻译者,是网友Firestone,署名刊登在了硬派网。
http://www.inpai.com.cn/doc/hard/118156.htm
虽然个人不是很喜欢硬派网,不过他们对Anandtech的长文经常能做到首个全文翻译,值得表扬(驱家因为要抢首发的缘故通常只是摘译了片段,往往漏掉了很多真正值得一看的章节)。
准确地讲Anandtech这篇文章的翻译者应该不止Firestone一个人。文章刊登的时候正值春节假期,有很多网友一边过年一边在翻译这篇长文,因而将近两周的时间里没有人发布,这样Firestone幸运地成了第一个。不管是Firestone还是其他正在翻译而无缘首发的网友,他们付出的劳动都是值得表扬以及感谢的。
至于PCI这个帖子的楼主么,确实是100%的抄**,抄别人的劳动成果当自己的原创。
作者: 破碎空虚 时间: 2010-2-27 15:43
另外关于这篇文章的版权说明一下。
毫无疑问地,原作者是Anandtech的站长Anand本人。围绕Intel SSD、AMD R ...
Travis 发表于 2010-2-27 15:40 
非常感谢LS,正要找该原始中文出处收藏.3Q
作者: saoca 时间: 2010-2-27 20:33
最关键的部分没有说
RV870几乎突破了线长的极限
Asuka 发表于 2010-2-26 20:52 
如文中提及,nv碰到的问题可能就是 金属链接 和 线长 的问题,但是对于这2个问题处理方法和态度差异都很大....
作者: cjmgz 时间: 2010-2-27 21:39
支持AMD,不过不得不说,人很多时候是被习惯驱动的,我习惯了用N卡,从FX5800一直到8800GT,中间试过3850CF,我就感觉N卡比较对味,我知道5XXX系列不错,
但仍然希望等FERMI,看来这次我是悲剧了。
作者: 冰河冰冰水 时间: 2010-2-27 23:52
做实事???把驱动完善了再说这话吧
__峰 发表于 2010-2-27 02:26 
请问 你有用过ATI的显卡吗?在驱动上有没有什么不尽如人意的地方?
**隼
作者: A狗狗 时间: 2010-2-28 08:34
很好的内容,我学到了结果对于开始的之间的过程。
作者: slr 时间: 2010-2-28 18:50
我深深地赞同你的意见。
NV的驱动太大了,我每次都下载NGO修改版本的。
go_free 发表于 2010-2-27 13:53 
我为一个朋友的笔记本下载驱动,那集成的G210显卡要下110还是140M的驱动——我们在车上,他那3G手机都泪流满面
作者: zkxyy 时间: 2010-3-1 22:48
来听古了.
作者: crays 时间: 2010-3-2 11:06
amd的驱动就挺好的~我一般下纯驱动版。不是小白都会自己选择该用哪个
作者: skywalker_hao 时间: 2010-3-2 12:27
其实第三点gz的某个讨论中我就说到过
nv 40nm 的问题是用小芯片趟雷,看上去很美,但是没用
我记得当 ...
jeandja 发表于 2010-3-1 16:05 
gt215和rv740规格差不了多少
作者: skywalker_hao 时间: 2010-3-2 12:30
如文中提及,nv碰到的问题可能就是 金属链接 和 线长 的问题,但是对于这2个问题处理方法和态度差异都很 ...
saoca 发表于 2010-2-27 20:33 
据称,rv770的时候,线长接近GT200的1.4倍
fermi的线长搞不好还不如gt200
作者: trotsky 时间: 2010-3-2 18:00
很想知道R500能撑到什么时候。我的XBOX360啥时候过时,必须再买XBOX720或者PS4
作者: yangsin 时间: 2010-3-2 18:02
有竞争对于消费者来说总是好的
作者: 晨之晖 时间: 2010-3-2 18:56
有了AMD的靠山,ATI变得更有侵略性
作者: hizorro 时间: 2010-3-2 22:18
amd加油~!~!~!~!~
作者: vvisher 时间: 2010-3-2 23:06
好贴要顶,不管枪与否,分析的还是很有见地的,尤其是对于开发新产品的过程,值得学习
作者: ak47ubk 时间: 2010-3-3 00:02
回复 26# luckissy
啥驱动不装 800x600 最纯洁,可惜看起来有点晕
作者: pantherjj 时间: 2010-3-3 09:52
老黄应该发飙了!新GPU遥遥无期!!!!
作者: cyberlife 时间: 2010-3-3 10:37
现在AMD的驱动不错呵,纯驱动版本很好用。
作者: yqlily 时间: 2010-3-3 10:58
向AMD敬礼!!!!!!!!!!
作者: yuron 时间: 2010-3-3 12:34
太长,学习下。
作者: 4498800 时间: 2010-3-3 13:24
anandtech在业界是拥有很高地位的...
haifengx88 发表于 2010-2-27 00:22 
嘘~
作者: kaneisme 时间: 2010-3-3 15:35
提示: 作者被禁止或删除 内容自动屏蔽
作者: glorynash 时间: 2010-3-3 16:02
这是个广告?
作者: seaga 时间: 2010-3-3 18:41
看完之后,对A和N两家的工程师肃然起敬
作者: weihua8206 时间: 2010-3-3 19:54
提示: 该帖被管理员或版主屏蔽
作者: gzyfish 时间: 2010-3-3 20:02
反正我买了 5850 用得挺好
作者: Arcueid 时间: 2010-3-3 21:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: jediknight945 时间: 2010-3-3 21:15
N饭飘过,还没用过ATI/AMD的显卡
作者: z19342272 时间: 2010-3-3 22:26
还有就是AMD的AD5000让我用上了四核,虽然有那么点瑕疵,但是对于我,好象无所谓啊,AMD给我的震撼从4850开始,今年是AD5000,AMD告诉我们,钱就是这样抢的,市场就是这样做的!!
作者: aaa669 时间: 2010-3-4 01:12
学习一下
作者: 心头烦 时间: 2010-3-4 02:44
向AMD敬礼!!!!!!!!!!
yqlily 发表于 2010-3-3 10:58 
这么夸张?
ATI送你显卡还是U了?
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) |
Powered by Discuz! X3.4 |