POPPUR爱换
标题: PCINLIFE 评测室原创:RADEON HD 6870 1GB 测试报告 [打印本页]
作者: Edison 时间: 2010-11-8 03:22
标题: PCINLIFE 评测室原创:RADEON HD 6870 1GB 测试报告
不分页原文:http://www.pcinlife.com/article/graphics/2010-11-08/1289157065d856.html
节选:
Barts 体系架构的设计目标和特性
正如我们所知道的那样,NVIDIA 的 G8x、G9x、GT2XX 都属于 Tesla 架构、GF1XX 属于 Fermi 架构,AMD 也有一样的架构代号,例如 Cypess 属于 Everygreen 架构,而这次发布的 Barts 所属的架构代号则是 Northern Ireland。
在 Northern Ireland 架构下针对中高端和发烧级游戏玩家的芯片型号分别是 Barts 和 Cayman。
从上面这张幻灯片可以看出,Barts 的定位位于之前 Cypress 和 Juniper 之间,作用是填补之前在这个区间存在的市场空隙,既非用于取代 RADEON HD 5800 也非取代 RADEON HD 5770,而是应对来自 NVIDIA GF104 (GeForce GTX 460)的挑战,满足中高端玩家的需求,也即是所谓的 sweet spot 所在。在 Barts 上一级的是代号 Cayman 的发烧级玩家 GPU,不过 AMD 对 Cayman 的大部分细节依然没有公布。
Barts 的芯片面积是 255 平方毫米,而这个芯片面积非常接近当初 AMD 首次提出 sweet spot 策略时 RV770 所采用的芯片面积(250 平方毫米),不过就只有 Cypress(RADEON HD 5800)的 76%。
不过 AMD 对 Barts 的设计目标并非单纯地定在 Cypress 的 76% 等级上,而是要求在更低的耗电、成本上实现 Cypress 级别的性能,力求将其打造成为 150 瓦等级市场上最快的显卡。
更为重要的是,AMD 在过去三个月中,缺乏能与 GTX 460 抗衡的产品,在主流高性能市场上的气势上一度处于下风,Barts 的出现就是希望先能将这个缺口填补。
上图是 Barts 的功能模块图,大家可以看到在其中有 14 个 SIMD Core,和 Cypress 相比,减少了 6 个,流处理运算单元数量为 1120,流处理运算单元和纹理单元数量均为 Cypress 的 70%,而其他方面例如内存总线、后端单元(ROP),则和 Cypress 一样,都是 256-bit 以及 32 个 ROP。
有些网友可能看到这个模块图的时候会有一个错觉,那就是误以为 Barts 的前端部分有改进,例如 UTDP 从 Cypress 的 1 个升级为两个。
这个想法其实是错误的,不过这是可以理解的,因为当初 Cypress 发布的时候,AMD 提供了一张容易误解的架构图,将 UTDP 画成了一体。而在今年的 HPG 2010 上,AMD 发布了一张更加严谨的架构图表明 Cypress 其实是具备两个 UTDP:
AMD 于 HPG 2010 技术大会发布的 Cypress 架构图
Barts 和 Cypress 的架构除了 SIMD core 的数量存在差别外,在绝大多数方面都是类似的,例如都有两个 Unified Shader Engine,每个 Unified Shader Engine (USE)都有自己的指令 cache、kernel cache。Cypress 的 USE 可以实现 248 个并发 wavefront,而 Barts 方面的资料暂时欠奉,以芯片面积的变化幅度来看这部分应该不会有大的变动。
| | ROP | Texture Address Processor | triangle/cycle | ALU | Memory I/F | Transistors | die size | process node |
GF100 | 48 | 64 | 4 | 512 | 384-bit | 3200M | 529mm^2 | 40nm |
GF104 | 32 | 64 | 2 | 384 | 256-bit | 1950M | 354mm^2 | 40nm |
RV770 | 16 | 40 | 1 | 800 | 256-bit | 956M | 256mm^2 | 55nm |
Cypress | 32 | 80 | 1 | 1600 | 256-bit | 2150M | 334mm^2 | 40nm |
Barts | 32 | 56 | 1 | 1120 | 256-bit | 1700M | 255mm^2 | 40nm |
上图是当前各 GPU 的概况,不过其中 NVIDIA 的两款 GPU 目前还只是提供了缩水版,实际产品的 ALU 数量比设计少了一些。
此外,NVIDIA 目前为止并没有公布 GF100 和 GF104 的晶片面积,网络上也有一些揭盖后测量的数据,其中 GF100 的 529mm^2 就是本人使用 photoshop 依据像素比例获得的,而 GF104 网络上还只看到过几张斜角度的照片,谈不上用于精确测量的素材,这里 354mm^2 的数据是我从 NVIDIA 公司某人士口中探听得到的。
此外,现在也比较流行的使用游标卡尺测量晶片的尺寸,不过在现实中由于 underfill(填充)物料等关系,这类方法往往测试到的尺寸都会比官方公布的面积 (通常也是最准确)大了一些。
例如上图就是我们用游标卡尺测量 Barts 的尺寸,可以看到测量出来的面积约为 264mm^2,比 AMD 公布的 255mm^2 大了大约 10mm^2,至于这个 9mm^2 能否作为一个参考的修正量,那就见仁见智了。
RADEON HD 6870 的时钟频率是 900MHz,频率是 RADEON HD 5870 的 1.05 倍,RADEON HD 5850 的 1.24 倍,这可以反映它们之间的三角形吞吐性能差别;而在单精度/贴图性能方面RADEON HD 6870 则分别是 RADEON HD 5850 和 RADEON 5870 的 74.1% 和 96.4;另一个指标像素输出能力,则分别是 1.06 倍和 1.24 倍。因此从底层性能来说,RADEON HD 6870 的几何、像素吞吐能力是超过 RADEON HD 5850 不少,而单精度浮点和贴图方面则和 RADEON HD 5850 相当。
Barts 和 Cypress 相比在 tessellation 有所改进,可以在 tessellation 因数为 5-10 的时候提供大约两倍于 Cypress 的性能,不过由于依然继承了 Cypress 的非并行几何计算体系,在大规模几何体计算方面依然要落后于 NVIDIA GF104 等产品。
AMD 即将推出的高端 GPU Cayman 将会采用第八代硬件 tessellation 技术,目前的细节并未公布,从上面的幻灯片看,应该就是具备可延伸性和片外缓存。这样的介绍其实比较模糊,可延伸性可以指多个方面,例如独立的几何处理芯片或者是多卡并行(Crossfire)时的几何吞吐率。
Barts 被削掉了硬件双精度支持,因此不是十分适合于 HPC 场合。
作者: cyqd2000 时间: 2010-11-8 03:52
提示: 作者被禁止或删除 内容自动屏蔽
作者: magicalz2 时间: 2010-11-8 04:59
既然有850频率的460 1G参与了性能测试,那么后面的功耗测试当中,是不是也加入850频率的460 1G会比较合理呢?
作者: Orient_Ea 时间: 2010-11-8 05:01
580都要出来了,才出6870的评测…………
作者: Orient_Ea 时间: 2010-11-8 05:12
本帖最后由 Orient_Ea 于 2010-11-8 05:14 编辑
最后总结的图里居然没把470一起比较,470被850频率的460秒了呢。而且最后个是6870VS5770吧,写成2个6870VS5850了。都VS5770了,居然不VS470 -。-
作者: 乌鸦2000 时间: 2010-11-8 07:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee 时间: 2010-11-8 07:23
提示: 作者被禁止或删除 内容自动屏蔽
作者: 380 时间: 2010-11-8 09:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: angelahj 时间: 2010-11-8 09:10
好文,理论基准测试比较多~
作者: heavenboy 时间: 2010-11-8 09:11
这样详尽的测试 晚点出来 又如何
另外 出a卡测试
这是PCI的一大步啊,支持
作者: jhg1159 时间: 2010-11-8 09:15
N卡面积好像给的都是实测面积啊。
作者: 0772boy 时间: 2010-11-8 09:18
想说两点....一,终于出来了;二,是有些偏心
作者: 左脚选手 时间: 2010-11-8 09:33
0772boy 发表于 2010-11-8 09:18 
想说两点....一,终于出来了;二,是有些偏心
人不是机器都有感情,有偏向性是难免的。
作者: jhg1159 时间: 2010-11-8 09:33
本帖最后由 jhg1159 于 2010-11-8 09:38 编辑
表格后面哪列应该是6870VS5830吧。
作者: 4004 时间: 2010-11-8 09:35
不错不错,比当年128bit的“9800pro”测试公允不少,还有继续进步的余地。
作者: laserain 时间: 2010-11-8 09:43
总之6850和6870的性能是不能让人满意的,超频版的460就接近6870的性能了,价格相差400多,这不是好现象。
作者: ifu 时间: 2010-11-8 10:09
测评做得不错
不过6870VS5850那栏算错了
作者: lysine1 时间: 2010-11-8 10:17
不错,测试性能时用850的460和888的450,测试功耗时候就跑700和位置。
明显这样做只会起反效果。
作者: vironlee 时间: 2010-11-8 10:20
A家现在已经退烧了,今后的任务就是优化能耗比,融合APU……
作者: 66666 时间: 2010-11-8 10:25
其实从E大测试看,如果NV改善漏电性能后以高频460取代目前460 1G,对市场杀伤力巨大
作者: jhg1159 时间: 2010-11-8 10:32
回复 lysine1 的帖子
888的450对比的5770.和6870性能相差天远,有比较的意义?至于超频,在原卡默电提升到通常体质频率上超频功耗提升很小的。
作者: Orient_Ea 时间: 2010-11-8 10:37
jhg1159 发表于 2010-11-8 09:33 
表格后面哪列应该是6870VS5830吧。
是6870VS5770
作者: heavenboy 时间: 2010-11-8 10:42
本帖最后由 heavenboy 于 2010-11-8 10:46 编辑
jhg1159 发表于 2010-11-8 10:32 
回复 lysine1 的帖子
888的450对比的5770.和6870性能相差天远,有比较的意义?至于超频, ...
只能说对于加压来说 提示算小的
或者对于整机来说
单单算一块卡的功耗,提升是绝对用不上小这个字的
作者: xiangshui 时间: 2010-11-8 10:42
6870高频似乎再超只适合跑分,貌似长期用很容易花屏,等待6870花屏帝
作者: lysine1 时间: 2010-11-8 10:48
6870花屏最近看到好多反应的,2d下屏幕各种小方块,不知是不是2D频率太低。
作者: heavenboy 时间: 2010-11-8 10:50
lysine1 发表于 2010-11-8 10:48 
6870花屏最近看到好多反应的,2d下屏幕各种小方块,不知是不是2D频率太低。
你的好多是指一只手数的过来吗?
作者: bizchild 时间: 2010-11-8 10:50
"其中 GF100 的 529mm^2 就是本人使用 photoshop 依据像素比例获得的"......
作者: sfeng0 时间: 2010-11-8 10:51
barts这个900m的频率不是乱定的,就是要压超频460
作者: lysine1 时间: 2010-11-8 10:57
heavenboy 发表于 2010-11-8 10:50 
你的好多是指一只手数的过来吗?
** 有至少2张6870方格碎屏贴图咯,无图的那至少要用2只手数了。
作者: lysine1 时间: 2010-11-8 10:59
墙应该请gz去做过滤词名单,太完美无缺无懈可击了。
作者: kakaku.bj.cn 时间: 2010-11-8 11:01
480跑什么都比5850高出接近200w
然后号称tdp只有250w...
莫非5850应该标个75w什么的?
作者: luckissy 时间: 2010-11-8 11:03
幸苦了 支持一下
作者: heavenboy 时间: 2010-11-8 11:06
lysine1 发表于 2010-11-8 10:57 
** 有至少2张6870方格碎屏贴图咯,无图的那至少要用2只手数了。
出处?求链接
浏览各大论坛,那个方格的倒是见过帖子,其他你说的两只手数的 没遇到过
作者: chery66 时间: 2010-11-8 11:19
为什么没有6850和460 1G的对比
作者: Edison 时间: 2010-11-8 11:36
chery66 发表于 2010-11-8 11:19 
为什么没有6850和460 1G的对比
借不到第一波的 6850,人脉关系不够强,很多渠道商都是打算直接上 6850 非公版,这需要时间,不想再等了。
作者: jhg1159 时间: 2010-11-8 11:48
回复 Orient_Ea 的帖子
看到了,我还以为就写错一个5字、
作者: lysine1 时间: 2010-11-8 11:53
heavenboy 发表于 2010-11-8 11:06 
出处?求链接
浏览各大论坛,那个方格的倒是见过帖子,其他你说的两只手数的 没遇到过
为了维持论坛讨论氛围,区分**和普通玩家,凡是发帖询问显卡故障者,都必须附上显卡照片,照片里必须要有写有论坛ID以及日期的白纸,不含照片的故障帖将一律关闭!
最近想尝鲜A卡,但6870花屏事件屡屡发生,是否该入···
刚买的华硕6870在线看网页花屏,咋办?
这代6800的问题
唉.我的卡悲剧了....
6870问题 请释疑
随便第一页找了几个
作者: 蓝色风 时间: 2010-11-8 11:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: xiangshui 时间: 2010-11-8 12:05
其实我更关注完整版的460 1G,性能秒6870
作者: lysine1 时间: 2010-11-8 12:12
本帖最后由 lysine1 于 2010-11-8 12:13 编辑
蓝色风 发表于 2010-11-8 11:58 
850的460和6870一个样,460卖1300,6870卖2000
AMD真绝
nv市场部人的艾Q都比你低,能卖1900的才卖1500。
作者: 梦游的猪 时间: 2010-11-8 13:05
个人认为,NV也应减少HPC方面的考虑,把中端打造成纯粹的游戏卡,能砍掉的都砍掉。
作者: ak75 时间: 2010-11-8 16:44
6870得性能没有惊喜,而且定价过高
当然看了一下,gts450得价格也很牛,基本在900附近。
等580和6970旗舰碰撞,大家就可以看到精彩的东西了,
作者: 梦游的猪 时间: 2010-11-8 16:55
默认的460 1G杯具了。超频460功耗又太大。
希望GF114能雄起。
作者: erodeox 时间: 2010-11-8 17:12
xiangshui 发表于 2010-11-8 10:42 
6870高频似乎再超只适合跑分,貌似长期用很容易花屏,等待6870花屏帝
Crysis Warhead 全热衷 4AA 1680x1050 8小时无压力
作者: akk 时间: 2010-11-8 17:41
在用5830。。 很安静 ~这就够了
作者: viewful 时间: 2010-11-8 17:52
拿OC版460来对不OC 6870的,然后有人就大谈性价比,明眼人都知道啥意思。
祝广大N粉好运,都能以普通版的价格买到oc版,并稳定玩游戏跑分。
作者: sagecao 时间: 2010-11-8 18:06
弱弱的问:
6870现在大众性超频到多少?
作者: cctvgxtv 时间: 2010-11-8 18:19
提示: 作者被禁止或删除 内容自动屏蔽
作者: 酒逢知己 时间: 2010-11-8 19:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: dlcoolman 时间: 2010-11-8 19:27
公版GTX 470能秒6870吗?
作者: yuanico 时间: 2010-11-8 19:44
不过另一方面 GTX 460 需要达至 6870 所需的频率已经和默电规格下的超频潜力上限,前者需要可以作一些调整,而后者则可能需要电路上的重新设计才能得以改善。
这句话读了3遍了 硬是没读懂什么意思 求赐教
作者: fevaoctwh 时间: 2010-11-8 22:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: vcguest 时间: 2010-11-8 22:22
等了这么久,总算是出了个评测......
作者: lunew 时间: 2010-11-8 22:39
超频比性能,功耗比默认。。。
作者: bennylim 时间: 2010-11-8 22:51
erodeox 发表于 2010-11-8 17:12 
Crysis Warhead 全热衷 4AA 1680x1050 8小时无压力
真的连续不间断的玩了8小时
?
作者: Edison 时间: 2010-11-8 23:06
lunew 发表于 2010-11-8 22:39 
超频比性能,功耗比默认。。。
PCINLIFE 的耗电测试包括了 460 OC 850,没看过就不要乱说。
作者: Heitai 时间: 2010-11-8 23:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: murongrong 时间: 2010-11-8 23:15
本帖最后由 murongrong 于 2010-11-8 23:16 编辑
除了最后一段话,还是很客观的~就测试来说,爱迪生和爱波轮都是很客观的,毕竟大家不是中关村。
作者: heavenboy 时间: 2010-11-8 23:18
Edison 发表于 2010-11-8 23:06 
PCINLIFE 的耗电测试包括了 460 OC 850,没看过就不要乱说。
furmark 用 1920x1200 8aa测试??
作者: goodayoo 时间: 2010-11-8 23:45
本帖最后由 goodayoo 于 2010-11-8 23:46 编辑
ROP Texture Address Processor triangle/cycle ALU Memory I/FTransistors die size Process node
GF100
48 64 4 512 384-bit 3200M 529mm^2 40nm
GF104
32 64 2 384 256-bit 1950M 354mm^2 40nm
RV770
16 40 1 800 256-bit 956M 256mm^2 55nm
Cypress
32 80 1 1600 256-bit 2150M 334mm^2 40nm
Barts
32 56 1 1120 256-bit 1700M 255mm^2 40nm
有个问题,为什么同个生产商,相同的制程,晶体数量小的反而核心面积大?如460 VS 5870
作者: Edison 时间: 2010-11-8 23:58
按照 NVIDIA 方面的说法,是因为 NVIDIA 芯片的内部有复杂的 interconnector 以及用于实现冗余的电路,这些东西对面积缩减都不是那么 friendly 的。
简单举个例子,你应该看过 RV770 的裸片图,和 G92/GT2XX 的对比一下,你就会发现 NVIDIA 的 core:uncore 比例要比 RV770 低许多。
作者: yuanico 时间: 2010-11-9 00:24
最后一句终于改的看得懂了
gtx460的ts优势虽然在理论测试中很突出 但在目前号称负荷最重的地铁2033中都体现不明显 感觉意义就不大了 将来负荷更高的游戏即使gtx460占优了 那也是10帧对2帧 一个照片一个幻灯
所以 感觉说CUDA+coreavc是优势都比说ts是优势有底气 事实上 CUDA+coreavc还真的是我感觉最牛的地方
作者: 蓝色风 时间: 2010-11-9 00:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: ssking 时间: 2010-11-9 00:36
本帖最后由 ssking 于 2010-11-9 00:36 编辑
蓝色风 发表于 2010-11-9 00:24 
C H H那边是不准说460OC的
这测评在那边会被 ..............
[轮][子]很清楚460超频的实力
也很清楚6870 OC 力的废材
作者: blackgwt 时间: 2010-11-9 01:00
本帖最后由 blackgwt 于 2010-11-9 01:05 编辑
ssking 发表于 2010-11-9 00:36 
[轮][子]很清楚460超频的实力
也很清楚6870 OC 力的废材
1.3v电压跑1060/1150毫无压力,原装的风冷差不多就这个水平了,再高要玩水了
作者: ssking 时间: 2010-11-9 01:27
blackgwt 发表于 2010-11-9 01:00 
1.3v电压跑1060/1150毫无压力,原装的风冷差不多就这个水平了,再高要玩水了
1060,这也叫超频???
作者: thr33 时间: 2010-11-9 07:57
lunew 发表于 2010-11-8 22:39 
超频比性能,功耗比默认。。。

作者: arwenk 时间: 2010-11-9 08:10
对这个结果有点失望啊
作者: 慕尼黑 时间: 2010-11-9 08:22
好评测,完整看了一遍
作者: tony0706 时间: 2010-11-9 08:22
测试真不错,看完很欢乐
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) |
Powered by Discuz! X3.4 |