POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3976|回复: 19
打印 上一主题 下一主题

转:传Nvidia Fermi桌面型显卡实际性能可能与预期存在极大差距

[复制链接]
跳转到指定楼层
1#
发表于 2009-11-17 12:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
我们已经知道Nvidia下一代40nm显卡产品Fermi的上市计划一直在往后拖延,不过根据VR-Zone最近的报道这款产品的性能水平似乎与人们先前的预计有着极大的差距。下面,就让我们暂时忘记这款产品的姗姗来迟,更多关注一下Fermi桌面型显卡本身可能达到的性能水平。  

首款家用级Fermi GPU代号为GF100,这款GPU内含30亿个晶体管,核心面积达500平方毫米。相比之下,ATI刚刚推出的RV870 Cypress GPU核心面积仅为330平方毫米,内含21.5亿个晶体管,同样采用台积电的40nm制程。从两者的核心面积以及内含的晶体管数量上看,GF100与RV870似乎完全不像是同一个数量级的产品。不幸的是,根据最近透露的一些消息,GF100的性能似乎并不不如原先人们预计的那样,比对手RV870高出不少。

首先一条值得注意的情况是有关单精度浮点运算能力的,尽管最近Nvidia在SC09会议上公布了新款Fermi架构Tesla 20系列产品的性能数据,但有心人会发现这些数据中根本找不到与单精度浮点运算能力有关的内容,他们只公布了这款产品的双精度浮点运算能力,这显然说明Fermi架构的性能优势主要体现在双精度浮点运算方面。

然而,即便是Fermi所擅长的双精度浮点运算方面,根据Nvidia最近在SC09上公布的数据,Fermi的实际性能似乎也比外界预期的要低出不少。Fermi Tesla20系列显卡的双精度浮点运算速度为520 GFlops至630 GFlops之间,而对手ATI的RV870 GPU双精度浮点运算速度则已经可以达到544GFlops的水平核心工作频率方面,由于过去Geforce GTX280与同样基于GT220核心的Tesla C1060其GPU核心频率完全相同,因此我们同样有理由预计GF100  GPU的工作频率也不会比Tesla 20系列高多少。

我们再回过头来看看对游戏性能有更大影响的单精度浮点运算性能方面,GF100的表现可能会更糟糕。据称GF100的Shader clock目标频率为1.5GHz左右。而根据520/630GFlops的性能数字,我们可以大致估算出此时的Shader clock值仅为1015/1230MHz左右。

将双精度浮点运算速度的数据简单乘以二,GF100内部512个 CUDA核心的单精度浮点运算理论峰值速度将在1.05TFlops到1.26TFlops之间,而HD5870的单精度浮点运算理论峰值速度则可达2.72TFlpos,即便是主流级别的HD5770,也可以达到1.36TFlops的峰值速度!即便Nvidia Fermin架构的单精度浮点计算效率可能比较高,但两者的差距依然相当巨大.

再来看看价格对比。之前的Tesla C1060 GPGPU显卡的售价是1699美元。相比同代的Geforce GTX280,后者售价为649美元(后来先后降价到了500,乃至300美元的价位).而新一代Fermi架构的Tesla C2070则售价3999美元,几乎是Tesla C1060的一倍左右,当然这是面向服务器的产品,价格自然会比较高,但即便是最便宜的基于Fermi架构的Tesla C2050售价也达到了2499美元,比基于GT200的旗舰型Tesla C1060价格多出了一半!由此推测,GF100的售价恐怕也不会低到哪里去。

最后再来看Fermi架构双GPU型号显卡的情况,Tesla 20系列产品的TDP功耗约为190W,而HD5870的TDP功耗则为180W,GPU最大功耗为110W,双GPU的HD5970为274W,而GF100的TDP功耗据称将高达220W,这样功耗级别的GPU至少在近期内很难推出双GPU的显卡产品。

原文:[url=http://vr-zone.com/articles/fermi-in-trouble-/8054.html?doc=8054]vr-zone[/url]
2#
发表于 2009-11-17 12:20 | 只看该作者
估计前面有人报料,桌面板的G300将会消减部分fermi的对图形性能没有帮助的晶体管是有道理的,消减了晶体管,可以跑更高的频率,增强图形性能。
回复 支持 反对

使用道具 举报

3#
发表于 2009-11-17 12:22 | 只看该作者
赶紧倒闭=我们要的是更加廉价优秀的产品


我忍~~~~~~~~~~~
回复 支持 反对

使用道具 举报

4#
发表于 2009-11-17 13:15 | 只看该作者
tesla的频率应该比GEFORCE更高吧,geforce的单精度根据x2算的话恐怕1T能不能摸到都是问题
这样算的话,也不用做fermi了,直接上256bit gddr5版40nm gt200好了,单晶度差不多


所以,会不会哪里搞错了?
回复 支持 反对

使用道具 举报

5#
发表于 2009-11-17 14:17 | 只看该作者
发布这篇报道的是NV派出的卧底,目的是产品正式发布时一鸣惊人,导致NV股价暴涨,老黄高位抛售,获利丰厚,以便提前退休。
回复 支持 反对

使用道具 举报

6#
发表于 2009-11-17 14:42 | 只看该作者
240sp的GTX 285单精度有1.06Tflops
512sp的fermi就只有1.05TFlops到1.26TFlops....
回复 支持 反对

使用道具 举报

7#
发表于 2009-11-17 14:48 | 只看该作者
本帖最后由 jhg1159 于 2009-11-17 14:59 编辑

G80-G200  单精度只有2/3能用在游戏上。还有1/3的浮点是靠dual-issue实行的,对游戏可以说没有丝毫帮助,G200双精度是理论单精度的2/(3X8)  (78-86Gflops)
GF100 可能砍掉了dual-issue
回复 支持 反对

使用道具 举报

8#
发表于 2009-11-17 14:54 | 只看该作者
240sp的GTX 285单精度有1.06Tflops
512sp的fermi就只有1.05TFlops到1.26TFlops....
百事可乐 发表于 2009-11-17 14:42

单个SP结构精简了,去掉co-issue,从3flops降到了2!
回复 支持 反对

使用道具 举报

9#
发表于 2009-11-17 14:55 | 只看该作者
所以....他们预测这么低是因为那个"1.05TFlops到1.26TFlops"是3/3都能用到游戏上的?
回复 支持 反对

使用道具 举报

10#
发表于 2009-11-17 14:55 | 只看该作者
不可否认是老黄的阴谋,具体多NB,要看实际产品出来跑分,,现在的讨论,基本都是YY
回复 支持 反对

使用道具 举报

11#
发表于 2009-11-17 15:06 | 只看该作者
单个SP结构精简了,去掉co-issue,从3flops降到了2!
Rafale 发表于 2009-11-17 14:54

O...
回复 支持 反对

使用道具 举报

12#
发表于 2009-11-17 15:09 | 只看该作者
单精度浮点确实关系游戏性能,但还有个效率问题。
貌似g200效率要比rv770高
回复 支持 反对

使用道具 举报

13#
发表于 2009-11-17 15:59 | 只看该作者
顶~~~新手,学习
回复 支持 反对

使用道具 举报

14#
发表于 2009-11-17 16:19 | 只看该作者
G80-G200  单精度只有2/3能用在游戏上。还有1/3的浮点是靠dual-issue实行的,对游戏可以说没有丝毫帮助,G200双精度是理论单精度的2/(3X8)  (78-86Gflops)
GF100 可能砍掉了dual-issue
jhg1159 发表于 2009-11-17 14:48


如果算去掉co-issue的话(G80本来就没有)

G80@1350=345 GFlops
GT200@1296=622 GFlops
Fermi=1040 GFlops至1260 GFlops(按照上面双精度推测)

看上去还行
回复 支持 反对

使用道具 举报

15#
发表于 2009-11-17 16:27 | 只看该作者
什么时候出呢?不会像5800U吧?
回复 支持 反对

使用道具 举报

16#
发表于 2009-11-17 16:45 | 只看该作者
22# aibo
G80 G92 都是驱动升级后支持的。
回复 支持 反对

使用道具 举报

17#
发表于 2009-11-17 18:20 | 只看该作者
性能超过RV870是没悬念了。 NV最吸引的地方还是CUDA和PhsX吧。
回复 支持 反对

使用道具 举报

18#
发表于 2009-11-18 07:56 | 只看该作者
不管怎样还是希望他早日上市
回复 支持 反对

使用道具 举报

19#
发表于 2009-11-18 12:36 | 只看该作者
22# aibo  
G80 G92 都是驱动升级后支持的。
jhg1159 发表于 2009-11-17 16:45


G80肯定是不支持co-issue的。当年还把Gflops从518修正到了345。

其实nv的单精度绝对速度都不及ati/amd。
回复 支持 反对

使用道具 举报

20#
发表于 2009-11-20 03:26 | 只看该作者
G80肯定是不支持co-issue的。当年还把Gflops从518修正到了345。

其实nv的单精度绝对速度都不及ati/amd。
aibo 发表于 2009-11-18 12:36


貌似G92是支持的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-7-19 06:40

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表