POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: shu0202
打印 上一主题 下一主题

Fermi部分纸面规格(和游戏有关)与RV870对比

[复制链接]
41#
发表于 2009-12-3 13:41 | 只看该作者
Fermi管线中有专门负责双精度运算的DP向量单元,运行目前的游戏它不能被充分利用;未来光线追踪游戏也许会采 ...
shu0202 发表于 2009-12-3 10:08
Fermi的管线应该是分成两部分,一部分用于单精度运算,另一部分则是二者兼顾,而在双精度运算时,前者应该事 ...
shu0202 发表于 2009-12-3 12:33



是凭幻觉产生的规格进行对比的么?
回复 支持 反对

使用道具 举报

42#
发表于 2009-12-3 13:46 | 只看该作者
30亿+的晶体管默认SP频率跑到1700,老大你相信吗?
这样单双精度和NV官方数据差距太大了不说,以现在的良 ...
zxjike 发表于 2009-12-3 13:37


NVIDIA 没有公布游戏卡版本的规格,但是应该和 Tesla 20 差不多。
回复 支持 反对

使用道具 举报

zxjike 该用户已被删除
43#
发表于 2009-12-3 13:52 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

44#
发表于 2009-12-3 13:55 | 只看该作者
嗯,我也觉得不可能差距太大,理论说Tesla 版本应该是最优秀的核心吧?差不多Tesla 能达到的频率也就是游 ...
zxjike 发表于 2009-12-3 13:52



Tesla版本有ECC支持的问题,而Geforce版本没有
别忘了这一点
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
45#
发表于 2009-12-3 13:55 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

zxjike 该用户已被删除
46#
发表于 2009-12-3 13:58 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

47#
发表于 2009-12-3 14:00 | 只看该作者
现在看来,这个ECC对SP频率会不会有影响还是未知数,个人估计只是对显存的速度和延迟影响更大一些吧。
zxjike 发表于 2009-12-3 13:58



Cache都存在ECC问题,这个不可能不影响核心吧?
回复 支持 反对

使用道具 举报

48#
发表于 2009-12-3 14:03 | 只看该作者
L2 cache 对于寄存器溢出、游戏物理计算上会有非常大的助益。
Edison 发表于 2009-12-3 13:31

我觉得L2 cache对于加速shader指令的处理/装载速度会有帮助,但对图形性能不一定有大的帮助,图形性能基本都在像素处理上;处理所有像素之前,shader指令只装载一次就好了,接下来就是等待像素处理。请E大指教。
回复 支持 反对

使用道具 举报

zxjike 该用户已被删除
49#
发表于 2009-12-3 14:08 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

50#
发表于 2009-12-3 14:16 | 只看该作者
GPU内存Cache的ECC如果关闭的话如何实现我倒是很感兴趣,不大可能设计2款大芯片出来吧?我更倾向于这部分 ...
zxjike 发表于 2009-12-3 14:08



既然显存可以轻易设定甚至很可能自动的判断是否支持ECC,Cache会是难事吗?
做硬件设计的人要这点都考虑不到,还不如别做ECC支持了
回复 支持 反对

使用道具 举报

zxjike 该用户已被删除
51#
发表于 2009-12-3 14:24 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

52#
发表于 2009-12-3 14:39 | 只看该作者
显存可以通过显存控制器轻松实现,现在来看费米的显存不是通过增加显存颗粒来实现的硬ECC,而是通过牺牲显 ...
zxjike 发表于 2009-12-3 14:24


是牺牲显存容量来的 官方已经有说明了开启ECC可使用显存的容量
回复 支持 反对

使用道具 举报

zxjike 该用户已被删除
53#
发表于 2009-12-3 14:47 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

54#
发表于 2009-12-3 15:00 | 只看该作者
Fermi管线中有专门负责双精度运算的DP向量单元,运行目前的游戏它不能被充分利用;未来光线追踪游戏也许会采用双精度算法,全速运转的DP单元会占用几乎所有数据资源,管线中另外的普通运算单元又会闲置。
ECC机制遍布于缓存和内存控制当中,当然要占用带宽而导致实际带宽降低……

shu0202 发表于 2009-12-3 10:08



0202兄还是老样子啊

连自己在说什么都没搞清就急急忙忙下结论
回复 支持 反对

使用道具 举报

55#
发表于 2009-12-3 15:10 | 只看该作者
我觉得L2 cache对于加速shader指令的处理/装载速度会有帮助,但对图形性能不一定有大的帮助,图形性能基本都在像素处理上;处理所有像素之前,shader指令只装载一次就好了,接下来就是等待像素处理。请E大指教。
gz_easy 发表于 2009-12-3 14:03


GPU multi-threading结构的本质是计算和访存的解耦,on-chip cache是非常重要的一个载体
回复 支持 反对

使用道具 举报

56#
发表于 2009-12-3 15:37 | 只看该作者
GPU multi-threading结构的本质是计算和访存的解耦,on-chip cache是非常重要的一个载体
Asuka 发表于 2009-12-3 15:10

解耦关键靠并行计算的程序设计,如果代码里存在高度耦合,再好的构件也没用, 必须为多线程的硬件程序改写代码。
回复 支持 反对

使用道具 举报

57#
发表于 2009-12-3 15:39 | 只看该作者
费米再差也比5870好,NV出道以来唯一失败的核心是NV30!
qf1919 发表于 2009-12-2 20:00

都晚了几个月了,再不比5870好还造个费米干什么?
回复 支持 反对

使用道具 举报

58#
发表于 2009-12-3 15:40 | 只看该作者
解耦关键靠并行计算的程序设计,如果代码里存在高度耦合,再好的构件也没用, 必须为多线程的硬件程序改写 ...
gz_easy 发表于 2009-12-3 15:37



图形渲染天生就是高度并行的
根本不用考虑什么耦合度,Shader指令远远没有x86指令那么复杂,还需要考虑分支预测什么的。
回复 支持 反对

使用道具 举报

59#
发表于 2009-12-3 15:45 | 只看该作者
显存可以通过显存控制器轻松实现,现在来看费米的显存不是通过增加显存颗粒来实现的硬ECC,而是通过牺牲显 ...
zxjike 发表于 2009-12-3 14:24



如果晶体管不能关掉,2D模式比3D满负载低那么多功耗是如何实现的?
ECC无非是运作方式和部分逻辑电路的开关而已,对于数据传输方式处理不同。
每7个数据包增加1个校验数据包,还是不增加校验包,没那么复杂吧?
回复 支持 反对

使用道具 举报

zxjike 该用户已被删除
60#
发表于 2009-12-3 15:55 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-9-7 20:15

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表