POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: clarkkent
打印 上一主题 下一主题

国防科大看来是得了天顶星人的技术援助,作为一个半吊子Afan 我很欣慰

[复制链接]
81#
发表于 2009-11-1 14:57 | 只看该作者
我是举例说不可靠的器件得到可靠的结果的例子。

算两遍是用简单的语言告诉普通人。实际上不会这么简单。 算两遍,两次不一样的话,哪次是对的?能不能用更好的系统结构,让这两次或者更多的计算在同一时间就算 ...
gzpony 发表于 2009-11-1 14:53


晕,两次不一样再就算第3次,任何纠错都是发现问题后再纠正。
你是被3块表的寓言带入幻想境界了,现实不是那样的,两次运算的开销就过于巨大了。
回复 支持 反对

使用道具 举报

82#
发表于 2009-11-1 15:05 | 只看该作者
LS就一空想家,你没看说的是系统设计,RAID5的系统设计难道不是某块或者几块硬盘出错了,不影响整个RAID5系统的数据安全?别老往自己那方面想,仔细读读别人的意见。
ff0759 发表于 2009-11-1 14:55


这位朋友说的很好,Raid5就是一种很好的并行容错系统结构。假如,我只是说假如,具体方式我不清楚。假如GPU的计算系统结构也类似Raid5这样,有一定数量的冗余GPU并行计算,而计算出来后有算法可以把算错的那些GPU检验出来,从而剔除这部分的结果,就像raid5一样,整个输出结果还是正确的。
回复 支持 反对

使用道具 举报

83#
发表于 2009-11-1 15:12 | 只看该作者
晕,两次不一样再就算第3次,任何纠错都是发现问题后再纠正。
你是被3块表的寓言带入幻想境界了,现实不是那样的,两次运算的开销就过于巨大了。
飞鸟真 发表于 2009-11-1 14:57


算第3次?只能想到这点就不用混了,系统设计的技术人员都下岗去吧,让你上就得。算错了就不断的算,算啊算啊,只要反复算啥问题都解决了。你戴一个表,时间不对反复看就好了;我们戴3个表,时间同时靠3个表印证。 看起来还是你厉害!
回复 支持 反对

使用道具 举报

84#
发表于 2009-11-1 16:58 | 只看该作者
还记得intel的p4吗?扣肉没出时,枪手们给吹出市场。扣肉一出来,立刻被抛弃成为垃圾的待名字。
其实nv也是,有了费米底气就足了,敢自揭老底了。没有ecc高性能计算就是玩闹,你们见过不ecc的大型机吗?
nv的通用计算以前的确是小玩闹,就像游戏公司,开始做h游戏起家,等实力雄厚就开始做正经游戏了。

抛开ati nv之争,你们真相信国内这几个大学?
飞鸟真 发表于 2009-10-31 23:54

N木仓真有趣,这样的话你也就敢在这里说说吧
暴雪,史克威尔艾尼克斯都内牛满面啊,原来我们都是这样起家的啊
回复 支持 反对

使用道具 举报

85#
发表于 2009-11-1 17:12 | 只看该作者
58# 红发IXFXI

试一下Intel 的Parallel Studio,很简单就并行化了。
tomsmith123 发表于 2009-10-31 17:20


我的表达有问题。。。我是说我在用的软件。。。。我不会写程序地。。。。。。。
回复 支持 反对

使用道具 举报

86#
发表于 2009-11-1 17:25 | 只看该作者
87# 飞鸟真 硬盘是CRC 错,不是ECC。
ECC 是所有纠错中,时间成本最低,空间成本最高的办法,对于高速数据吞吐,有比较特殊的意义。
针对不同的故障模型,ECC 不一定是最好的,某些时候,在不支持ECC 的系统,不通过双冗计算仍然可以纠错。
Fermi 之前的Tesla 给我们最大的问题不是ECC 的问题,而是IEEE754-1985,这直接导致SP 精度损失大,而部分计算不得不用DP。
Fermi 支持ECC,简化了对RAM IO 的故障检测,但是对于GPU 本身或者ALU 的失效,没有任何意义。
即使Fermi 带ECC,我想它出错的概率,仍然可能高于不带ECC 的普通民用CPU。
回复 支持 反对

使用道具 举报

87#
发表于 2009-11-1 19:38 | 只看该作者
经常看硬件网站和论坛,发现中国网民专家真多,一个比一个牛…………

动不动这个垃圾那个垃圾………………

都是伟大的理论家咧
回复 支持 反对

使用道具 举报

88#
发表于 2009-11-1 19:55 | 只看该作者
中国动漫水平差,一个原因就是没有与超级计算机结合。

哪天砖家便秘了也能扯上马桶没跟超级计算机结合
回复 支持 反对

使用道具 举报

89#
发表于 2009-11-5 12:08 | 只看该作者
本帖最后由 slr 于 2009-11-5 12:24 编辑

天河一号出了我才知道原来ATI GPU也能运行linpack.

这次估计能把4870X2库存清光光...
回复 支持 反对

使用道具 举报

90#
发表于 2009-11-5 13:56 | 只看该作者
87# 飞鸟真  硬盘是CRC 错,不是ECC。
ECC 是所有纠错中,时间成本最低,空间成本最高的办法,对于高速数据吞吐,有比较特殊的意义。
针对不同的故障模型,ECC 不一定是最好的,某些时候,在不支持ECC 的系统,不 ...
tomsmith123 发表于 2009-11-1 17:25

Fermi ECC include, register files, L1, L2, DRAM (video memory).
回复 支持 反对

使用道具 举报

91#
发表于 2009-11-5 14:02 | 只看该作者
本帖最后由 yamhill 于 2009-11-5 14:04 编辑
不支持ecc,运算结果算两编,不是什么高深难题,nv自揭家底时候说过。

raid的冗余是为了防止某块硬盘故障,不是数据纠错。

我想所有硬盘都是ecc纠错算法,不然这世界还不乱套?有数据纠错是硬盘能用的前提 ...
飞鸟真 发表于 2009-11-1 14:44

他那楼的帖子貌似只是在谈容错
回复 支持 反对

使用道具 举报

92#
发表于 2009-11-5 14:04 | 只看该作者
提一个很欢乐的话题,召唤达人:

既然NV说了“算两遍”,那么谁知道这个“算两遍”是怎么个算法?也就是说,具体执行过程是什么?

顺便也给包括鄙人在内的众小白做科普嘛
回复 支持 反对

使用道具 举报

受到警告 93#
 楼主| 发表于 2010-2-26 13:50 | 只看该作者
SC论坛的怎么才混个见习
iguana 发表于 2009-11-1 10:01

这里大能太多,我只敢围观....
回复 支持 反对

使用道具 举报

94#
发表于 2010-2-26 22:56 | 只看该作者
通俗的说ECC也是算两遍,只不过两遍的数据是不同的,是真实数据的不同相性的两个副本,能够互相校验纠错

...
AN_Fusion 发表于 2010-2-26 16:33

那……这个“相性”是什么概念?

能否给个通俗点的说法?

THX~
回复 支持 反对

使用道具 举报

95#
发表于 2010-2-27 10:27 | 只看该作者
什么时候一般的压缩软件和音视频压缩软件都能用上GPU加速就好了,我的X2就能再撑多几年。
回复 支持 反对

使用道具 举报

96#
发表于 2010-2-27 13:39 | 只看该作者
作为中国人,我感到非常自豪!!
回复 支持 反对

使用道具 举报

97#
发表于 2010-2-27 14:20 | 只看该作者
有超级计算机 总是好事 而其  天河的性能也很强了。
怎么还有这么多 饭 。。无视自己国家的东西。。。
回复 支持 反对

使用道具 举报

98#
发表于 2010-2-27 15:12 | 只看该作者
只要购买到AMD的东西,这个机构就是火兰货,是废物机构,骗取国家纳税人的钱;只有购买到有ECC纠错功能的NVIDIA的东西,这个机构才是好机构。至于已经购买到没有ECC纠错工的NVIDIA产品的机构呢?啊,不发表意见,这大概可能应该是一个战略方阵正确的机构!
观飞鸟真所感。
回复 支持 反对

使用道具 举报

99#
发表于 2010-2-27 22:33 | 只看该作者
进来学习。。。。。。。。。。
回复 支持 反对

使用道具 举报

100#
发表于 2010-2-27 22:48 | 只看该作者
amd曾经给过中国帮助啊,所以用a卡了。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-11-1 21:42

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表