POPPUR爱换

标题: 国防科大看来是得了天顶星人的技术援助,作为一个半吊子Afan 我很欣慰 [打印本页]

作者: clarkkent 时间: 2009-10-31 12:12
标题: 国防科大看来是得了天顶星人的技术援助,作为一个半吊子Afan 我很欣慰
新华网长沙１０月２９日电（记者白瑞雪　喻菲　王玉山）题：“天河一号”：自主创新的一次成功实践——新华社记者对话国防科技大学校长张育林
中国首台千万亿次超级计算机在国防科技大学诞生之际，校长张育林接受了新华社记者的独家采访，对“天河一号”及相关情况进行了全面介绍。
今年５１岁的博士生导师张育林，是“天河一号”工程领导小组组长，曾任中国酒泉卫星发射中心主任和神舟六号飞行任务发射场区指挥长。
“我们走了一条世界上全新的路子”
记者：“天河一号”的研制成功，意味着我国的高性能计算机从百万亿次迈入了千万亿次。这个性能在国际上处于什么样的位置？
张育林：参照２００９年６月国际高性能计算机Ｔｏｐ５００组织公布的结果，“天河一号”可以排在世界第４位。当然，到１１月再次排名的话，肯定还会出现别的千万亿次计算机，但“天河一号”应该还是位于世界前列的。
记者：从６月到１１月只有短短５个月，又可能出现新的千万亿次超级计算机？
张育林：高性能计算机的发展速度是非常快的。但是，衡量计算机是否先进的指标不光是速度，还包含能耗、互联通信、稳定性、可靠性等。
记者：与国际上其它千万亿次计算机相比，“天河一号”采用了什么新技术？
张育林：最突出的例子是把Ｃｐｕ和Ｇｐｕ结合的技术。Ｇｐｕ是用来读取图形和视频的，能不能用来计算？有人认为理论上可以，但实际上做出来的东西不行，通常只能发挥出Ｇｐｕ２０％的计算水平。但我们这次把Ｇｐｕ的效率提高到了７０％，连生产Ｇｐｕ的国外厂家都很受鼓舞，要求与我们联合开展研究。我们走了一条世界上全新的技术路子，把理论上成立但实际上走不通的路子走通了。
记者：从“银河一号”到“天河一号”，创新一直是我们技术进步的动力。
张育林：对。自主创新能力提升的关键，在于掌握一批核心技术，这也是我们的核心竞争力。同时，自主创新要求我们保持开放的心态。“银河一号”起步时，我们的自主创新探索是国外封锁的环境下开始的。但，改革开放３０年以来的实践证明，没有开放就没有今天中国的科技发展。自主创新与国家产业升级一样，离不开国家社会经济发展的大背景。
记者：将来投入使用的“天河一号”，就是我们现在看到的这个样子吗？
张育林：现在你看到的是千万亿次超级计算机的基本型。将来，机器可以根据用户需要进行增减，相当于你买汽车，可以选择豪华配置或基本配置。
“超级计算机服务于大系统、大工程、大科学”
记者：超级计算机为什么被称为一个国家的基础设施？
张育林：超级计算机代表了当代信息技术的最高水平，也是一个国家科技实力的重要标志，是服务于大系统、大工程、大科学的一个必不可少的工具。比如我们的“银河一号”，就在石油勘探、气象预报、航天器设计上起到了支撑作用。你想想，设计火箭总不能在笔记本电脑上进行吧？中国动漫水平差，一个原因就是没有与超级计算机结合。
记者：所以，发展超级计算机是基于国家的整体需求。
张育林：国防科技大学能够一直站在科技前沿，一个重要原因就是始终立足国家需求、瞄准国家目标。在当时那个时期，银河系列计算机代表了国家的科技实力和综合国力。这一次，天河计算机同样是作为创新型国家建设的一项重要内容进行开发的，投入使用后要支撑国家信息网格。

记者：就单个产业而言，像您提到的中国动漫产业，有需求，也有平台，为什么没有利用超级计算机呢？
张育林：这和产业发展阶段有关。我国的很多产业还没到达到与最新技术结合的水平。金融危机爆发以来，各地ZF推动产业升级，我想，各行业对高性能计算机的需求会迎来一个高峰。
记者：技术创新的最大驱动力是来自应用吗？
张育林：应用提供需求，但基础学科的发展才是最根本的驱动力。核心关键技术往往属于基础学科，需要长期的技术和人才积累，难以在一朝一夕完成跨越。目前受我国经济发展水平限制，基础学科的投入仍然不够，同时社会上存在浮躁情绪，愿意卖高尔夫球杆但不愿意做球杆上的碳纤维，愿意卖电脑但不愿意做ｃｐｕ。所以，我们在做大系统的同时，要站在科技最前沿加强基础科学。
今年，国防科技大学成立了化学与生物系，要求本科生全部要学生物，同时把生命科学、认知科学、信息科学、纳米科学等进一步交叉。只有在基础学科上突破，才能掌握关键技术，也才能自主创新。目前的基础研究可能看不到具体用处，但未来必有巨大价值。
“技术本身没有军用和民用之分”
记者：我们注意到，“天河一号”的技术攻关仅用了两年，全面工程研制也只有几个月。您认为工程在这么短的时间内取得成功的原因是什么？
张育林：一个重要原因在于，我们走了一条军民结合的发展道路。这个项目是我们与天津滨海新区合作完成的。国家的需求和经济发展支撑，给我们的关键技术提供了转化为现实成果的机遇。可以说，我们的科技创新在民用中找到了更广阔的空间。
实际上不光是计算机领域。国防科大拥有完全掌握自主知识产权的磁悬浮技术，也许中国人很快就会用这项技术到全世界建磁悬浮列车。我们还跟一汽合作开发了汽车自动驾驶系统。实验中，改装的一辆红旗轿车在高速公路上完全融入交通，可以超车可以变道，最高时速达到１７０公里。德国奔驰公司非常关注我们的这项技术。
这些技术不仅能够满足民用需求，更重要的是，在项目实施过程中，会催生一大批关键技术。
记者：军用技术的民用化是否已经成为一种趋势？
张育林：技术本身没有军用和民用之分，我们的科技创新都是以强军兴国为目标的。只有自觉融入国家的创新体系，才能既促进军队信息化建设的水平，又对国家经济建设做出贡献。
记者：大学在技术成果的产业化中应扮演什么角色？
张育林：产业化是需要培育市场的，涉及到的不仅是技术，还有经济、文化上的特性。我不主张学校搞产业化，我们的主要任务还是突破关键技术，主要角色是提供技术支撑

注意红字，不知道AMD能借此一举扭转在CPU市场的劣势....反正larabee和fermi估计是要悲剧了....

作者: yamhill 时间: 2009-10-31 12:13
GPU通常利用率20％？

这个搞笑了……

作者: clarkkent 时间: 2009-10-31 12:15

GPU通常利用率20％？

这个搞笑了……
yamhill 发表于 2009-10-31 12:13

AMD的好像是只有这么多

作者: 无印凉粉 时间: 2009-10-31 12:16

GPU通常利用率20％？

这个搞笑了……
yamhill 发表于 2009-10-31 12:13

不要断章取义，这个20%指的是GPU用来计算时的利用率

作者: yamhill 时间: 2009-10-31 12:17
真20％？我一直觉得，怎么着也得80％吧……

作者: 无印凉粉 时间: 2009-10-31 12:34

真20％？我一直觉得，怎么着也得80％吧……
yamhill 发表于 2009-10-31 12:17

GPU拿来做计算用的效率一直都是很低的

作者: yamhill 时间: 2009-10-31 12:48

GPU拿来做计算用的效率一直都是很低的
无印凉粉发表于 2009-10-31 12:34

不会吧……

我的G92，跑FAH时，风扇转得比显卡危机还猛（听声音）……

作者: yamhill 时间: 2009-10-31 12:49
可惜现在天气转凉，外加511分值包很久没出现，能把显卡风扇转速拽到100％的就只剩Furmark了……

作者: yamhill 时间: 2009-10-31 12:51

好猛！
纳尼？发表于 2009-10-31 12:50

贴张图：

作者: 无印凉粉 时间: 2009-10-31 12:55

不会吧……

我的G92，跑FAH时，风扇转得比显卡危机还猛（听声音）……
yamhill 发表于 2009-10-31 12:48

你真有爱，我不舍得电费……

作者: fevaoctwh 时间: 2009-10-31 12:55
提示: 作者被禁止或删除内容自动屏蔽

作者: lfy913 时间: 2009-10-31 12:57

不会吧……

我的G92，跑FAH时，风扇转得比显卡危机还猛（听声音）……
yamhill 发表于 2009-10-31 12:48

效率低所以要全速运行啊
不是说只有20%在工作而是100个人在干活结果干出20个人的活

作者: yamhill 时间: 2009-10-31 12:59

效率低所以要全速运行啊
不是说只有20%在工作而是100个人在干活结果干出20个人的活
lfy913 发表于 2009-10-31 12:57

哦……原来是这样……受教受教……

看来您从斯坦福那里得到了不少资料

请教一下，为什么编号为59××的包，电流毛刺现象非常严重？

作者: tomsmith123 时间: 2009-10-31 12:59
GPU 有20％的效率就很高了。
GPU 做Linpack，东京的Tesla 170 个S1070 才做到20T，而理论性能是680T，折合效率是1/39 不到3％。

作者: xxx2006 时间: 2009-10-31 13:01
主要是GPU不是设计用于科学计算的，错误太多
你多算几遍，看看是不是效率大减
第一次重算是不是效率降低一半，第二次....

作者: yamhill 时间: 2009-10-31 13:02

GPU 有20％的效率就很高了。
GPU 做Linpack，东京的Tesla 170 个S1070 才做到20T，而理论性能是680T，折合效率是1/39 不到3％。
tomsmith123 发表于 2009-10-31 12:59

不能单纯地用集群效率来衡量单芯片效率

HPC的瓶颈在节点之间的连接，而不是节点内部的效率

作者: jpbird 时间: 2009-10-31 13:04
12# fevaoctwh
你以为游戏作弊啊？优化，呵呵。

作者: yamhill 时间: 2009-10-31 13:04
关于linpack，intel有个人说linpack不适合衡量hpc

本人持观望态度

作者: airforce18 时间: 2009-10-31 13:04
科学计算效率低主要是因为双精度和软件优化某人好像把利用率和效率弄混淆了

作者: tomsmith123 时间: 2009-10-31 13:06
19# yamhill 能说一下是Intel 哪位说Linpack 不适合HPC吗？
目前衡量HPC 的只有Linpack，Linpack 不适合服务器性能或者工作站性能倒是真的。

作者: yamhill 时间: 2009-10-31 13:08

19# yamhill 能说一下是Intel 哪位说Linpack 不适合HPC吗？
目前衡量HPC 的只有Linpack，Linpack 不适合服务器性能或者工作站性能倒是真的。
tomsmith123 发表于 2009-10-31 13:06

http://www.hpctech.com/2009/0831/221.html

只有linpack？linpack又不是神一般的存在

作者: tomsmith123 时间: 2009-10-31 13:08
本帖最后由 tomsmith123 于 2009-10-31 13:31 编辑

17# yamhill
Linpack 是非传输瓶颈的应用，X86 集群在百万亿次的数量级上，效率是70％，而即使按照最宽的标准，IPE 的CUDA 集群做Linpack 效率也不会超过20％。

作者: yamhill 时间: 2009-10-31 13:09

科学计算效率低主要是因为双精度和软件优化某人好像把利用率和效率弄混淆了
airforce18 发表于 2009-10-31 13:04

G92双精度效率很糟糕，G200虽然有点改进，但还是不行

等费米啦

得……关于某概念，我搞错了

作者: 无印凉粉 时间: 2009-10-31 13:10
奇怪的问题，4870跑F@H的时候，自动把GPU频率锁死在了500上，我平时oc到810跑的，怎么回事？

作者: yamhill 时间: 2009-10-31 13:10

17# yamhill
Linpack 是非传输瓶颈的应用，X86 集群在百万亿次的数量级上，效率是70％，而即使按照最宽的标准，CUDA 做Linpack 效率也不会超过20％。
tomsmith123 发表于 2009-10-31 13:08

最宽的标准？

作者: yamhill 时间: 2009-10-31 13:11

奇怪的问题，4870跑F@H的时候，自动把GPU频率锁死在了500上，我平时oc到810跑的，怎么回事？
无印凉粉发表于 2009-10-31 13:10

自动降频保稳定？

作者: tomsmith123 时间: 2009-10-31 13:12
22# yamhill
你要学会阅读文章，用Linpack 选HPC 不合适，是何博士推销调优工具的广告语。
Intel 目前在国内展开了一个大规模并行的研发中心，可以帮助客户优化其大规模并行代码，对于这样的用户，应用本身是更好的评价标准。但是对于更多通用的计算中心，应用还没有规划，只能通过Linpack 来评价一个HPC 系统是否具有足够的能力和潜力。

作者: tomsmith123 时间: 2009-10-31 13:13
26# yamhill
S1070 单精度峰值是4T，双精度性能是0.5T，计算效率用双精度性能，标称理论性能用单精度性能，这就是最宽的标准。

作者: yamhill 时间: 2009-10-31 13:14
本帖最后由 yamhill 于 2009-10-31 13:16 编辑

22# yamhill
你要学会阅读文章，用Linpack 选HPC 不合适，是何博士推销调优工具的广告语。
Intel 目前在国内展开了一个大规模并行的研发中心，可以帮助客户优化其大规模并行代码，对于这样的用户，应用本身是更 ...
tomsmith123 发表于 2009-10-31 13:12

别这么着急扣帽子

不管是广告，还是技术演讲，能说出这句话，肯定有其道理

再说了，我不是表明了观望态度嘛？难道您没看出点什么？

作者: yamhill 时间: 2009-10-31 13:15

26# yamhill
S1070 单精度峰值是4T，双精度性能是0.5T，计算效率用双精度性能，标称理论性能用单精度性能，这就是最宽的标准。
tomsmith123 发表于 2009-10-31 13:13

那确实不怎么利于目前的CUDA

作者: yamhill 时间: 2009-10-31 13:17

G92压根就没DP计算能力，何谈很糟糕
纳尼？发表于 2009-10-31 13:16

那就更糟糕了……

作者: 无印凉粉 时间: 2009-10-31 13:23

自动降频保稳定？
yamhill 发表于 2009-10-31 13:11

不知道，现在删了也卡在500回不去，这下麻烦了

作者: yamhill 时间: 2009-10-31 13:25

不知道，现在删了也卡在500回不去，这下麻烦了
无印凉粉发表于 2009-10-31 13:23

那就召唤A卡达人/真正的A饭……

作者: yamhill 时间: 2009-10-31 13:26

不知道，现在删了也卡在500回不去，这下麻烦了
无印凉粉发表于 2009-10-31 13:23

在F@H Team China群里么？直接呼叫月虫吧……

作者: 无印凉粉 时间: 2009-10-31 13:53
确定实际运行频率可以在815/4000，但是在CCC里只能显示500/4000……
不管了反正别妨碍我打游戏

作者: stcshy_3 时间: 2009-10-31 13:54
提示: 作者被禁止或删除内容自动屏蔽

作者: fevaoctwh 时间: 2009-10-31 13:55
提示: 作者被禁止或删除内容自动屏蔽

作者: yamhill 时间: 2009-10-31 13:56

不懂别乱说话
X86程序直接迁移到GPU上效率不是一般的低
优化后才能体现出GPU的运算能力优势。但也不会是甩CPU几十倍上百倍
fevaoctwh 发表于 2009-10-31 13:55

软件是灵魂

作者: yamhill 时间: 2009-10-31 13:57

确定实际运行频率可以在815/4000，但是在CCC里只能显示500/4000……
不管了反正别妨碍我打游戏
无印凉粉发表于 2009-10-31 13:53

不影响使用就行～

作者: 飞鸟真 时间: 2009-10-31 13:59
关amd什么事？兴许说的是nv支持ecc的费米.

作者: stcshy_3 时间: 2009-10-31 14:04
提示: 作者被禁止或删除内容自动屏蔽

作者: 飞鸟真 时间: 2009-10-31 14:11

你住在火星?
stcshy_3 发表于 2009-10-31 14:04

查了一下还真是amd gpu，那这种计算机有p用，又是忽悠研究经费欺骗国家的丑闻，汉芯第二。

作者: stcshy_3 时间: 2009-10-31 14:23
提示: 作者被禁止或删除内容自动屏蔽

作者: 飞鸟真 时间: 2009-10-31 14:30

后一段意思应该是无人驾驶速度能达到170- -还是在正常高速公路测试的，这测试车要出车祸，算谁的- -
闲着也是闲着发表于 2009-10-31 14:25

听他们吹，借他个胆子也不敢上高速，可能用 Family Computer模拟的，像火箭车那样。

作者: tomsmith123 时间: 2009-10-31 14:43
46# 闲着也是闲着
无人驾驶实验也是可以坐司机的，而且必须坐司机。

作者: 飞鸟真 时间: 2009-10-31 14:45

46# 闲着也是闲着
无人驾驶实验也是可以坐司机的，而且必须坐司机。
tomsmith123 发表于 2009-10-31 14:43

不是坐司机还是坐猩猩的问题，你以为高速公路上汽车能像天上的民航自由切换驾驶系统？

作者: lexsvin 时间: 2009-10-31 14:46
进来学习学习~~~

作者: tomsmith123 时间: 2009-10-31 14:55
49# 飞鸟真
自动驾驶系统，都是手控优先于自控的，国内外做过不少实验了。

作者: 飞鸟真 时间: 2009-10-31 15:14

49# 飞鸟真
自动驾驶系统，都是手控优先于自控的，国内外做过不少实验了。
tomsmith123 发表于 2009-10-31 14:55

国外是去高速公路170公里试验吗？中国高速公路不限速，他们去德国试验的？

在实验场怎么玩都行，高速让他们玩也未必敢。就算手动优先自动，出了故障高速公路上有纠正错误的空间吗？一直自动，突然出了问题人的反应能纠正吗？

作者: tomsmith123 时间: 2009-10-31 15:24
52# 飞鸟真
我在英国的时候，参观过一次，限速120mph，自动驾驶开到120mph，高速其实比城市路况简单。

作者: tomsmith123 时间: 2009-10-31 15:26
52# 飞鸟真
国内高速，不限速的地方，或者没有摄像头的地方，开到180，200kph的情况也非常多，车底盘稳，还是很容易控制的。

作者: 飞鸟真 时间: 2009-10-31 15:40
路况简单，但如果一会车的时候出了毛病呢。到底是不是在高速公路上试验过，请懂行的同学继续讨论。还有谁知道高速许可做那些实验吗？我没掌握任何资料就不继续讨论了。

作者: tomsmith123 时间: 2009-10-31 15:47
55# 飞鸟真
据我了解，美国，德国，日本，英国，都有过高速公路的自动驾驶实验，至于NUDT和一汽有没有上高速，就不知道了。

作者: prime_lp 时间: 2009-10-31 16:14
47# 飞鸟真
这个确实是实车实验，也是在高速上，高速比室内好控制的多了，车内当时也有人，双手放开的，这个是有录像的。
那个时候路上可能车少吧，这个不太清楚。

作者: 红发IXFXI 时间: 2009-10-31 16:18

软件是灵魂
yamhill 发表于 2009-10-31 14:56

我的软件到现在还不支持多核心。。。吐血中

作者: tomsmith123 时间: 2009-10-31 16:20
58# 红发IXFXI

试一下Intel 的Parallel Studio，很简单就并行化了。

作者: Y飞翔 时间: 2009-10-31 16:21
提示: 作者被禁止或删除内容自动屏蔽

作者: tomsmith123 时间: 2009-10-31 17:30
62# 闲着也是闲着
国外限速和国内不同，在英国而言，二级公路限速80mph，也就是130kph了。

作者: kongchao38 时间: 2009-10-31 18:33
天河一号上用的全是4870X2
这个我在CCTV7上看到过一个一闪而过的画面

作者: 八角差开 时间: 2009-10-31 20:50

但我们这次把Ｇｐｕ的效率提高到了７０％，连生产Ｇｐｕ的国外厂家都很受鼓舞，要求与我们联合开展研究。

4+1d架构上70％这个牛x

作者: prime_lp 时间: 2009-10-31 21:03
62# 闲着也是闲着 如果是条还未投入使用的高速呢？路上只有试验车辆，没有别的车。

作者: scqw 时间: 2009-10-31 22:48

查了一下还真是amd gpu，那这种计算机有p用，又是忽悠研究经费欺骗国家的丑闻，汉芯第二。
飞鸟真发表于 2009-10-31 14:11

请问你有什么证据吗，没有的话，这种话还是少说～～，只不过是用了A的GPU，没有必要枪到要把国防科大的东西也一起枪吧

作者: ATI专业卡 时间: 2009-10-31 22:53
用的是HD4870X2 . 品牌不便透露.

反正都是公版的.

具体数量2000 pcs 以上. 前期有做验证的.

忽悠研究经费的说话勿继续下去.

作者: 飞鸟真 时间: 2009-10-31 23:35

请问你有什么证据吗，没有的话，这种话还是少说～～，只不过是用了A的GPU，没有必要枪到要把国防科大的东西也一起枪吧
scqw 发表于 2009-10-31 22:48

没有ecc支持，大型运算不能保证可靠，或者需要多次运算保证结果正确。
nv加入完全ecc支持就是因为可靠性问题，没有ecc高级客户不敢用。

“目前在HPC高性能计算市场中，支持错误校验的ECC内存几乎是必不可少的组件，而GPU通用计算却无法利用这一功能。科研、开发等用户如果想要使用GPU计算，必须将同样计算过程运行两次以保证精确性。而目前GT200的运算性能相比Intel Nehalem CPU优势尚不足一倍，重复一次运算过程就会让GPU通用计算的速度从优势变为劣势。”

我也希望国防大学突然得到天顶星科技，但理智想想，通用计算一穷二白的amd gpu行吗？别人都是【此言论被论坛屏蔽，试图绕过屏蔽将会受到严厉处理】，就国防大学行，可能吗？

作者: 无印凉粉 时间: 2009-10-31 23:41
72# 飞鸟真
在seed-d里飞鸟真就是个废柴，没想到在这也是……另外一个讨论帖子你没看到吗？GDDR5什么时候不支持ECC了？

作者: ATI专业卡 时间: 2009-10-31 23:45
技术不仅仅是 NV宣传的才是, 其他人的就不行.
今天 Fermi 支持ECC ,就拿ECC 出来说事 ,当年的C870 ,C1060 ,S1070 干吗只字不提? 那之前做的难道都是低级客户,当初NV可不是这样宣传的哦。

通用计算一穷二白的amd gpu---> 会吹不如会做. 最好的例子就在此.

作者: 飞鸟真 时间: 2009-10-31 23:46
本帖最后由飞鸟真于 2009-10-31 23:47 编辑

72# 飞鸟真
在seed-d里飞鸟真就是个废柴，没想到在这也是……另外一个讨论帖子你没看到吗？GDDR5什么时候不支持ECC了？
无印凉粉发表于 2009-10-31 23:41

懂什么是ecc吗？和gddr几有关吗？你拿出一块配ecc内存的ati显卡给大家看看再来说笑话。
ecc支持是一高兴就能加的？8颗显存再多焊一颗就ecc了？支持ecc内存要核心支持，就像nv的费米。

作者: tomsmith123 时间: 2009-10-31 23:49
72# 飞鸟真
Tesla S1070 S1060 也没有ECC，而且广泛装备，联想，曙光，浪潮都在推销，说起闲置，目前没有比中科院的Tesla 闲置的厉害，仅IPE 就装备了220台S1070，nVidia 最近要给中科院和清华发奖，其实中科院是得最佳采购奖，清华是得未来采购奖。
就RV770 和GT200硬件相比，缺点是可编程性略差，Brook/CAL 和CUDA 比，要困难一点，不过如果用OPENCL，二者没有太大的差距，价格上，4870*2 我相信比C1070 便宜太多了，AMD 给曙光的价格，不足市价一半，给NUDT 在4870 生命的末期，更不会很贵。
Fermi 是很强，不过暂时还是模型。

作者: 飞鸟真 时间: 2009-10-31 23:54
还记得intel的p4吗？扣肉没出时，枪手们给吹出市场。扣肉一出来，立刻被抛弃成为垃圾的待名字。
其实nv也是，有了费米底气就足了，敢自揭老底了。没有ecc高性能计算就是玩闹，你们见过不ecc的大型机吗？
nv的通用计算以前的确是小玩闹，就像游戏公司，开始做h游戏起家，等实力雄厚就开始做正经游戏了。

抛开ati nv之争，你们真相信国内这几个大学？

作者: tomsmith123 时间: 2009-11-1 00:01
77# 飞鸟真
中科院IPE，不顾863 专家组的意见，采购220套S1070，耗资2000万人民币，中科院又拨款5000万元推广CUDA，项目经费90％用于购买Tesla 或者购买IPE 机时。
Tesla 在国内的销售额就不是小玩闹，这一切都是Fermi 之前的事情。即使nVidia 有了Fermi，他也不敢说之前的Tesla 全是玩的，大家别当真。
ECC 很重要，但不是绝对的，Tesla 目前的IEEE754-1985 的问题更严重一点。

作者: 飞鸟真 时间: 2009-11-1 00:02
大胆假设小心求证，我不说了，有懂行的多暴点内幕吧。

作者: tomsmith123 时间: 2009-11-1 00:05
79# 飞鸟真
作为行内人，我信NUDT 多于联想，曙光，浪潮，计算所。
江南所的情况，我知道的更多一些，不过绝大多数是不可以说的。

作者: stcshy_3 时间: 2009-11-1 01:26
提示: 作者被禁止或删除内容自动屏蔽

作者: iguana 时间: 2009-11-1 10:01
SC论坛的怎么才混个见习

作者: zxjike 时间: 2009-11-1 10:16
提示: 作者被禁止或删除内容自动屏蔽

作者: tomsmith123 时间: 2009-11-1 11:43
84# sihua
复杂城市路况还是不行。
高速比较简单，有车道灯，车密度相对小多了。

作者: gzpony 时间: 2009-11-1 14:31
本帖最后由 gzpony 于 2009-11-1 14:35 编辑

一定要核心支持ECC才能实现高可靠性的大型计算吗？从系统的角度看，不是的。

芯片级没有支持ECC，没有支持容错，但是合理的设计系统的架构，达到系统级的容错，一样可以在某些元件失效的时候整个系统却依然是可靠的。很简单的例子就是硬盘上 Raid的设计就是这样。

刚刚中国的科学大师钱学森逝世了。看到他学术成果的时候，有一段我印象深刻。他运用他的系统控制理论，在60，70年代中国工业还很薄弱，元器件质量还不可靠的时候，依然通过系统的合理设计，得到了高可靠性的系统，被用于导弹，火箭，卫星，原子弹等对可靠性要求非常非常高的地方。当然，代价应该是不低的，就像raid一样，为了可靠性可能要把能装几套系统的元件装到一套上面。

当然，总的来说还是提高元器件的可靠性更好，这样可以少装几套甚至不用装冗余系统。所以费米的ECC功能值得期待；但也并不是它没出来之前，cuda就实现不了高可靠性的大型超级计算机。为了减少N家和A家的口水之争，加一句：AMD同样也可以用这种方式实现高可靠性的大型超级计算机。

作者: 飞鸟真 时间: 2009-11-1 14:44

一定要核心支持ECC才能实现高可靠性的大型计算吗？从系统的角度看，不是的。

芯片级没有支持ECC，没有支持容错，但是合理的设计系统的架构，达到系统级的容错，一样可以在某些元件失效的时候整个系统却依然是可靠 ...
gzpony 发表于 2009-11-1 14:31

不支持ecc，运算结果算两编，不是什么高深难题，nv自揭家底时候说过。

raid的冗余是为了防止某块硬盘故障，不是数据纠错。

我想所有硬盘都是ecc纠错算法，不然这世界还不乱套？有数据纠错是硬盘能用的前提，不需要广告和吹嘘，你舒舒服服享受了技术没注意到而已。

作者: gzpony 时间: 2009-11-1 14:53

不支持ecc，运算结果算两编，不是什么高深难题，nv自揭家底时候说过。

raid的冗余是为了防止某块硬盘故障，不是数据纠错。

我想所有硬盘都是ecc纠错算法，不然这世界还不乱套？有数据纠错是硬盘能用的前提 ...
飞鸟真发表于 2009-11-1 14:44

我是举例说不可靠的器件得到可靠的结果的例子。

算两遍是用简单的语言告诉普通人。实际上不会这么简单。算两遍，两次不一样的话，哪次是对的？能不能用更好的系统结构，让这两次或者更多的计算在同一时间就算完，然后比较结果直接就输出正确的结果，就像raid一样？具体的方法我不知道也不讨论，你也不用拿具体的raid的不同点来说。大家明白原理上相通就可以了。

作者: ff0759 时间: 2009-11-1 14:55
LS就一空想家，你没看说的是系统设计，RAID5的系统设计难道不是某块或者几块硬盘出错了，不影响整个RAID5系统的数据安全？别老往自己那方面想，仔细读读别人的意见。

作者: 飞鸟真 时间: 2009-11-1 14:57

我是举例说不可靠的器件得到可靠的结果的例子。

算两遍是用简单的语言告诉普通人。实际上不会这么简单。算两遍，两次不一样的话，哪次是对的？能不能用更好的系统结构，让这两次或者更多的计算在同一时间就算 ...
gzpony 发表于 2009-11-1 14:53

晕，两次不一样再就算第3次，任何纠错都是发现问题后再纠正。
你是被3块表的寓言带入幻想境界了，现实不是那样的，两次运算的开销就过于巨大了。

作者: gzpony 时间: 2009-11-1 15:05

LS就一空想家，你没看说的是系统设计，RAID5的系统设计难道不是某块或者几块硬盘出错了，不影响整个RAID5系统的数据安全？别老往自己那方面想，仔细读读别人的意见。
ff0759 发表于 2009-11-1 14:55

这位朋友说的很好，Raid5就是一种很好的并行容错系统结构。假如，我只是说假如，具体方式我不清楚。假如GPU的计算系统结构也类似Raid5这样，有一定数量的冗余GPU并行计算，而计算出来后有算法可以把算错的那些GPU检验出来，从而剔除这部分的结果，就像raid5一样，整个输出结果还是正确的。

作者: gzpony 时间: 2009-11-1 15:12

晕，两次不一样再就算第3次，任何纠错都是发现问题后再纠正。
你是被3块表的寓言带入幻想境界了，现实不是那样的，两次运算的开销就过于巨大了。
飞鸟真发表于 2009-11-1 14:57

算第3次？只能想到这点就不用混了，系统设计的技术人员都下岗去吧，让你上就得。算错了就不断的算，算啊算啊，只要反复算啥问题都解决了。你戴一个表，时间不对反复看就好了；我们戴3个表，时间同时靠3个表印证。看起来还是你厉害！

作者: chm128256_1 时间: 2009-11-1 16:58

还记得intel的p4吗？扣肉没出时，枪手们给吹出市场。扣肉一出来，立刻被抛弃成为垃圾的待名字。
其实nv也是，有了费米底气就足了，敢自揭老底了。没有ecc高性能计算就是玩闹，你们见过不ecc的大型机吗？
nv的通用计算以前的确是小玩闹，就像游戏公司，开始做h游戏起家，等实力雄厚就开始做正经游戏了。

抛开ati nv之争，你们真相信国内这几个大学？
飞鸟真发表于 2009-10-31 23:54

N木仓真有趣，这样的话你也就敢在这里说说吧
暴雪，史克威尔艾尼克斯都内牛满面啊，原来我们都是这样起家的啊

作者: 红发IXFXI 时间: 2009-11-1 17:12

58# 红发IXFXI

试一下Intel 的Parallel Studio，很简单就并行化了。
tomsmith123 发表于 2009-10-31 17:20

我的表达有问题。。。我是说我在用的软件。。。。我不会写程序地。。。。。。。

作者: tomsmith123 时间: 2009-11-1 17:25
87# 飞鸟真 硬盘是CRC 错，不是ECC。
ECC 是所有纠错中，时间成本最低，空间成本最高的办法，对于高速数据吞吐，有比较特殊的意义。
针对不同的故障模型，ECC 不一定是最好的，某些时候，在不支持ECC 的系统，不通过双冗计算仍然可以纠错。
Fermi 之前的Tesla 给我们最大的问题不是ECC 的问题，而是IEEE754-1985，这直接导致SP 精度损失大，而部分计算不得不用DP。
Fermi 支持ECC，简化了对RAM IO 的故障检测，但是对于GPU 本身或者ALU 的失效，没有任何意义。
即使Fermi 带ECC，我想它出错的概率，仍然可能高于不带ECC 的普通民用CPU。

作者: arnew 时间: 2009-11-1 19:38
经常看硬件网站和论坛，发现中国网民专家真多，一个比一个牛…………

动不动这个垃圾那个垃圾………………

都是伟大的理论家咧

作者: oldtype 时间: 2009-11-1 19:55
中国动漫水平差，一个原因就是没有与超级计算机结合。

哪天砖家便秘了也能扯上马桶没跟超级计算机结合

作者: slr 时间: 2009-11-5 12:08
本帖最后由 slr 于 2009-11-5 12:24 编辑

天河一号出了我才知道原来ATI GPU也能运行linpack.

这次估计能把4870X2库存清光光...

作者: hd4770 时间: 2009-11-5 13:56

87# 飞鸟真硬盘是CRC 错，不是ECC。
ECC 是所有纠错中，时间成本最低，空间成本最高的办法，对于高速数据吞吐，有比较特殊的意义。
针对不同的故障模型，ECC 不一定是最好的，某些时候，在不支持ECC 的系统，不 ...
tomsmith123 发表于 2009-11-1 17:25

Fermi ECC include, register files, L1, L2, DRAM (video memory).

作者: yamhill 时间: 2009-11-5 14:02
本帖最后由 yamhill 于 2009-11-5 14:04 编辑

不支持ecc，运算结果算两编，不是什么高深难题，nv自揭家底时候说过。

raid的冗余是为了防止某块硬盘故障，不是数据纠错。

我想所有硬盘都是ecc纠错算法，不然这世界还不乱套？有数据纠错是硬盘能用的前提 ...
飞鸟真发表于 2009-11-1 14:44

他那楼的帖子貌似只是在谈容错

作者: yamhill 时间: 2009-11-5 14:04
提一个很欢乐的话题，召唤达人：

既然NV说了“算两遍”，那么谁知道这个“算两遍”是怎么个算法？也就是说，具体执行过程是什么？

顺便也给包括鄙人在内的众小白做科普嘛

作者: clarkkent 时间: 2010-2-26 13:50

SC论坛的怎么才混个见习
iguana 发表于 2009-11-1 10:01

这里大能太多，我只敢围观....

作者: yamhill 时间: 2010-2-26 22:56

通俗的说ECC也是算两遍，只不过两遍的数据是不同的，是真实数据的不同相性的两个副本，能够互相校验纠错

...
AN_Fusion 发表于 2010-2-26 16:33

那……这个“相性”是什么概念？

能否给个通俗点的说法？

THX～

作者: 中华千年老妖 时间: 2010-2-27 10:27
什么时候一般的压缩软件和音视频压缩软件都能用上GPU加速就好了，我的X2就能再撑多几年。

作者: pharaway 时间: 2010-2-27 13:39
作为中国人，我感到非常自豪！！

作者: zblskj 时间: 2010-2-27 14:20
有超级计算机总是好事而其天河的性能也很强了。
怎么还有这么多饭。。无视自己国家的东西。。。

作者: GTX580 时间: 2010-2-27 15:12
只要购买到AMD的东西，这个机构就是火兰货，是废物机构，骗取国家纳税人的钱；只有购买到有ECC纠错功能的NVIDIA的东西，这个机构才是好机构。至于已经购买到没有ECC纠错工的NVIDIA产品的机构呢？啊，不发表意见，这大概可能应该是一个战略方阵正确的机构！
观飞鸟真所感。

作者: 浅色 时间: 2010-2-27 22:33
进来学习。。。。。。。。。。

作者: 鱼儿水中游 时间: 2010-2-27 22:48
amd曾经给过中国帮助啊，所以用a卡了。

欢迎光临 POPPUR爱换 (https://we.poppur.com/)