POPPUR爱换

标题: 这次中科院搞的是什么GPU? [打印本页]

作者: lemonninja    时间: 2010-4-25 13:38
标题: 这次中科院搞的是什么GPU?
我国首套高效能分布式GPU超级计算系统启用
转载:新华网 作者:吴晶晶 编辑:Zzyq 2010-04-25 11:21:57 2085 人阅读 [投递]

我国首套分布式GPU超级计算系统24日在中国科学院建成并正式启用,这标志着我国运用高性能计算解决实际科研与工程问题的能力达到了国际先进水平,在软硬件协同和能效方面进入了国际领先行列。
据介绍,当今世界高性能计算对科技进步、经济社会发展等的作用与日俱增。但在超级计算机的峰值突飞猛进的同时,其投资大、运行维护成本高、使用效率低等问题也日渐突出。中国科学院在财政部专项资金的支持下,成功建立了基于GPU的双精度峰值超过千万亿次单精度峰值超过三千万亿次的高效能超级计算系统,并与联想和曙光两家公司合作在中科院内不同领域的研究所推广了十套百万亿次系统,从而构建了聚合计算能力近六千万亿次的分布式GPU超级计算系统。该系统满足了广大科技人员对超级计算的实际需求,以低廉的成本和现成的网络设施实现高效的超级计算,形成了一条应用导向、效率优先的富有中国特色的超级计算模式。
目前,中科院过程所和高能物理研究所、国家天文台等十家用户单位已经利用相关系统开展了高能物理模拟与实验数据分析、天体物理与空间科学研究、石油物探数据分析与油藏开采过程模拟、工业和医学影像处理等方面的应用。该系统还正服务于国家重大专项、国家科技支撑计划、国家自然科学重大基金和多家大型企业。
据了解,为了推动我国科研装备自主研制,财政部在“十一五”期间安排专项资金在中科院开展了“国家重大科研装备自主研制试点”工作。此套超级计算系统研制过程中,财政部和中科院一起进行了项目管理体制和机制的有益探索,并取得了明显成效,为在全国范围部署科研装备的自主创新提供了有益的借鉴。

作者: 63723063    时间: 2010-4-25 13:44
fermi。。。。。。
作者: 66666    时间: 2010-4-25 13:46
摘录科学院主页新闻上的一段话:

该系统在研制过程中,财政部和中科院一起进行了项目管理体制和机制的有益探索,充分发挥主管部门的行政组织能力,联合了联想公司、曙光公司和英伟达公司,整合了10多个相关研究所的优势力量,统一组织、统一领导、统筹协调各类创新资源协同攻关,不仅取得了项目的成功,而且积累了宝贵的经验,体现了体制机制创新在科研装备自主创新中的重要性。目前,财政部正会同国家有关部门,系统分析和总结该试点项目取得的成效,推广试点经验,为在全国范围部署科研装备的自主创新提供有益的借鉴。
作者: 脱氧核糖核酸    时间: 2010-4-25 13:47
昨晚的饭都快吐出来了……
作者: zalii    时间: 2010-4-25 13:50
没钱人玩一两个GPU,有钱的玩几千个GPU,钱的问题而已~~
作者: 66666    时间: 2010-4-25 13:52
估计NV这次又骗了不少美刀
作者: Edison    时间: 2010-4-25 13:56
这只是开始 。
作者: hd4770    时间: 2010-4-25 13:57
回复 6# 66666


    hehehe, ooyeahh
作者: hd4770    时间: 2010-4-25 14:16
Kao, 居然不用强大的5970
作者: 笑嘻嘻的坏蛋    时间: 2010-4-25 14:40
NV野心才刚刚开始
作者: AK47player    时间: 2010-4-25 15:02
上次看天河用的4870X2,AMD捐赠过X86技术,继续用他的GPU可能性更多吧
作者: yuan_oeil    时间: 2010-4-25 15:08
我只想知道龙芯在哪里
作者: kaven    时间: 2010-4-25 15:25
中科院和nv一直有合作
作者: blackjack2000    时间: 2010-4-25 15:39
GPU是么时候能够自主呢?
作者: 听觉疲劳    时间: 2010-4-25 15:52
上次看天河用的4870X2,AMD捐赠过X86技术,继续用他的GPU可能性更多吧
AK47player 发表于 2010-4-25 15:02


不用争论了,看中科院自己怎么说吧
http://www.cas.cn/xw/zyxw/ttxw/201004/t20100424_2829187.shtml

[attach]1269444[/attach]
作者: lemonninja    时间: 2010-4-25 16:15
那看来应该是肥米了~~~~
作者: 我酷故我在    时间: 2010-4-25 16:23
不是Fermi吧,好像说是前一代的Tesla
不过唯一肯定的采用的是NVIDIA的解决方案
作者: 63723063    时间: 2010-4-25 16:24
难怪产量这么低,都拿去特供了
作者: xreal    时间: 2010-4-25 16:24

老黄的利润主要来源阿
作者: GTX980    时间: 2010-4-25 16:36
nv的人在我们周围转悠+忽悠还真起作用了呢
作者: 听觉疲劳    时间: 2010-4-25 17:18
nv的人在我们周围转悠+忽悠还真起作用了呢
GTX980 发表于 2010-4-25 16:36


忽悠? 那美国的橡树岭实验室  澳大利亚的国立研究所  东京大学等他们也是能被忽悠的么
作者: Enio    时间: 2010-4-25 17:32
忽悠? 那美国的橡树岭实验室  澳大利亚的国立研究所  东京大学等他们也是能被忽悠的么
听觉疲劳 发表于 2010-4-25 17:18

橡树岭应该正在装备,东京大学看年度预算没有啊
作者: yamhill    时间: 2010-4-25 17:45
这次应该能真正投入应用了
作者: ylgtx    时间: 2010-4-25 18:00
牛B。不过我们所的办公室里还用着赛扬2.66+9550的配置
作者: 千人    时间: 2010-4-25 18:06
。。。强大啊
作者: qween    时间: 2010-4-25 18:17
提示: 作者被禁止或删除 内容自动屏蔽
作者: skywalker_hao    时间: 2010-4-25 18:19

老黄的利润主要来源阿
xreal 发表于 2010-4-25 16:24


特供,搞不好就是tesla卖geforce价
作者: 听觉疲劳    时间: 2010-4-25 18:26
橡树岭应该正在装备,东京大学看年度预算没有啊
Enio 发表于 2010-4-25 17:32

东京大学早就装备了

目前GPU系统在全球高性能计算机TOP500排行榜中最好的成绩是第29位——东京大学的Tsubame超级计算机。 东京工业大学全球科学资讯和计算中心总监Satoshi Matsuoka博士曾公开表示,他打算使用GPU在2010年打造出一台荣登世界最快榜单的计算机。今年还有更多使用GPU打造的超级计算机。美国国家超级运算应用中心(NCSA)以及法国原子能委员会(CEA)是两家著名的超级计算中心,他们将跻身下一届世界五百强榜单。
作者: GTX980    时间: 2010-4-25 18:27
忽悠? 那美国的橡树岭实验室  澳大利亚的国立研究所  东京大学等他们也是能被忽悠的么
听觉疲劳 发表于 2010-4-25 17:18


我有说他们能被忽悠了么?
作者: GTX980    时间: 2010-4-25 18:44
“到位了”,难道是去年五月?
今天美国时间也才四月啊,顶多是五月即将全部到位啊
六道天书 发表于 2010-4-25 18:35


兄弟在这就学着习惯吧。我们国家的基础教育还是有待加强的。
作者: tomsmith123    时间: 2010-4-25 21:00
ORNL 没有批量到货,LLNL 的GPU 机器已经推迟了,据说规模缩小了约50%。
曙光目前有少量C2050,可以作为个人开发平台,价格是13500,下个月可以供货。
作者: tomsmith123    时间: 2010-4-25 21:02
回复 32# 听觉疲劳
这是东京工大,GPU 项目暂时搁置了,预算没有获得批准。
日本现在对GRAPE 和自己的处理器投入比较高。
作者: Edison    时间: 2010-4-25 21:03
linpack 都跑完了。
作者: tomsmith123    时间: 2010-4-25 21:03
回复 32# 听觉疲劳
这是东京工大,GPU 项目暂时搁置了,预算没有获得批准。
日本现在对GRAPE 和自己的处理器投入比较高。

另外,目前GPU 最高的是天河一号,排名第五。
作者: Enio    时间: 2010-4-25 22:51
东京大学早就装备了

目前GPU系统在全球高性能计算机TOP500排行榜中最好的成绩是第29位——东京大学的T ...
听觉疲劳 发表于 2010-4-25 18:26
早就装备了,但是排名一次比一次掉。。。
作者: Sirlion    时间: 2010-4-25 22:59
唉,老外的技术,底层人员的劳力,直接变成领导的成绩……
作者: hakase    时间: 2010-4-25 23:13
中科院的飘过。。。用的是费米
作者: balian    时间: 2010-4-25 23:29
下次有机会去LLNL的时候问问情况
作者: 鱼儿水中游    时间: 2010-4-25 23:35
恩,行,用的nv的GPU变成现实了以后,都开始说用的是老外的技术了。
作者: Enio    时间: 2010-4-25 23:44
回复  听觉疲劳
这是东京工大,GPU 项目暂时搁置了,预算没有获得批准。
日本现在对GRAPE 和自己的处理器 ...
tomsmith123 发表于 2010-4-25 21:03
我很奇怪我说的
橡树岭应该正在装备,东京大学看年度预算没有啊

为什么还要被6神引用并回复“橡树岭的fermi五月全部到位了”,没做完的东西还能知道做完的确切时间?
作者: 西北狼人    时间: 2010-4-26 00:17
我只知道中国的天河用的HD4870.别的还不清楚。
作者: 380    时间: 2010-4-26 09:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: tomsmith123    时间: 2010-4-26 09:31
回复 57# 380
峰值还是高一点,但是实际性能,应该不强于Power 7 高频。
作者: tomsmith123    时间: 2010-4-26 09:33
回复 49# Heidfeld
国内CUDA 集群,目前还没有听说跑过Linpack 的,东京工大跑过,但是效率比较低。
作者: 380    时间: 2010-4-26 10:06
提示: 作者被禁止或删除 内容自动屏蔽
作者: 66666    时间: 2010-4-26 10:08
中科院用的是2050吧,2070有卖了?
作者: 66666    时间: 2010-4-26 10:16
回复  tomsmith123


    比power7便宜? 那怎么这么多人等着买?
380 发表于 2010-4-26 10:06



最便宜的单路power750官方报价25万人民币,Tesla 20系列最贵的官方报价也不超过2万8人民币,价格差的很远很远
作者: tomsmith123    时间: 2010-4-26 10:18
回复 62# 66666
C2050 也不多,中科院基本上还是S1060 和S1070。
作者: Asuka    时间: 2010-4-26 10:23
不要拿GPU去跟CPU比

HPC领域谁是老大很清楚
作者: tomsmith123    时间: 2010-4-26 10:24
回复 63# 66666
不一样,Power750 报价是系统价格,包括AIX,包括冗余电源。
S1070 nVidia 报价是10万人民币左右,考虑到算法适应性,其实GPU 很多时候并不合算。
石油设计院买的S1070 因为精度问题,已经闲置。
作者: 火星人一笑而过    时间: 2010-4-26 10:28
老黄以后就软件加中科院了。。。大家要不要跟?
作者: 380    时间: 2010-4-26 11:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: levelin    时间: 2010-4-26 12:30
power7每核心33GFlops,2070是520-630GFlops

power7功耗控制比2070好...
作者: yamhill    时间: 2010-4-26 14:34
如果有人用C2070跑并行度不高的应用……那我确实没什么可说的……
作者: tomsmith123    时间: 2010-4-26 14:41
回复 70# yamhill
目前据说,还没有人有C2070。
单颗处理器而言,Power7 对C2070 在95%以上的算法上,不会有任何意外。
作者: los_parrot    时间: 2010-4-26 14:46
现在买gpgpu的都是做开发的,想的是以后东西做出来了,再卖给实际有需求的客户.因为gpu有成本优势,某些方面性能又是cpu无法赶上的.

nV现在是培养产业链,虽然最后是谁来吃肉还说不一定.但是如果真搞成了,nV变成软件公司搞不好赚的钱比卖硬件还多.不过消费市场上估计就要悲剧了,可能学ibm卖pc部门一样卖掉转型.
作者: Enio    时间: 2010-4-26 15:46
我是说就一个power7 芯片和一个C2070比拉  系统其它的不算
380 发表于 2010-4-26 11:25

IBM根本就不卖单个POWER7芯片,卖的是整套解决方案
作者: 梦游的猪    时间: 2010-4-26 16:16
现在知道为啥缺货了吧?
遇到大客户了。包生产线,就像苹果。
作者: 380    时间: 2010-4-26 17:50
提示: 作者被禁止或删除 内容自动屏蔽
作者: asdfjkl    时间: 2010-4-26 18:47
最便宜的单路power750官方报价25万人民币,Tesla 20系列最贵的官方报价也不超过2万8人民币,价格差的 ...
66666 发表于 2010-4-26 10:16


价格的差距真的好大,利润空间呀!
作者: cellwing    时间: 2010-4-26 23:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: tomsmith123    时间: 2010-4-26 23:36
回复 77# cellwing
Fermi 还没有成精,Intel 的48Core 也已经商品化了,IBM 也会有类似的产品,甚至AMD 都会有类似的产品。
作者: 紫夜星辰    时间: 2010-4-27 00:25
呵呵,不过还是支持下国货
作者: Edison    时间: 2010-4-27 00:40
SCC 目前还只是学院研究阶段,效率如何还是个问题,基于多任务的处理器到 1x 核的时候就有很大的瓶颈。

可以肯定的说,SCC 没有任何前途,Intel 不会进行大规模的量产。
作者: tomsmith123    时间: 2010-4-27 08:32
回复 80# Edison
SCC 比Larrabee 接近于市场化,性能,特别是效能,出乎意料得好,和Intel 的可重构处理器架构,有比较大的契合点,前途会很光明。
作者: gzpony    时间: 2010-4-27 09:20
回复  Edison
SCC 比Larrabee 接近于市场化,性能,特别是效能,出乎意料得好,和Intel 的可重构处理器架 ...
tomsmith123 发表于 2010-4-27 08:32



    貌似intel很低调,所释放的信息比拉拉比少多了。就在某些讲演场合晒过一下。
intel真的要在近期把它商品化,推出市场吗?
作者: asdfjkl    时间: 2010-4-27 09:23
回复  Edison
SCC 比Larrabee 接近于市场化,性能,特别是效能,出乎意料得好,和Intel 的可重构处理器架 ...
tomsmith123 发表于 2010-4-27 08:32


有在抛概念:可重构处理器架构;这是FPGA吗? 功能是可以编程的; 真的很难明白如何的可重构。
作者: iBruce    时间: 2010-4-27 10:10
龙芯怎么还没上市啊
作者: tomsmith123    时间: 2010-4-27 10:51
回复 86# asdfjkl
可重构,不是FPGA,而是CPU 内部单元的模块单元可重构,比如在一个处理器内部,放8个AVX部件,4条流水线,2个访存部件,4个译码器,通过互联和控制的重构,可以适应不同的应用类型。
作者: tomsmith123    时间: 2010-4-27 10:57
回复 85# gzpony
不是刻意低调,是原型做出来,评价比较意外,进度大大提前了。
作者: 380    时间: 2010-4-27 12:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: tomsmith123    时间: 2010-4-27 13:38
回复 90# 380
看Intel 市场方面的意见了,从设计,良品率,软件支持方面,都已经基本就绪。
作者: 380    时间: 2010-4-27 15:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: fenal    时间: 2010-4-27 15:36
中科院,钱不是问题,问题是有没有货。
作者: tomsmith123    时间: 2010-4-27 15:41
回复 92# 380
买了做什么?游戏用不了聚合性能,普通软件,只能单核跑。
作者: w0017    时间: 2010-4-27 15:44
把摩托的嵌入式芯片又打磨了个新标?
作者: gzpony    时间: 2010-4-27 15:46
回复  380
买了做什么?游戏用不了聚合性能,普通软件,只能单核跑。
tomsmith123 发表于 2010-4-27 15:41



    兼容x86? x86的 二进制 代码 可以直接跑到上面? 或者有很方便的编译器把原来的代码编译到新的平台上?
作者: tomsmith123    时间: 2010-4-27 15:53
回复 96# gzpony
应该不需要兼容X86,作为网络服务,提供高聚合性能和高吞吐量计算,源码可以直接编译运行。
作者: Edison    时间: 2010-4-27 15:57
SCC 实际上是我在 LRB 文中最后提到的 POD 的一个实作,采用了 P54C。
作者: binbin    时间: 2010-4-28 00:04
中科院,钱不是问题,问题是有没有货。
fenal 发表于 2010-4-27 15:36



    fermi核心都优先制作tesla了
作者: 380    时间: 2010-4-28 08:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: tomsmith123    时间: 2010-4-28 10:21
回复 100# 380
几个核和几十个核,有量变更有质变,最重要的问题是,没有平衡的负载,就没有效率了。
作者: tomsmith123    时间: 2010-4-28 10:22
回复 99# binbin
Tesla 现在缺货情况,比桌面显卡厉害几十倍。
作者: 380    时间: 2010-4-28 10:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: tomsmith123    时间: 2010-4-28 10:56
回复 103# 380
我说的负载均衡,是同一任务线程的负载均衡,你4个核心,很容易就跑满了。
作者: 380    时间: 2010-4-28 11:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: gzpony    时间: 2010-4-28 11:08
回复  380
我说的负载均衡,是同一任务线程的负载均衡,你4个核心,很容易就跑满了。
tomsmith123 发表于 2010-4-28 10:56



    现在的编程也在革命性转变中。我试用过微软的机器人平台,这平台据说可以用难度比较低的方法编出高度并行的程序,轻易写出几千个轻量级线程的程序;而微软的平台可以做到自动负载均衡。
还有开始流行的erlang语言,也是轻量级的线程,叫做纤程,也是几千到几十万个都可以调度处理。

这种量级的线程,用在众多核CPU或者GPU上应该很有意义。单是OS支持还不足够,需要编程工具的很好支持,让普通人轻松编出适应新平台的软件才行。
传统的编程方法编多线程比较辛苦。
作者: tomsmith123    时间: 2010-4-28 12:04
回复 106# gzpony
目前我接触最好的编程界面,应该是Intel 的CT,MS 的服务器系统,并行程序编译器这些,还属于少儿选手。
作者: tomsmith123    时间: 2010-4-28 12:05
回复 105# 380
这8个核的性能,加起来,不超过一个i3 530,你觉得够用吗?
作者: 380    时间: 2010-4-28 12:52
提示: 作者被禁止或删除 内容自动屏蔽
作者: leonhong    时间: 2010-4-28 12:52
这个别是翻版打磨龙芯的产品吧
作者: tomsmith123    时间: 2010-4-28 13:44
回复 109# 380

频率不会很高,否则功耗吃不消。
P54C 或者类似的核心,效能也上不去。
作者: jasmine    时间: 2010-4-28 14:28
唉 啥时候国人才有自己的高端技术啊
作者: 380    时间: 2010-4-28 14:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: GF100    时间: 2010-4-28 15:12
之前用過 4870×2;這次不知道是不是 5970
作者: gzpony    时间: 2010-4-28 15:13
回复  tomsmith123


    最好有动态加速 关闭40核 剩下8核高频
380 发表于 2010-4-28 14:41



    众多核cpu的话,速度的扩展主要靠核心的增加而不是靠频率。以前我在CPU区贴过某新晋CPU厂家要出100核cpu的新闻,里面就有介绍
作者: 380    时间: 2010-4-28 16:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: binbin    时间: 2010-4-28 20:21
回复  binbin
Tesla 现在缺货情况,比桌面显卡厉害几十倍。
tomsmith123 发表于 2010-4-28 10:22


tesla原来这么热销啊,缺货情况厉害几十倍,难道有好几百万的预定量
作者: tomsmith123    时间: 2010-4-28 20:25
回复 117# binbin



    主要还是货源少,C2050 现在订货,要等一个月,C2070 到7月后才能供货。其实这次Tesla 利润并不高,特挑的芯片,3G 显存,堆料的做工,卖13000,这和GTX480 470 比,利润率上优势不大。
作者: tomsmith123    时间: 2010-4-28 20:56
回复 119# 纳尼?
NUDT 还真除了Linpack 没有做太多的GPU 工作。




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4