Rv870原本是一个核心面积和G200b一样大的大家伙，结果被砍了

yamhill · 发表于 2010-2-17 20:43

非商业化的东西，没有动力进行更高效率的编程
slr 发表于 2010-2-17 20:20

不好说，但也能说明问题……

况且FAH目前面对着AMD、NV和CPU三种平台……

对了，STU目前主要通过调整PPD来安抚人心……

yougome · 发表于 2010-2-17 22:10

没让NV吃一惊！

菲利克丝 · 发表于 2010-2-17 22:30

回复 108# 奶牛老仙

这个应该不现实换了一个世代也就1920 太少了吧起码要飚到2400 三核啊嘿嘿

slr · 发表于 2010-2-18 00:28

特斯拉阵列效率低的原因估计在软件上。并联的节点越多，软件的投入成正比的提高。总投入高了写出来的东西更能发挥硬件。天河一号之前我没听说过4870X2可以用来跑linpack，出来后却证明不仅能跑，而且效率可以让人接受。所以说，天国对这方面的投入绝对不会低的

slr · 发表于 2010-2-18 00:50

东京工业大学的特斯拉已经经过优化，最初加了170台Tesla S1070，运算能力只达到77.48TF，77.48 - 67.7= 9 ...
左脚选手发表于 2010-2-18 00:46

这搞搞效率高一倍。。。说明上面的软件太不成熟

bennylim · 发表于 2010-2-18 01:04

不可这样饭N
什么？发表于 2010-2-15 20:33

不可这样饭A

slr · 发表于 2010-2-18 01:09

2008年11月的top500是77.48TF，2009年6月就是87.01TF，2009年11月还是87.01TF，可见优化差不多到头了，Te ...
左脚选手发表于 2010-2-18 00:58

也可能是投资停掉了没人更新了。。。

bennylim · 发表于 2010-2-18 01:09

桌面应用没看出什么需要“如此强大”的GPU来帮忙运算。要我说，先把CUDA编码做好，不支持2-pass的编码方式 ...
slr 发表于 2010-2-15 20:44

这个说得就比较客观了，不像LZ那样逢N必踩逢A必挺的恶心+虚伪AFAN，我严重怀疑LZ没用过N卡！

slr · 发表于 2010-2-18 01:13

这个说得就比较客观了，不像LZ那样逢N必踩逢A必挺的恶心+虚伪AFAN，我严重怀疑LZ没用过N卡！
bennylim 发表于 2010-2-18 01:09

两家卡都在用啊。最近倒出了个新的用途，96GT在MADVR软解时性能不足，换上260+一切OK

bennylim · 发表于 2010-2-18 01:32

两家卡都在用啊。最近倒出了个新的用途，96GT在MADVR软解时性能不足，换上260+一切OK
slr 发表于 2010-2-18 01:13

我也是A卡N卡都用，现在用着260+ ，不过手上还收着块公版4850不舍得卖

slr · 发表于 2010-2-18 01:42

软解+MADVR，不知道是96GT的512显存爆了还是性能不足？总之部分1080P不流畅

slr · 发表于 2010-2-18 01:59

每台Tesla S1070有4个GPU，170套就是680个GPU运算核心，而天河一号有2560块4870X2，总计5120个GPU运算核心 ...
左脚选手发表于 2010-2-18 01:30

各种看不懂

System Name TSUBAME Grid Cluster with CompView TSUBASA
Site GSIC Center, Tokyo Institute of Technology
System Family Sun Fire - Cluster
System Model Fire x4600 Cluster
Computer Sun Fire x4600/x6250, Opteron 2.4/2.6 GHz, Xeon E5440 2.833 GHz, ClearSpeed CSX600, nVidia GT200; Voltaire Infiniband
Vendor NEC/Sun
URL http://www.gsic.titech.ac.jp/
Application area Research
Main Memory 21600 GB
Installation Year 2009

Operating System SuSE Linux Enterprise Server 9
Memory 21600 GB
Interconnect Infiniband
Processor AMD x86_64 Opteron Dual Core 2400 MHz (4.8 GFlops)

CPU各多少不知道，加速阵列不仅有GT200，还有ClearSpeed CSX600，需要详细资料

yamhill · 发表于 2010-2-18 02:03

这样的讨论氛围还是不错的嘛～比喷来喷去强多了～

又看了遍回帖，发现linpack确实不适合异构系统……可什么适合并且能通吃呢？迷茫……

deadmeat · 发表于 2010-2-18 03:22

提示: 作者被禁止或删除内容自动屏蔽

slr · 发表于 2010-2-18 09:26

clearspeed csx600 协处理器
deadmeat 发表于 2010-2-18 03:22

clearspeed csx600的资料好找，问题是用了多少块？要估算性能时候总得把它算上去吧

itany · 发表于 2010-2-18 10:48

刚翻了一下TOP10的资料，发现天河一号的Rpeak/Rmax是最大的……小白我不明白什么意思
yamhill 发表于 2010-2-17 14:07

这除了说明GPGPU是废材，Larrabee才是王道，对于AN之间不能说明什么

yamhill · 发表于 2010-2-18 10:53

这除了说明GPGPU是废材，Larrabee才是王道，对于AN之间不能说明什么
itany 发表于 2010-2-18 10:48

等拉拉比出来了再说……

而且我不会相信业界会去发展一个废柴……

tomsmith123 · 发表于 2010-2-18 10:53

回复 107# slr
41％已经是GPGPU 惊人的高效率了，GPU 的峰值是按照MA 算的，通常很难拼一个MA 一起做，还要考虑程序控制，数据同步，数据传送时间，GPGPU 的理论极限应该在45％以下，能做到峰值的41％，属于调优非常好的效果。
GPGPU 有意义的计算，效率是20％以上。

tomsmith123 · 发表于 2010-2-18 10:54

回复 125# slr
因为GPU 系统，移植的代价，编程环境的变化，目前都只能研究看看，很难投入商业开发。

itany · 发表于 2010-2-18 11:03

回复 slr
41％已经是GPGPU 惊人的高效率了，GPU 的峰值是按照MA 算的，通常很难拼一个MA 一起做，还要考 ...
tomsmith123 发表于 2010-2-18 10:53

连硬件存储一致性都没有，能做到40%已经是“天价”了……

帐号		自动登录	找回密码
密码			注册

deadmeat deadmeat 当前离线积分 35 IP卡狗仔卡头像被屏蔽	114^# 发表于 2010-2-18 03:22 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
deadmeat deadmeat 当前离线积分 35 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

Rv870原本是一个核心面积和G200b一样大的大家伙，结果被砍了

浏览过的版块